Поиск дубликатов - Форум ПРОГРАММИСТОВ

Новые сообщения · Правила

Страница 1 из 1 1
Модератор форума: Berestovskiy

Поиск дубликатов

всем привет.

у меня небольшой вопрос - написал программу которая находит дубликаты файлов - файлы которые могут разное имя, но имеют идентичное содержание (байтовую структуру) и по сути есть одинаковые файлы.вес соответственно тоже одинаковый. написал реализацию на основе контрольных сумм - нахожу файлы в нужном каталоге, сравниваю их вес - при совпадении нахожу контрольную сумму по crc32 (пробовал еще md5). программа работает и даёт приемлимые по времени результаты во многих случаях, но когда файл уже не маленький то задумывается 2 гектара около 30 секунд. и это для одного файла - а при дубликатах их минимум пара.
может кто знает какой то другой метод, более быстрый.
сейчас реализую считывание байтовых блоков файлов - но судя по теста это еще медленнее.
пишу на visual studio c# - может кто подскажет встроенные библиотеки и функции для этого.

If you can't make it GOOD make it LOOK GOOD. B.Gates

№1 | Автор: DoVe | 2011-01-22, 18:00 | Репутация: [ + 48 ]

If you can't make it GOOD make it LOOK GOOD. B.Gates

№1 | Автор: DoVe | 2011-01-22, 18:00 | Репутация: [ + 48 ]

Поиск дубликатов

Страница 1 из 1
1

прикладная математика