Новые сообщения · Правила  
  • Страница 1 из 1
  • 1
Модератор форума: Berestovskiy  
Поиск дубликатов
всем привет.

у меня небольшой вопрос - написал программу которая находит дубликаты файлов - файлы которые могут разное имя, но имеют идентичное содержание (байтовую структуру) и по сути есть одинаковые файлы.вес соответственно тоже одинаковый. написал реализацию на основе контрольных сумм - нахожу файлы в нужном каталоге, сравниваю их вес - при совпадении нахожу контрольную сумму по crc32 (пробовал еще md5). программа работает и даёт приемлимые по времени результаты во многих случаях, но когда файл уже не маленький то задумывается 2 гектара около 30 секунд. и это для одного файла - а при дубликатах их минимум пара.
может кто знает какой то другой метод, более быстрый.
сейчас реализую считывание байтовых блоков файлов - но судя по теста это еще медленнее.
пишу на visual studio c# - может кто подскажет встроенные библиотеки и функции для этого.


If you can't make it GOOD make it LOOK GOOD. B.Gates
1 | Автор: DoVe | 2011-01-22, 18:00   |  Репутация: [ + 48 ]


If you can't make it GOOD make it LOOK GOOD. B.Gates
1 | Автор: DoVe | 2011-01-22, 18:00   |  Репутация: [ + 48 ]
  • Страница 1 из 1
  • 1
Поиск: