Найти дубликаты

Сравнивая свойства метаданных документов и файлов, этот инструмент группирует кандидатов в одинаковые документы. PDF-файлы с равным количеством страниц, одинаковыми датой создания и размером файла - очевидные, возможные дубликаты. В других сценариях могут применяться другие свойства файлов и метаданных.
 В этой упрощённой группе, с возможностью её тонкой настройки с учётом CRC (Cyclic Redundancy Check), и просматривая визуализации, можно легко определить, могут ли два документа являются дубликатами.

Скриншот инструмента Найти дубликаты

Инструмент имеет опции для удаления, копирования или перемещения файлов, которые используются для управления найдеными дубликатами.

Операция начинается с запуска инструмента со списком PDF-файлов для сравнения.

После запуска, инструмент использует умолчания, или последний использованный список свойств для сравнения групп документов с одинаковыми свойствами, если будет найдено равенство. Покажет Дубликаты не найдены, если равенства не найдено, но список файлов останется загруженным. Всегда можно изменить список свойств для сравнения и попробовать другие возможности.

Список свойств для сравнения взаимодействует с соответствующими кнопками в верхней панели инструментов. Кнопка на панели инструментов слева собирает последнее использованное сравнение для легкого использования; кнопка (+) знак плюс используется для добавления дополнительных объектов; каждая кнопка элемента имеет опции для изменения свойств или удаления его из сравнения. В этом меню есть пункт имени скрипта, который обеспечивает доступ к скриптам определённых заданных функций. Скрипты функции создаются с помощью встроенного редактора скриптов, запускаемого пунктом управления скриптами. Скрипт функций создаётся по правилам, которые используются в скриптах функций инструмента переименования  и должны вернуть строку, которая будет сравниваться с соответствующими значениями всех других файлов. Это может быть, например, контрольная сумма текста PDF, значение размеров страницы и т.д.

Кнопка Применить выполнит новое сравнение с использованием текущего списка элементов сравнения.

Сравнение CRC выполняется в группе и исключит все файлы, не имеющие в этой группе одинаковое значение CRC. Когда файл исключён по CRC, свойствам или сравнениям, он не удаляется из внутреннего списка файлов и последующая операция сравнения его покажет, если снова произойдёт коллизия.

Операции Удалить и Переместить удаляют повреждённые файлы из внутреннего списка документов и в следующие сравнения они включены не будут.

Кнопка Экспорт в CSV экспортирует показанные дубликаты групп в файл формата CSV, так что результаты можно будет обработать внешними приложениями.