Это зависит от того, какой тип данных вы сравниваете / анализируете.
Основным решением является
file_get_contents
дает вам строки данных файла
strcmp
выполнит «безопасное двоичное сравнение» данных
Вы, вероятно, захотите explode()
своих данных, чтобы как-то разграничить их, и сравнить части данных.
Другой вариант заключается в разделении, циклическом просмотре и создании «коэффициента сравнения», который указывает, в какой степени файлы отклоняются от нормы. Например, файл 1 имеет cc = 3, файл 4 имеет cc = 8. Файл 4 будет более близким.
Последняя проблема, с которой вы столкнетесь, - это ограничение памяти на сервере. Вы можете изменить это в php.ini
.
// EDIT
Только что заметил тег diff
, но я все равно оставлю это на всякий случай, если он как-то поможет.