Вы можете выполнить эту операцию без базы данных.Ключ в том, чтобы уменьшить размер A, так как A намного больше, чем B. Вот как это сделать:
Вычисление 64-битных хешей с использованием приличной хеш-функции для строк в B-файле.Сохраните их в памяти (в хеш-таблице), что вы можете сделать, потому что B мало.Затем построчно хэшируйте все строки в вашем A-файле и посмотрите, соответствует ли каждая из них хеш-функции для вашего B-файла.Любые строки с совпадающими хэшами (по одному из B) должны храниться в файле C.
Когда этот процесс завершится, файл C будет иметь небольшое подмножество A потенциально совпадающих строк (до B).Теперь у вас есть гораздо меньший файл C, с которым вам нужно сравнить строки B.Это сводит проблему к проблеме, когда вы можете фактически загрузить все строки из C в память (как хеш-таблицу) и сравнить каждую строку B, чтобы увидеть, находится ли она в C.