Ваш алгоритм сходства строк гораздо важнее, чем ваша аппаратная спецификация.
Ключевой вопрос для алгоритмов сходства строк: «когда вы ожидаете, что строка будет похожа?»Рассматриваете ли вы подстроки, орфографические ошибки, фонетику, опечатки.
Эта ссылка SO отлично обсуждает алгоритмы.100 000 записей - это действительно очень мало данных (в моем мире), но для простоты реализации, когда у вас есть хороший алгоритм, вы должны попытаться получить как можно больше оперативной памяти.Выполнение этого в Ruby также может оказаться не лучшим выбором с точки зрения производительности.