Вы используете неправильный молоток, чтобы вбить этот винт. Одна строка в столбце базы данных не способ хранения этих данных. Вы не можете легко получить ту часть, которая вас волнует, а именно отдельные слова.
Существует много исследований по проблеме сравнения текста. Если вы серьезно относитесь к этой необходимости, вы можете начать читать о различных методах в этой проблемной области.
Первая подсказка заключается в том, что вы хотите получить доступ / индексировать данные не по полной текстовой строке, а по фрагменту слова или предложения (если вы не заинтересованы в словах, которые пишутся одинаково при сопоставлении, что сложнее).
В качестве примера одного метода, сгенерируйте цепочку из ваших предложений, захватывая перекрывающиеся наборы из трех слов, и сохраните цепочку. Затем вы можете искать записи, которые имеют большое количество общих сегментов цепи. Набор сегментов цепочки для ваших утверждений выше:
row_1 = это о спорте
row_2 =
это об учебе
row_3 = это
об учебе и спорте
- это примерно (3 матча)
- о спорте
- об учебе (2 матча)
- об учебе и
- учеба и спорт