У меня есть набор слов, которые меня интересуют, чтобы найти дубликаты базы предложений по двум или более словам:
Пример:
Я хочу обнаружить в предложении слова «мальчик» или «мальчики» и «девочка» или «девочки», чтобы у меня были следующие наборы: (мальчик и девочка), (мальчик и девочки), (девушка и мальчики) ) и (мальчики и девочки).
Приговор:
мальчик идет в школу с девочкой , потому что мальчики как девочки так сильно.
Представление предложения:
WORD1 идет в школу с WORD2, потому что WORD3 так же, как WORD4.
Как я могу иметь четыре (4) разных формы предложения, чтобы оно выглядело так:
Выход:
The WORD1 is going to school with a WORD2, because the WORD like the WORD so much.
The WORD1 is going to school with a WORD, because the WORD like the WORD4 so much.
The WORD is going to school with a WORD2, because the WORD3 like the WORD so much.
The WORD is going to school with a WORD, because the WORD3 like the WORD4 so much.
NB.
Количество слов может быть динамическим от 2 или более; в этом примере у меня есть 4 слова.