Я пытаюсь создать уникальные случайные фразы из текста для обнаружения плагиата.Идея заключается в том, что автор отправит статью, а затем php создаст фразы из текста, которые будут использоваться для обнаружения плагиата
Рассмотрим следующее предложение:
Это очень длинная и скучная статьяи эта статья является плагиатом.
Основываясь на приведенном выше тексте, система определит, сколько фраз будет сгенерировано, т.е. в статье длиной 20 слов будет 3 фразы.Максимальная сгенерированная фраза может содержать не менее двух слов и не более 3 слов.Возвращенный результат будет таким:
- очень длинный
- статья плагиат
Я написал следующий код
$words = str_word_count($text, 1);
$total_phrases_required = count($words) /2;
//build phrases
IНужен подсказка, как завершить оставшуюся часть.