У меня есть много строк. Все они содержат только символы. Символы и слова не разделяются пробелами друг от друга. Некоторые из персонажей образуют английские слова, а другие - просто баффлегаб. Строки не могут содержать целое предложение.
Мне нужно выяснить, какие из них написаны в правильной английской речи. Я имею в виду, что строка может быть построена путем объединения хорошо написанных английских слов. Я знаю, что могу что-то сделать со списком слов. Но слова не расходятся друг с другом. Поэтому тестирование каждой возможной комбинации слов может занять очень много времени.
Я ищу высокопроизводительный алгоритм или метод, который проверяет, построены ли строки из английских слов или английской речи. Может быть, есть что-то, что дает мне шанс, что строка содержит английскую речь.
Знаете ли вы метод или алгоритм, который мне помогает?
Помогает ли мне что-то вроде Sphinx ?