Удалить ключевые слова, которые не принадлежат названию города Текстовый файл словаря - PullRequest
0 голосов
/ 28 февраля 2019

У меня есть текстовый файл словаря, который содержит названия / ключевые слова городов мира, и эти ключевые слова почти 3,00,000, но у него также есть много не относящихся к делу ключевых слов, например this , is , on ,Over , Old , It , a , From etc .....

YouЯ вижу, что эти ключевые слова не принадлежат ни одному из названий городов, так как я могу удалить все те ключевые слова, которые не относятся к названию города.

Я понятия не имею, что мне делать.

Есть ли решение для решения этой проблемы ?? Некоторые примеры данных здесь

Japon
Bagpat
Jharda
Kilbrin
This
Großköllnbach
Sighetu Silvaniei
Schweich
Colinet
Leskovec
Trizay
Kilen
Le Perreux
Give
Combourg
Migliaro
Stawki
Kingham

1 Ответ

0 голосов
/ 28 февраля 2019

Вы должны подготовить несоответствующий набор слов, чтобы обнаружить их, затем вы можете удалить эти несоответствующие слова.

Если вы не знаете, какие слова не являются названиями городов в вашем файле, вам следует попытаться проанализировать их.и найдите сходство между этими неуместными словами.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...