У меня есть текстовый файл словаря, который содержит названия / ключевые слова городов мира, и эти ключевые слова почти 3,00,000
, но у него также есть много не относящихся к делу ключевых слов, например this , is , on ,Over , Old , It , a , From etc .....
YouЯ вижу, что эти ключевые слова не принадлежат ни одному из названий городов, так как я могу удалить все те ключевые слова, которые не относятся к названию города.
Я понятия не имею, что мне делать.
Есть ли решение для решения этой проблемы ?? Некоторые примеры данных здесь
Japon
Bagpat
Jharda
Kilbrin
This
Großköllnbach
Sighetu Silvaniei
Schweich
Colinet
Leskovec
Trizay
Kilen
Le Perreux
Give
Combourg
Migliaro
Stawki
Kingham