Как избежать ложных срабатываний с помощью географии? - PullRequest
0 голосов
/ 16 октября 2018

Я хочу извлечь названия стран из принадлежности авторов.Например, у меня есть следующий текст:

affiliation = "1​Key Laboratory of Marine Drugs, Ministry of Education, School of Medicine and Pharmacy, Ocean University of China, Qingdao 266003, PR China."

Я использовал следующий код:

import geograpy

places = geograpy.get_place_context(text = affiliation)
print(places.countries)

И результат следующий:

['China', 'United States', 'Russian Federation']

Очевидно, что «Соединенные Штаты» и «Российская Федерация» являются ложными срабатываниями.Как я могу устранить их автоматически?

...