Я хочу извлечь названия стран из принадлежности авторов.Например, у меня есть следующий текст:
affiliation = "1Key Laboratory of Marine Drugs, Ministry of Education, School of Medicine and Pharmacy, Ocean University of China, Qingdao 266003, PR China."
Я использовал следующий код:
import geograpy
places = geograpy.get_place_context(text = affiliation)
print(places.countries)
И результат следующий:
['China', 'United States', 'Russian Federation']
Очевидно, что «Соединенные Штаты» и «Российская Федерация» являются ложными срабатываниями.Как я могу устранить их автоматически?