Извлечение курсивного текста из документа - PullRequest
0 голосов
/ 04 октября 2018

У меня есть текстовый документ со списком названий видов, а затем различные тексты о каждом видеЯ хотел бы просто извлечь все названия видов.Очевидный способ сделать это - просто выделить весь текст курсивом.Тем не менее, я не могу найти способ сделать это в Python, у кого-нибудь есть идеи?

Например, ввод: Acanthognathus rudis Маленькая добыча Одинокая - 1?1?Вербовка: одиночная, часто вылавливаемая коллегмола и другая мелкая добыча (GRONENBERG & al. 1998).Размер: маленький, может быть получен одним Acromyrmex coronatus

Выход: Acanthognathus rudis, Acromyrmex coronatus

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...