Анализатор строк ссылок - PullRequest
       10

Анализатор строк ссылок

1 голос
/ 01 апреля 2019

У меня много строк, как эта.Есть ли в Python библиотека, которая может извлекать имена, журнал, даты, заголовки и т.д.?

Wallace, Kelly. "Bush Stands Pat on Stem Cell Policy." CNN. 13 Aug. 2001.

Я пытался использовать pybtex, но ничего не возвращает для строки, она должна быть вконкретные форматы.

from pybtex.database import parse_file,parse_string
print(parse_string('Wallace, Kelly. "Bush Stands Pat on Stem Cell Policy." CNN. 13 Aug. 2001.','bibtex'))
# it returns nothing
BibliographyData(entries=OrderedCaseInsensitiveDict([]), preamble=[])

1 Ответ

0 голосов
/ 01 апреля 2019

Вы, похоже, ищете решение НЛП. Проверьте NLTK: https://www.nltk.org/

Без какого-либо фиксированного формата НЛП - это путь.

...