Текстовое мини с Python: NLTK итальянский язык - PullRequest
0 голосов
/ 23 февраля 2019

Итак, я пишу свою диссертацию и столкнулся с несколькими проблемами при использовании NLTK для анализа текста на итальянском языке.Я получил около 400 газетных статей о банковском кризисе в Италии, начиная с 2008 года, и после очистки текста я хотел бы создать временную таблицу с двумя записями, показывающую (надеюсь), как газеты изменили способ представления кризиса (таблицы частот снаиболее часто используемые значащие слова)

Мои основные вопросы:

как вести учет времени?У меня есть большой текстовый файл со всем внутри, но, как это, я не знаю, как «назначить» набор статей на определенный период, а затем работать со значениями.

есть кто-нибудь, кто имеетопыт работы с итальянскими словами?

...