Итак, я пишу свою диссертацию и столкнулся с несколькими проблемами при использовании NLTK для анализа текста на итальянском языке.Я получил около 400 газетных статей о банковском кризисе в Италии, начиная с 2008 года, и после очистки текста я хотел бы создать временную таблицу с двумя записями, показывающую (надеюсь), как газеты изменили способ представления кризиса (таблицы частот снаиболее часто используемые значащие слова)
Мои основные вопросы:
как вести учет времени?У меня есть большой текстовый файл со всем внутри, но, как это, я не знаю, как «назначить» набор статей на определенный период, а затем работать со значениями.
есть кто-нибудь, кто имеетопыт работы с итальянскими словами?