Я пытаюсь загрузить папку (содержащую около 1000 .txt файлов) на моем ноутбуке Jupyter (Python 3) с рабочего стола моего компьютера WINDOWS; так что я могу продолжить свои анализы, касающиеся НЛП. Я использую SPaCY вместо NLTK, как советовал один из инструкторов курса Udemy.
Я новичок в этой области и пытался читать учебники и онлайн-курсы по изучению удемы, но они не сильно помогли.
Следуя одному из курсов НЛП от Udemy, я попытался загрузить папку «образец текстовой папки» следующим образом (она не работала):
gen = os.walk ('../ образец текстовой папки')
следующий (GEN)
Я ищу вашу помощь со строками кодов, которые позволят моему скрипту python загрузить и продолжить анализ файлов. ** Каждый файл .txt представляет собой автобиографию, поэтому я пытаюсь рассматривать каждый из них как самостоятельный случай, чтобы на более поздних этапах я мог сделать вывод, какие автобиографии похожи (например, кластерный анализ).