Как загрузить папку (с текстовыми файлами) с вашего компьютера на Jupyter, чтобы иметь возможность проводить анализы на них вместе? - PullRequest
0 голосов
/ 26 апреля 2019

Я пытаюсь загрузить папку (содержащую около 1000 .txt файлов) на моем ноутбуке Jupyter (Python 3) с рабочего стола моего компьютера WINDOWS; так что я могу продолжить свои анализы, касающиеся НЛП. Я использую SPaCY вместо NLTK, как советовал один из инструкторов курса Udemy.

Я новичок в этой области и пытался читать учебники и онлайн-курсы по изучению удемы, но они не сильно помогли.

Следуя одному из курсов НЛП от Udemy, я попытался загрузить папку «образец текстовой папки» следующим образом (она не работала):

gen = os.walk ('../ образец текстовой папки')

следующий (GEN)

Я ищу вашу помощь со строками кодов, которые позволят моему скрипту python загрузить и продолжить анализ файлов. ** Каждый файл .txt представляет собой автобиографию, поэтому я пытаюсь рассматривать каждый из них как самостоятельный случай, чтобы на более поздних этапах я мог сделать вывод, какие автобиографии похожи (например, кластерный анализ).

1 Ответ

0 голосов
/ 26 апреля 2019

Один из способов прочитать все файлы в папке - использовать listdir(path_to_dir), как в этом примере:

files_name = os.listdir(path_to_dir)

возвращает список файлов в каталоге без полного пути. Итак, чтобы прочитать все, что вы надеваете это:

file= open(files_name[0],'r')
...