Как распечатать все слова в папке? - PullRequest
0 голосов
/ 23 мая 2018

Я новичок в Python и мне нужна помощь, пожалуйста.У меня есть список TXT-файлов (около 600 файлов) в папке и хочу напечатать список всех слов Ниже приведен мой код, но он не работает.

import string
import re
import nltk
import pandas as pd
import os
from sklearn.cluster import KMeans
from sklearn import cluster, datasets
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.feature_extraction.text import CountVectorizer
from wordcloud import WordCloud 
from wordcloud import WordCloud, STOPWORDS
import numpy as np
import matplotlib.pyplot as plt
from nltk.corpus import wordnet
from collections import defaultdict

FILE_PATH = "C:\Users\hp\Desktop\me"

def load_words():
#Returns a list 
print("Loading word list from file...")
for filename in os.listdir(FILE_PATH):
wordlist = []

print("  ", len(wordlist), "words loaded.")



output: ('  ', 0, 'words loaded.')

Ответы [ 2 ]

0 голосов
/ 06 июня 2018

Это интересный вопрос!Я просто попробовал несколько вещей и заставил это работать.

import glob   
path = 'C:/Users/Excel/Desktop/test/*.txt'   
files=glob.glob(path)   
for file in files:     
    f=open(file, 'r')  
    print('%s' % f.readlines())   
    f.close()
0 голосов
/ 23 мая 2018

Используйте pandas или csv для чтения и распечатки файлов.

import glob
import pandas as pd

file_dir = 'D:/test/'
file_mask = "*.txt"

all_files = glob.glob(file_dir + file_mask)
file_list =[]

for files in all_files:
    df=pd.read_csv(files,index_col = None,)
    file_list.append(df)
df = pd.concat(file_list)

print(df)

Столбцы: [здесь еще несколько слов, есть несколько слов] Индекс: []

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...