Как сбросить значение Dataframe после каждой итерации - PullRequest
1 голос
/ 19 сентября 2019

Я пытаюсь прочитать файлы .csv в цикле, на каждой итерации я хочу прочитать файл, сопоставить значения из одного столбца, а затем на следующей итерации то же самое касается другого файла.Проблема в том, что я не могу сбросить или удалить значения в dataFrame, поэтому он сохраняет данные из первого файла для каждой итерации.

Вот код:

    for file in tweet_files:
        tweets = pandas.read_csv('../dataFiles/output_files/'+file , usecols=['date','tweet'])            
        for tweet in tweets['tweet']:
            concat(final_tweets,tweet)

как назначить новый объект dataframe объекту твитов в каждой итерации.

1 Ответ

0 голосов
/ 19 сентября 2019

Если я вас четко понимаю, это то, что вам нужно,

df = {}
for file in os.listdir('../dataFiles/output_files/'):
    tweets = pandas.read_csv('../dataFiles/output_files/'+file , usecols=['date','tweet'])            
    df[file] = tweets['tweet'].values
df = pd.DataFrame.from_dict(df, orient='index').T

Поскольку вы не предоставили данные для примера, я не смог опубликовать пример для вывода.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...