Есть ли способ работать с тем же файлом py, где я уже создал файл concat? - PullRequest
0 голосов
/ 19 июня 2020

Я новичок в pandas, поэтому, пожалуйста, помогите мне с этим вопросом. Я создал файл конкатенации из 5 файлов csv следующим образом:

import os
import glob
import pandas as pd
import csv

os.chdir(r"C:\Users\csv files")

extension = 'csv'
all_filenames = [i for i in glob.glob('*.{}'.format(extension))]

combined_csv = pd.concat([pd.read_csv(f) for f in all_filenames])

combined_csv.to_csv("combined_csv.csv", index=False, encoding='utf-8-sig')

Теперь я хочу работать с этим файлом, но когда я набираю какую-либо команду, например print(combined_csv.isnull().sum()), программа запускается с самого начала, а мой уже созданный комбинированный файл csv добавляется дважды (мой комбинированный файл состоит из 8040 r aws, после этого он становится 16080 r aws), а затем дает результат требуемой команды combined_csv.isnull().sum().

Я понимаю, что это нормально, потому что я запускаю программу дважды, но есть ли способ решить эту проблему, не используя файл в качестве аргумента командной строки, может быть, что-то написать в коде? Спасибо за помощь.

1 Ответ

0 голосов
/ 19 июня 2020

Если вы хотите работать с данными более интерактивно (без перезапуска сценария python снова и снова), вы можете использовать ipython (https://ipython.readthedocs.io/en/stable/interactive/tutorial.html) или еще более удобное приложение для браузера jupyter lab (https://jupyterlab.readthedocs.io/en/stable/).

...