Есть ли более эффективный способ хранения Pandas DataFrames в CSV? - PullRequest
0 голосов
/ 25 марта 2019

Я написал небольшой скрипт на Python, который выполняет операции с CSV-файлом и сохраняет только что измененный.Мне интересно, есть ли какие-либо функции или модули, которые я мог бы использовать, чтобы сделать его более эффективным.Вот сценарий:

import pandas as pd
import os


print("Current directory is:\n" + os.getcwd() + '\n')
csv = input("Please enter csv file name: ")
csv_list = csv.split('/')

df = pd.read_csv(csv)
df.drop(df[df['is_reply_to'] == 1].index, inplace=True)
df.to_csv('./' + csv_list[-2] + '/' + 'new_' + csv_list[-1])

Пример ввода: ./upper_directory/testing.csv

Пример вывода: new_testing.csv


Метод, который яЯ использую это очень специфично в том смысле, что я предполагаю, что целевой файл CSV находится в каталоге внутри текущего каталога.Мне было интересно, есть ли способ сделать это более общим в том смысле, что мне не нужно делать такие вещи, как csv_list[-2] + '/' + ....

Спасибо!

1 Ответ

2 голосов
/ 25 марта 2019

Вы можете создать лучше выглядящие пути, как это:

import os
# Directory path of input, then actual file name of path.
out_path = os.path.join(os.path.dirname(csv), 'new_{}'.format(os.path.basename(csv)))
df.to_csv(out_path)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...