Как использовать аргумент командной строки в Python Dataframe? - PullRequest
0 голосов
/ 13 июня 2019

Я работаю с CSV-файлом и в своем коде, для каждого CSV-файла, который я хочу обработать, я должен изменить имя входного файла вручную, и каждый раз это занимает несколько раз.

Мой код выглядит следующим образом:

import pandas as pd
file = pd.read_csv('data_0.csv', error_bad_lines=False);

Я хочу использовать аргумент командной строки, чтобы упростить процесс и ввести любой CSV-файл, который я хочу использовать в качестве входных данных.

например:

python code.py data_0.csv 

сохранить по имени желания. например:

python code.py data_0.csv output_0.csv

Сейчас я уже прочитал много сообщений, таких как 1 , 2 , 3 , но я не уверен, какой из них быстрее и проще. В документации Python есть много опций, таких как sys.arg или argparse, но я не смог этого сделать.

Спасибо

1 Ответ

1 голос
/ 13 июня 2019

sys.argv будет работать для этой проблемы: https://www.pythonforbeginners.com/system/python-sys-argv

import pandas as pd
import gensim
import numpy as np
import string
from sys import argv

# read CSV input file
file = pd.read_csv(sys.argv[1], error_bad_lines=False);

"" "" Здесь мой код выполняет некоторые действия!"" ""

# Save the output into CSV
df.to_csv(sys.argv[2], index=True, mode = 'a')

(где sys.argv [0] здесь - code.py)

...