Я пишу программу, в которой я хочу извлечь данные из нескольких файлов DOCX и заполнить их в pandas фрейме данных. В настоящее время я достигаю этого в течение l oop примерно так:
cols = ["path","col1", "col2", "col3", "col4"]
def add_to_df(path):
col1_val = extract_col1(path)
col2_val = extract_col2(path)
col3_val = extract_col3(path)
col4_val = extract_col4(path)
temp_df = pd.DataFrame(
[[path, col1_val,col2_val,col3_val,col4_val]],
columns=cols)
return temp_df
df = pd.DataFrame()
for path in paths:
df = df.append(add_to_df(path), ignore_index=True)
Это лучший способ сделать это? Или есть более хороший, более приемлемый способ? (Это просто упрощенный пример того, что я пытаюсь сделать, реальный код выглядит намного более беспорядочным ...)