Создать имя Dataframe из 2 строк или переменных панд - PullRequest
0 голосов
/ 13 октября 2019

Я извлекаю выбранные страницы из файла PDF. и хотите назначить имя фрейма данных на основе извлеченных страниц:

file = "abc"
selected_pages = ['10','11'] #can be any combination eg ['6','14','20]
for i in selected_pages():
    df{str(i)} = read_pdf(path + file + ".pdf",encoding = 'ISO-8859-1', stream = True,area = [100,10,740,950],pages= (i), index = False)
    print (df{str(i)} )

Идея, как и в предыдущем примере, состоит в том, чтобы иметь фреймы данных: df10, df11. Я пробовал "df" + str (i), "df" & str (i) & df {str (i)}. однако все выдают ошибку msg: SyntaxError: неверный синтаксис. Или лучше использовать этот способ. спасибо

Ответы [ 2 ]

0 голосов
/ 14 октября 2019
i = int(i) - 1 # this will bring it to 10
dfB = df[str(i)]
#select row number  to drop: 0:4
dfB.drop(dfB.index[0:4],axis =0, inplace = True)
dfB.columns = ['col1','col2','col3','col4','col5']
0 голосов
/ 13 октября 2019

Здесь лучше использовать словарь.

Также обратите внимание на ошибку, возникшую в начале цикла. selected_pages это список, поэтому вы не можете сделать selected_pages().

file = "abc"
selected_pages = ['10','11'] #can be any combination eg ['6','14','20]

df = {}
for i in selected_pages:
    df[i] = read_pdf(path + file + ".pdf",encoding = 'ISO-8859-1', stream = True, area = [100,10,740,950], pages= (i), index = False)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...