как извлечь столбец в цикле for из фрейма данных из глобуса с несколькими списками, созданного glob - PullRequest
0 голосов
/ 10 ноября 2018

Я новичок в Python и только начал с машинного обучения. Не могу понять, как извлечь столбец из df_test.

Я хотел бы извлечь столбец 280 (это цель y для линейной регрессии, y_test)

Я использовал glob, чтобы объединить несколько файлов cvs, которые являются тестовым набором для регрессии. Я должен извлечь x_test, который является столбцы 0-279 и все строки. и y_test столбец 280

from glob import glob
filenames= glob('webStats_test*.csv')
df_test= [pd.read_csv(f)for f in filenames]
new_df = pd.DataFrame()

очень надеюсь, что вы сможете помочь, уже потратив наш взгляд и попытки, но безрезультатно.

С уважением, Irmgard

1 Ответ

0 голосов
/ 10 ноября 2018

Вы можете использовать панд .iloc для этого.

x_test = new_df.iloc[:, :280]
y_test = new_df.iloc[:, 280]

Но в вашем коде вам все равно сначала нужно заполнить new_df фактическими данными ... Я бы добавил все ваши разные файлы в список DataFrames, а затем использовал concat, чтобы объединить список DataFrames в 1 DataFrame.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...