Попытка сгенерировать фиктивный DataFrame, но с ошибкой - PullRequest
0 голосов
/ 13 февраля 2019

Цель:

Я хотел бы создать фиктивный фрейм данных для проверки определенных функций, но у меня возникают проблемы при передаче массива в DataFrame.

Ситуация:

Я хотел бы вставить в качестве моего первого столбца: dates, и последующие столбцы будут либо строками, либо целыми числами.

Мой код:

import pandas as pd
import numpy as np

col_names = ['Date', 'a', 'b', 'Dernier', 'Frequences', 'Total'] # 6 columns
data =[['2019-01-21',456,'dwfv84',23,74,261,4221],
['2019-02-10',123,'qwbe78',3,83,9251],
['2019-01-25',789,'adqw87',19,478,19195],
['2018-01-04',988,'afdi25',40,321,3753],
['2018-03-19',784,'asdf48',331,413,8551],
['2018-04-15',445,'asfv41',304,246,10215],
['2018-04-10',589,'sdqw88',309,80,19569],
['2018-05-20',741,'dsdg46',269,282,3108],
['2018-06-30',852,'cvgo87',228,261,5975],
['2019-01-19',963,'ewgs45',25,357,4405],
['2019-01-12',369,'fbbr54',32,197,1019],
['2019-01-18',258,'fwgs77',26,132,18100],
['2019-02-10',147,'jkyu87',3,32,8678],
['2019-02-05',753,'yukh20',8,132,19871]]

my_data= np.array(data)
datas = pd.DataFrame(data=my_data, columns=col_names)

Сообщение об ошибке:

ValueError: Неверное количество пропущенных элементов 1, размещение подразумевает 6

ValueError: Shapeпереданных значений (1, 14), индексы подразумевают (6, 14)

1 Ответ

0 голосов
/ 13 февраля 2019

Убрал 74 из первого ряда

import pandas as pd
import numpy as np

col_names = ['Date', 'a', 'b', 'Dernier', 'Frequences', 'Total'] # 6 columns
data =[['2019-01-21',456,'dwfv84',23, 261,4221],
['2019-02-10',123,'qwbe78',3,83,9251],
['2019-01-25',789,'adqw87',19,478,19195],
['2018-01-04',988,'afdi25',40,321,3753],
['2018-03-19',784,'asdf48',331,413,8551],
['2018-04-15',445,'asfv41',304,246,10215],
['2018-04-10',589,'sdqw88',309,80,19569],
['2018-05-20',741,'dsdg46',269,282,3108],
['2018-06-30',852,'cvgo87',228,261,5975],
['2019-01-19',963,'ewgs45',25,357,4405],
['2019-01-12',369,'fbbr54',32,197,1019],
['2019-01-18',258,'fwgs77',26,132,18100],
['2019-02-10',147,'jkyu87',3,32,8678],
['2019-02-05',753,'yukh20',8,132,19871]]

my_data= np.array(data)
datas = pd.DataFrame(data=my_data, columns=col_names)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...