Я пытаюсь вписать эти данные:
[['Manufacturer: Hyundai',
'Model: Tucson',
'Mileage: 258000 km',
'Registered: 07/2019'],
['Manufacturer: Mazda',
'Model: 6',
'Year: 2014',
'Registered: 07/2019']]
в панды DataFrame.
Не все метки присутствуют в каждой записи, например, некоторые записи имеют «Пробег», а другие нет, и наоборот.У меня в общей сложности 26 функций, и очень немногие элементы имеют все из них.
Я хотел бы создать панду DataFrame, которая будет содержать объекты в столбцах, и если объект не существует, то контент должен быть 'NaN'.
У меня есть
colnames=['Manufacturer', 'Model', 'Mileage', 'Registered', 'Year'...(all 26 features here)]
df = pd.read_csv("./data/output.csv", sep=",", names=colnames, header=None)
Немногие первые обязательные столбцы дают ожидаемый результат, но когда дело доходит до дополнительных функций, чем пропущенные данные приводят к тому, что объекты появляются после неправильных столбцов.Записи отображаются правильно, только если присутствуют все функции.
Я забыл упомянуть, что некоторые функции, у которых отсутствует значение, также не имеют ":", но присутствуют в списке.Таким образом, в этих 2 случаях:
- «Пробег», (значение отсутствует, но также отсутствует «:»)
- отсутствует «Пробег» из записи альтогетера
назначение для обоих случаев должно быть 'NaN'.