Я пытаюсь отсортировать файл .csv по нескольким столбцам, я использую панды, это файл .csv:
col1;col2;col3;col4;col5
6943000;11;1.0;2016-01-01 15:30:31;?
6943000;19;1.0;2016-01-01 15:38:07;?
6943000;13;1.0;2016-01-01 15:54:27;?
6942992;10;1.0;2016-01-01 00:52:59;?
6942993;8;1.0;2016-01-01 12:08:36;?
.....
Я должен упорядочить его по col1 и col4, этокод:
import pandas as pd
df = pd.read_csv('input.csv')
df = df.sort_values(by=['col1', 'col4'])
df.to_csv('sorted.csv', index=False)
но я получаю эту ошибку:
Traceback (most recent call last): File "C:\Python\Scripts\provacsv.py", line 3, in <module>
df = df.sort_values(by=['col1', 'col4']) File "C:\Python\lib\site-packages\pandas\core\frame.py", line 4411, in sort_values
stacklevel=stacklevel) File "C:\Python\lib\site-packages\pandas\core\generic.py", line 1379, in
_get_label_or_level_values
raise KeyError(key) KeyError: 'col1'
Так что это не удается для col1
, но я не уверен, что это правильный способ заказать col4 (временные метки)