Я использую CSV-файл, извлеченный из базы данных шинных записей.Я хочу найти и сохранить из огромного списка все записи, которые соответствуют одному и тому же пользователю, идентифицированному одним и тем же идентификатором устройства.Существует около 300000 идентификаторов устройств, с 3-мя отключениями на устройство.Поэтому я хочу сгенерировать файл, который позволяет получить идентификатор устройства, найти все поездки, предпринятые пользователем, найти цену, дату и т. Д. За весь год.
Я пробовал использовать панд и заказыватьс помощью dict, но поскольку ключи имеют нестандартный формат, он генерирует ошибки.
with open('Salida1.csv',newline='', mode='r') as csv_file:
csv_reader = csv.reader(csv_file, delimiter=',')
#rows1 = list(csv_reader)
#print(len(rows1))
line_count = 0
for row in csv_reader:
if line_count == 0:
print(f'Column names are {", ".join(row)}')
line_count += 1
else:
mydict5ordenado.append(list(row))
line_count += 1
print(f'Processed {line_count} lines.')
print(row)
print(mydict5ordenado[940000][20])
DeviceID находится в строке (20).
Имена столбцов: id, idapp, date_ws, date_time, date_departure, date_arrival, localizador, netPrice, insurancePrice, источник, среда, pay_pal, источник, пункт назначения, numPassengers, direction, busType, устройство, модель, версия, deviceID,tificationID, newBackOffice, devi
из mydict5ordenado
Я должен быть в состоянии найти все записи, которые имеют повторяющиеся идентификаторы устройств и сохранить их в файле или в словаре.Например, mydictordenado[940000]
содержит следующую информацию
['9265551', '5712', '2019-03-31', '2019-03-31 03:16:32', '2019-03-31
18:15:00', '2019-03-31 19:45:00', '1dpyov0', '9.42', '0.00',
'ANDROID_APP', 'PRO', '0', '344', '9084', '1', 'IDA', 'UNKNOWN', 'WAS-LX1A',
'WAS-LX1A', '6.3.0', '60501c9494b01f78', '0', '2', '26', '0', '', '9103000011625750'
Мы хотим найти в файле все поездки, связанные с телефоном с идентификатором - 60501c9494b01f78
.