name: random
date name category one_average two_average one_second
---- -------- ------ ---------------- ------------- ----------
2023-09-01T00:00:49A Hello & Bye Ac c 333 124 2
2023-09-01T00:00:49A Hello & Bye Reg c 294433 334560 1921
2023-09-01T00:00:49A Hello & Bye Reg u 89765 567457 652
Это то, что .out
выглядит при открытии. Я пытаюсь преобразовать это в .csv
. Мне удалось добавить запятые к большинству данных с помощью replace_all (в моей IDE), однако мне не удалось выяснить, как легко добавлять запятые к последним трем числам в каждой строке.
Я предполагаю, что я могу использовать регулярное выражение здесь, и поэтому я придумал '\b\d+\b'
, который идентифицирует все числа, включая числа в date
, такие как 2023
и 09
, и делаетна самом деле не учитывается только пробел после числа для замены в запятую.
Правильный формат вывода должен быть csv и выглядеть следующим образом (я не думаю, что интервалы имеют значение)
date, name, category, one_average, two_average, one_second
2023-09-01T00:00:49A, Hello & Bye, Ac c, 333, 124, 2
2023-09-01T00:00:49A, Hello & Bye, Reg c, 294433, 334560, 1921
2023-09-01T00:00:49A, Hello & Bye, Reg u, 89765, 567457, 52
Некоторые вещи делают это проще, поскольку все даты заканчиваются на A
, и есть только три типа категорий. Длина среднего числа варьируется.
Я также пытался читать как сырой файл и сохранять как csv в python (без и без numpy) без удачи.
Спасибо!