Какой регулярное выражение (или метод) может быть использован для преобразования файла .out в CSV? - PullRequest
0 голосов
/ 28 октября 2019
name: random
date                name      category            one_average       two_average  one_second
----             --------    ------          ---------------- ------------- ----------
2023-09-01T00:00:49A Hello & Bye Ac c        333              124                2
2023-09-01T00:00:49A Hello & Bye Reg c 294433           334560             1921
2023-09-01T00:00:49A Hello & Bye Reg u    89765            567457              652

Это то, что .out выглядит при открытии. Я пытаюсь преобразовать это в .csv. Мне удалось добавить запятые к большинству данных с помощью replace_all (в моей IDE), однако мне не удалось выяснить, как легко добавлять запятые к последним трем числам в каждой строке.

Я предполагаю, что я могу использовать регулярное выражение здесь, и поэтому я придумал '\b\d+\b', который идентифицирует все числа, включая числа в date, такие как 2023 и 09, и делаетна самом деле не учитывается только пробел после числа для замены в запятую.

Правильный формат вывода должен быть csv и выглядеть следующим образом (я не думаю, что интервалы имеют значение)

date,                 name,       category,  one_average,      two_average,  one_second
2023-09-01T00:00:49A, Hello & Bye, Ac c,         333,              124,           2
2023-09-01T00:00:49A, Hello & Bye, Reg c,     294433,           334560,        1921
2023-09-01T00:00:49A, Hello & Bye, Reg u,      89765,           567457,          52

Некоторые вещи делают это проще, поскольку все даты заканчиваются на A, и есть только три типа категорий. Длина среднего числа варьируется.

Я также пытался читать как сырой файл и сохранять как csv в python (без и без numpy) без удачи.

Спасибо!

...