Я довольно новичок с Python, но у меня есть проект, связанный с программированием, над которым я хочу работать, поэтому я действительно хотел бы попросить некоторую помощь. Я не нашел много простых решений для организации данных таким образом, чтобы я мог провести некоторый анализ с этим. Во-первых, у меня есть несколько csv-файлов, которые я читаю как объекты DataFrame. В конце концов, мне нужно, чтобы они все были проанализированы вместе (сейчас файлы разделены на список DataFrames, но позже мне, вероятно, понадобятся они как один объект DataFrame). Однако у меня есть проблемы с организацией и разделением данных. Это тысячи строк в одном столбце, часть которого представлена:
CIP;Date;Hour;Cons;REAL/ESTIMATED
EN025140855608477018TC2L;11/03/2020;1;0 057;R
EN025140855608477018TC2L;11/03/2020;2;0 078;R
EN025140855608477018TC2L;11/03/2020;3;0 033;R
EN025140855608477018TC2L;11/03/2020;4;0 085;R
EN025140855608477018TC2L;11/03/2020;5;0 019;R
...
EN025140855608477018TC2L;11/04/2020;20;0 786;R
EN025140855608477018TC2L;11/04/2020;21;0 288;R
EN025140855608477018TC2L;11/04/2020;22;0 198;R
EN025140855608477018TC2L;11/04/2020;23;0 728;R
EN025140855608477018TC2L;11/04/2020;24;0 275;R
Область, где огромное пространство между, число должно быть объединено, например, 0.057
, какая информация представляет «Минусы» (на самом деле это самая важная информация). Я должен быть в состоянии разбить данные на 5 столбцов, чтобы приступить к анализу. Однако это должен быть универсальный инструмент для разных csv-файлов без знания включающих символов. Но структура содержимого и заголовок всегда одинаковы.
Я был бы рад, если бы кто-нибудь мог порекомендовать способ работы с такими данными.