Организация CSV. данные файла в Python - PullRequest
0 голосов
/ 30 апреля 2020

Я довольно новичок с Python, но у меня есть проект, связанный с программированием, над которым я хочу работать, поэтому я действительно хотел бы попросить некоторую помощь. Я не нашел много простых решений для организации данных таким образом, чтобы я мог провести некоторый анализ с этим. Во-первых, у меня есть несколько csv-файлов, которые я читаю как объекты DataFrame. В конце концов, мне нужно, чтобы они все были проанализированы вместе (сейчас файлы разделены на список DataFrames, но позже мне, вероятно, понадобятся они как один объект DataFrame). Однако у меня есть проблемы с организацией и разделением данных. Это тысячи строк в одном столбце, часть которого представлена:

                                            CIP;Date;Hour;Cons;REAL/ESTIMATED
EN025140855608477018TC2L;11/03/2020;1;0                                 057;R
EN025140855608477018TC2L;11/03/2020;2;0                                 078;R
EN025140855608477018TC2L;11/03/2020;3;0                                 033;R
EN025140855608477018TC2L;11/03/2020;4;0                                 085;R
EN025140855608477018TC2L;11/03/2020;5;0                                 019;R
                                                                    ...
EN025140855608477018TC2L;11/04/2020;20;0                                786;R
EN025140855608477018TC2L;11/04/2020;21;0                                288;R
EN025140855608477018TC2L;11/04/2020;22;0                                198;R
EN025140855608477018TC2L;11/04/2020;23;0                                728;R
EN025140855608477018TC2L;11/04/2020;24;0                                275;R

Область, где огромное пространство между, число должно быть объединено, например, 0.057, какая информация представляет «Минусы» (на самом деле это самая важная информация). Я должен быть в состоянии разбить данные на 5 столбцов, чтобы приступить к анализу. Однако это должен быть универсальный инструмент для разных csv-файлов без знания включающих символов. Но структура содержимого и заголовок всегда одинаковы.

Я был бы рад, если бы кто-нибудь мог порекомендовать способ работы с такими данными.

1 Ответ

0 голосов
/ 30 апреля 2020

Похоже, вы пытаетесь преобразовать столбец Cons, чтобы пробелы стали точкой.

df = pd.read_csv("file.txt", sep=";")
df['Cons'] = df['Cons'].str.replace("\s+",".")
df['Cons'].head()

Вывод:

0    0.057
1    0.078
2    0.033
3    0.085
4    0.019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...