Нарезка и редактирование даты в .csv - PullRequest
0 голосов
/ 11 сентября 2018

плохо знаком с Python,

Попытка отсортировать набор данных, готовый для сравнения, с использованием панд, однако мне нужно отредактировать некоторые аспекты, прежде чем сравнение станет возможным. Перед каждой моей датой стоит буква «А», которую нужно удалить. В дополнение к этому, формат самой даты - ГГГГДДД, который необходимо изменить на ДД / ММ / ГГГГ, или мой другой набор данных необходимо изменить на ГГГГДДД, в зависимости от того, что проще всего.

Моя попытка удалить «А» заключается в следующем, я понятия не имею, с чего начать в связи с изменением даты, за исключением, возможно, использования библиотеки «дата / время».

import pandas as pd
import datetime

csv = '/home/student/Desktop/Ben_Folder/AirQuality/Test/2002_DDV.csv'

df = pd.read_csv(csv)
test = df(columns='Date'[1:7])

test.to_csv('Test.csv', header=['Date', 'AOD'])

Пример набора данных следующим образом:

       Date  AOT
0  A2002185  0.0
1  A2002185  0.0
2  A2002185  0.0
3  A2002185  0.0
4  A2002185  0.0

1 Ответ

0 голосов
/ 11 сентября 2018

Даты в Пандах хранятся как целые числа . Все, что вы видите else - это просто строковое представление этих целых чисел. Когда вы узнаете об этом, вы по достоинству оцените преимущество преобразования в datetime объектов.

Здесь вы можете использовать pd.to_datetime, что позволяет указать ваш формат:

df['Date'] = pd.to_datetime(df['Date'], format='A%Y%j')

print(df)

        Date  AOT
0 2002-07-04  0.0
1 2002-07-04  0.0
2 2002-07-04  0.0
3 2002-07-04  0.0
4 2002-07-04  0.0

Директивы Python strftime - это полезный ресурс для создания пользовательских форматов строк.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...