Как изменить значение в формате даты и Как изменить значение в формате времени - PullRequest
0 голосов
/ 10 апреля 2019

У меня есть два столбца, один со значениями, которые представляют время, а другой со значениями, которые представляют дату (оба значения в плавающем типе), у меня есть следующие данные в каждом столбце:

df['Time'] 
540.0 
630.0
915.0
1730.0
2245.0 

df['Date']
14202.0
14202.0
14203.0
14203.0

Мне нужносоздать новые столбцы с правильным форматом данных для этих двух столбцов, чтобы иметь возможность анализировать данные с датой и временем в отдельных столбцах.

Для ['Time'] Мне нужно преобразовать формат в:

 540.0  =  5h40 OR TO  5.40 am
2245.0  = 22h45 OR TO 10.45 pm

Для ['Date'] мне нужно преобразовать формат в: Каждое число, которое мы можем сказать, которое представляет «дни»: где 0 («дни») = 01-01-1980

Так что еслиЯ добавляю 01-01-1980 к 14202.0 = 18-11-1938

, и если я добавлю: 01-01-1980 + 14203.0 = 19-11-1938,

этоспособ можно сделать с помощью Excel, но мне нужен способ сделать в Python.

Я пробовал разные типы кода, но ничего не работает, например, один из кодов, который я пробовал, был тот, который приведен ниже:

# creating a variable with the data in column ['Date'] adding the days into the date:

Time1 = pd.to_datetime(df["Date"])

# When I print it is possible to see that 14203 in row n.55384 is added at the end of the date created but including time, and is not what I want:

print(Time1.loc[[55384]])
55384   1970-01-01 00:00:00.000014203
Name: Date, dtype: datetime64[ns]

# printing the same row (55384) to check the value 14203.0, that was added above:

print(df["Date"].loc[[55384]])
55384    14203.0
Name: Date, dtype: float64

Для ['Time'] У меня та же проблема, у меня не может быть времени без свидания, я тоже пыталсяrt ':', но не работает даже при преобразовании типа данных в строку.

Я надеюсь, что кто-то может помочь мне в этом вопросе, и любые сомнения, пожалуйста, дайте мне знать, иногда это нелегко объяснить.

Ответы [ 3 ]

0 голосов
/ 29 апреля 2019

Решение проблем с датой

from datetime import datetime

from datetime import timedelta

startdate_string = "1980/01/01" # определение даты начала в строковом формате

startdate_object = datetime.strptime(startdate_string, "%Y/%m/%d").date() # изменение даты формата строки для объекта date с помощью функции strptime

startdate_object # напечатать startdate_object для проверки даты

создание списка для добавления в фрейм данных нового столбца с форматом даты

import math datenew = []

dates = df['UTS_Date'] # данные из исходного столбца 'UTS_Date'

for values in dates: # с помощью оператора if для принятия нулевых значений и добавления их в новый список

if math.isnan(values):

    `datenew.append('NaN')`

    `continue `

`currentdate1 = startdate_object + timedelta(days= float(values))` # add the reference data (startdate_object) to a delta (which is the value in each row of the column)
`datenew.append(str(currentdate1)) ` # converte data into string format and add in the end of the list, removing any word from the list (such: datetime.date)

print (len(datenew)) # проверить длину нового списка datenew, чтобы убедиться, что все строки данных находятся в новом списке

df.insert(3, 'Date', datenew) # создание нового столбца во фрейме данных для формата даты

0 голосов
/ 29 апреля 2019

решение проблем со временем

timenew = [] # создание нового списка

times = df['Time'] # переменное время равно столбцу df ['Time'] кадра данных

переменная, чтобы найти местоположение времени, которое> = 2400

i = 0

def Normalize_time (val):

`offset = 0`
`if val >= 2400:`
    `offset = 1 ` 
# converting val into integer, to remove decimal places
hours = int(val / 100)
# remove hours and remain just with minutes
minutes = int(val) - hours * 100 
# to convert every rows above 24h
hours = (hours%23) - offset 
# zfill recognizes that it must have two characters (in this case) for hours and minutes 
# and if there aren't enough characters,
# it will add by padding zeros on the left until reaching the number of characters in the argument
return str(hours).zfill(2) + ':' + str(minutes).zfill(2) 

создание оператора for для добавления всех значений в новый список, используя функцию «Normalize_time ()»

for values in times: # использование оператора if для принятия нулевых значений и добавления их в новый список if math.isnan(values):

    `timenew.append('NaN')  `
   ` continue `
# using values into the function 'Normalize_time()'
timestr = Normalize_time(values)
# appending each value in the new list
timenew.append(timestr)

print(len(timenew)) # проверить длину нового списка, чтобы убедиться, что все строки данных находятся в новом списке

df.insert(4, 'ODTime', timenew) # создание нового столбца во фрейме данных

0 голосов
/ 29 апреля 2019

относительно перевода времени:

# change to integer
tt= [int(i) for i in df['Time']]
# convert to time
time_ = pd.to_datetime(tt,format='%H%M').time
# convert from 24 hour, to 12 hour time format
[t.strftime("%I:%M %p") for t in time_]
...