Я использую Pandas, чтобы прочитать файл stock.csv
, состоящий из исторических, ежедневных данных. Затем в качестве даты устанавливается индекс, а ежедневные данные обрабатываются еженедельно, в результате чего файл сохраняется. Дата в файле CSV за день приходит в формате YYYMMDD
.
col_Names = ['Date', 'Open', 'High', 'Low', 'Close', 'Volume']
df = pd.read_csv(path1 + 'CSL.csv', names=col_Names, parse_dates=['Date'])
df.set_index('Date', inplace=True)
df.sort_index(inplace=True)
print(df.index)
... # daily to weekly code...
df.to_csv(path2 + 'CSLW.csv')
Как и ожидалось, df.index
возвращает класс pandas._libs.tslibs.timestamps.Timestamp
Открытие сохраненного еженедельного файла в Блокноте показывает, что формат даты был сохранен в формате DD/MM/YYYY
, хотя у меня есть не запрограммирован любой формат. Возможно ли, что Pandas или python использует значение по умолчанию для моего местоположения (Австралия)?
Затем, когда я открываю еженедельный файл, используя тот же код, что и выше, возвращается dtype df.index
как Object
, хотя дата была проанализирована. Это неудобство, потому что дальнейшие манипуляции требуют данных даты-времени, а не строк.
Я был бы очень признателен за разъяснение.
CSL.csv 5 trading days
19940606,0.80333333333333253,0.80666666666666586,0.7999999999999992,0.80333333333333253,1183200.00000000118,0
19940607,0.804333333333332529,0.80999999999999919,0.7999999999999992,0.80333333333333253,1570890.00000000157,0
19940608,0.80333333333333253,0.80666666666666586,0.7999999999999992,0.80666666666666586,921300.000000000921,0
19940609,0.80333333333333253,0.80666666666666586,0.80333333333333253,0.80666666666666586,1702200.0000000017,0
19940610,0.80333333333333253,0.80666666666666586,0.7999999999999992,0.80333333333333253,928350.000000000928,0
CSLW.csv 2 weeks of trading days
10/06/1994,0.80333333333333253,0.80666666666666586,0.7999999999999992,0.80333333333333253,928350.000000000928,0
14/06/1994,0.803999999999999196,0.80666666666666586,0.80333333333333253,0.80666666666666586,1372302.00000000137,0