Сортировка объекта CSV по датам в Python - PullRequest
0 голосов
/ 29 марта 2012

Я пытаюсь прочитать и отсортировать CSV-файл с данными, похожими на

Date    Open    High    Low Close   Volume
27-Mar-12   8.25    8.35    8.17    8.19    9801989
26-Mar-12   8.16    8.25    8.12    8.24    8694416
23-Mar-12   8.05    8.12    7.95    8.09    8149170

Я делаю это с

import csv
data = csv.reader(open('data.csv','r'))

Сортировка данных по дате. Я делаю:

sorteddata = sorted(data,key=operator.itemgetter(1),reverse=False)

Проблема в том, что он сортировал даты, читая их как строки, а не как даты. Таким образом, данные отсортированы так,

['3-Aug-11', '7.06', '7.23', '6.84', '7.16', '31583617']
['3-Feb-12', '7.02', '7.12', '6.98', '7.08', '15318044']
['3-Jan-12', '5.53', '5.59', '5.44', '5.48', '12678923']
['3-Jun-11', '8.09', '8.17', '7.92', '7.97', '21273812']
['3-May-11', '9.00', '9.04', '8.63', '8.80', '17356005']

Кто-нибудь знает, как сортировать по датам?

Ответы [ 2 ]

6 голосов
/ 29 марта 2012

Используйте datetime.strptime, чтобы получить datetime из поля даты:

from datetime import datetime

data = sorted(data, key = lambda row: datetime.strptime(row[0], "%d-%b-%y"))
0 голосов
/ 29 марта 2012

Используйте модуль time для преобразования формата времени и конвертируйте ваши строки времени (3-Aug-11) в числа, которые вы можете отсортировать.

Вот немного пищи для размышлений:

>>> t = time.strptime("3-Aug-11","%d-%b-%y")
>>> t
time.struct_time(tm_year=2011, tm_mon=8, tm_mday=3, tm_hour=0, tm_min=0, tm_sec=0, tm_wday=2, tm_yday=215, tm_isdst=-1)
>>> time.mktime(t)
1312300800.0

Документация для time модуля.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...