В прошлом месяце я написал скрипт на Python для чтения файла JSON с измерениями и полем с именем date
. Эта голландская дата была возвращена Пандой в виде строки, например, «31 октября 2019 12:00», которую я затем разбил бы на целые числа. Он работал хорошо до сегодняшнего утра, когда Pandas неожиданно возвратил объект Timestamp
, который не может быть проанализирован как строка (и имеет другой формат, если я превращу его в один). Теперь я нахожу, что хотя «ноябрь» достаточно близок к «ноябрю», чтобы распознать его как название месяца, «октябрь» отличается от «октябрь» более, чем капиталом, и, следовательно, он не распознается. Мое текущее исправление будет работать до 1 января, поэтому оно требует дополнительной работы.
Я мог бы использовать аргумент convert_dates=False
и вернуться к своему старому сценарию (я узнал об этом после того, как я исправил свой сценарий), но теперь, когда яПонимаете, что это особенность, а не ошибка, я бы лучше использовал ее. Я пытался
locale.setlocale(locale.LC_ALL, 'nl_NL')
до
df = pd.read_json(jsonFile)
, но это, кажется, не беспокоит Панд, хотя это действительно работаетчуть позже в коде, где я создал диктат для преобразования голландских названий месяцев в числа. Есть ли способ указать pandas.read_json()
использовать нужный языковой стандарт для автоматического преобразования Timestamp
?