Установите языковой стандарт для автоматического преобразования меток времени при чтении файла JSON с помощью Pandas - PullRequest
0 голосов
/ 01 ноября 2019

В прошлом месяце я написал скрипт на Python для чтения файла JSON с измерениями и полем с именем date. Эта голландская дата была возвращена Пандой в виде строки, например, «31 октября 2019 12:00», которую я затем разбил бы на целые числа. Он работал хорошо до сегодняшнего утра, когда Pandas неожиданно возвратил объект Timestamp, который не может быть проанализирован как строка (и имеет другой формат, если я превращу его в один). Теперь я нахожу, что хотя «ноябрь» достаточно близок к «ноябрю», чтобы распознать его как название месяца, «октябрь» отличается от «октябрь» более, чем капиталом, и, следовательно, он не распознается. Мое текущее исправление будет работать до 1 января, поэтому оно требует дополнительной работы.

Я мог бы использовать аргумент convert_dates=False и вернуться к своему старому сценарию (я узнал об этом после того, как я исправил свой сценарий), но теперь, когда яПонимаете, что это особенность, а не ошибка, я бы лучше использовал ее. Я пытался

locale.setlocale(locale.LC_ALL, 'nl_NL')

до

df = pd.read_json(jsonFile)

, но это, кажется, не беспокоит Панд, хотя это действительно работаетчуть позже в коде, где я создал диктат для преобразования голландских названий месяцев в числа. Есть ли способ указать pandas.read_json() использовать нужный языковой стандарт для автоматического преобразования Timestamp?

...