Question

Я использую Apache Arrow в C ++ для сохранения коллекции временных рядов в виде файла паркета и использую python для загрузки файла паркета как Pandas Dataframe.Процесс работает для всех типов, кроме Date64Type.Я экономлю время эпохи в C ++, и при загрузке в панды информация о времени теряется.

Например, для ускоренного посикса: 2018-04-01T20:11:17.112Z, время эпохи (в int64_t) равно 1522613477112000, но когда я сохраняю в файл паркета как (Date64Type) и загружаю в панды результат2018-04-01 и информация о времени теряется.Как правильно сохранять временные метки в файлах паркета?

Wes McKinney · Answer 1 · 07 декабря 2018

Вам нужно использовать arrow::TimestampType вместо.Date32Type и Date64Type поддерживают только дневное разрешение;их внутреннее представление немного отличается (int32_t дней со времен UNIX против int64_t миллисекунд со времен UNIX)

Как сохранить метки времени в файлах паркета в C ++ и загрузить их в Python Pandas?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как сохранить метки времени в файлах паркета в C ++ и загрузить их в Python Pandas?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы