Чтение файла .AVRO в python 3 - PullRequest
0 голосов
/ 22 марта 2020

У меня есть четыре файла ".AVRO", которые были извлечены с платформы разработчиков Dow Jones (https://developer.dowjones.com). Эти avro файлы содержат около 700 000 новостных статей, основанных на пшенице и кукурузе.

Моя следующая цель - создать модель topi c на этих файлах. Однако я не могу прочитать данные через python 3, чтобы выполнить дальнейшие шаги.

Я видел несколько статей, в которых для чтения данных используется SPARK. Однако мне было интересно, если есть способ, которым мы можем сделать это через python 3.

С уважением,

...