У меня есть четыре файла ".AVRO", которые были извлечены с платформы разработчиков Dow Jones (https://developer.dowjones.com). Эти avro файлы содержат около 700 000 новостных статей, основанных на пшенице и кукурузе.
Моя следующая цель - создать модель topi c на этих файлах. Однако я не могу прочитать данные через python 3, чтобы выполнить дальнейшие шаги.
Я видел несколько статей, в которых для чтения данных используется SPARK. Однако мне было интересно, если есть способ, которым мы можем сделать это через python 3.
С уважением,