Вопросы с тегом pyarrow - PullRequest

Вопросы с тегом pyarrow

0 голосов
1 ответ

Pandas dataframe имеет большой вес, поэтому я хочу этого избежать.Но я хочу построить Pyarrow Table...

Zichu Lee / 18 июня 2019
0 голосов
0 ответов

Я пытаюсь прочитать каталог секционированного паркета, хранящийся в корзине s3. Ради этого вопроса...

Deepansh Khurana / 13 июня 2019
0 голосов
0 ответов

Я читаю необработанные данные из файла данных в блоках данных, и когда я выполняю .show () или

Greenfox / 10 июня 2019
0 голосов
1 ответ

У меня есть набор данных для паркета, хранящийся на s3, и я хотел бы запросить определенные строки...

kluu / 10 июня 2019
1 голос
0 ответов

Я попытался преобразовать исходные файлы паркета в csv, а выходной файл csv снова в паркет. При...

Rahul / 07 июня 2019
1 голос
1 ответ

Я знаю, что есть pyarrow.parquet для чтения файлов паркета в виде таблицы стрелок, но я ищу...

djohon / 05 июня 2019
0 голосов
0 ответов

У меня есть требование, когда мне нужно записывать и периодически добавлять входящие данные в...

hdobus / 04 июня 2019
1 голос
0 ответов

В настоящее время выполняется некоторый код, подобный следующему: df = pd

JD D / 04 июня 2019
0 голосов
1 ответ

Я пытаюсь выяснить, как Эрроу преобразует список Python в эквивалент arrow::Array, используя C ++...

clery00 / 04 июня 2019
1 голос
1 ответ

Из-за некоторых ограничений потребителя моих данных мне нужно «переписать» некоторые файлы паркета,...

JD D / 04 июня 2019
1 голос
1 ответ

Я конвертирую данные из CSV в Parquet, используя Python (Pandas), чтобы позже загрузить их в Google...

dhafnar / 03 июня 2019
0 голосов
0 ответов

Я хочу попытаться сохранить много больших DataFrames Pandas, которые не помещаются в память сразу,...

Nick Fernandez / 31 мая 2019
0 голосов
0 ответов

Я хочу записать поток больших данных в файл паркета с Python. Мои данные огромны, и я не могу...

Mohsen Laali / 30 мая 2019
0 голосов
0 ответов

Это для python3, поэтому, когда я говорю «список», я имею в виду список python3. Я хотел бы создать...

Andrew Spott / 29 мая 2019
1 голос
1 ответ

У меня есть pyarrow код написания набора данных для паркета. Я хочу провести интеграционный тест,...

toidas / 29 мая 2019
9 голосов
1 ответ

В настоящее время я разрабатываю свою первую целую систему с использованием PySpark, и у меня...

Fernandez / 27 мая 2019
0 голосов
0 ответов

Я хочу подключить pyarrow для чтения и записи файла паркета в формате hdfs. Но я столкнулся с...

UDIT JOSHI / 20 мая 2019
0 голосов
1 ответ

Я использую интерфейс Pyarrow HdfsFilesystem. Когда я вызываю чтение из n байтов, я часто получаю...

Iva / 16 мая 2019
0 голосов
0 ответов

Я хочу рассчитать скользящую сумму (скользящий двенадцать месяцев) ежедневных продаж для набора...

pythoneer / 15 мая 2019
0 голосов
1 ответ

Невозможно загрузить файлы паркета с одинаковыми именами столбцов, но с другим порядком. Сценарий:...

Nagaraju Budigam / 13 мая 2019
0 голосов
1 ответ

В серверном модуле javascript мне нужно записать данные в файл ORC, но я не смог найти подсказки,...

Kai Roesner / 09 мая 2019
0 голосов
2 ответов
0 голосов
1 ответ

Я пытался установить новый пакет Databricks koalas, используя рекомендованный pip install koalas,...

Frank B. / 25 апреля 2019
0 голосов
1 ответ

Я получаю эту ошибку всякий раз, когда пытаюсь установить pyarrow на моем компьютере, она 64-битная...

WorkDoubts / 24 апреля 2019
1 голос
1 ответ

Я пытаюсь следовать документации для здания pyarrow локально . В частности, используя инструкции...

Aleksey Bilogur / 22 апреля 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...