Как экспортировать полный результат Databricks Azure - PullRequest
0 голосов
/ 12 декабря 2018

Я экспортирую данные из блоков данных вручную с помощью параметра результата полной загрузки, используя команду "display". Пример

display (predictions.select ("productid", "prediction"))

Но он возвращает только 1 000 000, у меня есть еще много записей.Существуют ли какие-либо ограничения для DataBricks в отношении экспорта полного результата?

Что я могу сделать, чтобы загрузить все мои результаты?

1 Ответ

0 голосов
/ 15 декабря 2018

Да, блоки данных отображают только ограниченный фрейм данных.Это позволяет загружать данные как CSV, но я думаю, что это также ограничено.Вы можете сохранить фрейм данных в виде таблицы в базе данных блоков данных с помощью:

predictions.select("productid", "prediction").write.saveAsTable("predictions")

Затем вы можете загрузить его с помощью:

predictions = spark.table('predictions')
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...