Я загрузил файл данных в корзину GCS моего проекта в Dataproc.Теперь я хочу скопировать этот файл в...
У меня есть искровое задание, которое не выполняется из-за следующей ошибки. org.apache.spark
Нам нужно перемещать данные из таблиц Hive (Hadoop) в GCP (Google Cloud Platform) BigQuery через...
С помощью pyspark на GCP я иногда получаю сообщения типа AnalysisException: "Database...
Требование : Уметь проверять (используя журналы) все команды, запускаемые в Jupyter Notebook...
Привет! Я попытался удалить таблицу из BigQuery, используя клиентскую библиотеку Java в Dataproc,...
У меня есть ряд вопросов (извините, документация Google ужасна и не удобна для пользователя): Что...
Я пытаюсь прочитать таблицу BigQuery с помощью кода Java спарк, как показано ниже:...
Я использую API clusters.create в Python для создания кластеров в Dataproc. {...
Я не могу решить проблему с правами на ведро GCS при отправке задания в Dataproc. Вот что я делаю:...
Мы используем Google Cloud Dataproc для быстрого анализа данных и часто используем ноутбуки Jupyter
Я очень новичок в GCP Google Cloud Platform, поэтому я надеюсь, что мой вопрос не будет выглядеть...
У меня есть сервер в облаке (скрытый за VPN), на котором я запускаю кластер Elasticsearch с одним...
Мне интересно попробовать Google Cloud Dataproc для задачи разбора HTML.В настоящее время у нас...
Я создал кластер Google Dataproc с двумя работниками, использующими виртуальные машины...
Я пытаюсь прочитать CSV-файл из облачного хранилища Google в Flink REPL.Поскольку я не очень опытен...
Я пытаюсь получить список всех моих глобальных кластеров dataproc, но, похоже, не могу найти способ...
Я создал кластер dataproc, используя бета-версию gcloud с необязательным компонентом presto. gcloud...
Используемая по умолчанию квота IP-адресов составляет всего 8, но я хотел бы создать кластер...
Я работаю над моделью машинного обучения 1,456,354 X 53.Я хотел сделать выбор функции для моего...
Я работаю над приложением PySpark для анализа авиационных данных.База данных является БД MS...
Я пытаюсь понять эксплуатационные аспекты dataproc. Допустим, у меня есть куча CSV-файлов в...
Я не могу запросить файл .sql в DataProcHiveOperator.Хотя документация говорит, что мы можем...
Здесь я пишу запросы в queryList, который находится под hiveJob. Чтобы отправить работу Hive в...
Мои задания (задания ML) требуют более 15 ГБ ОЗУ на одного работника.Как изменить тип машины для...