Вопросы с тегом google-облако-dataproc - PullRequest

Вопросы с тегом google-облако-dataproc

2 голосов
1 ответ

Я запускаю pySpark в Google Dataproc и пытаюсь работать в масштабе с сетевыми графиками. Это моя...

Alex / 07 октября 2019
2 голосов
1 ответ

Мы создаем приложение Spark в Scala с конфигурацией HOCON, конфигурация называется application.conf

pgruetter / 04 октября 2019
2 голосов
2 ответов

Я строю простой сетевой график с PySpark и GraphFrames (работает на Google Dataproc) vertices =...

Alex / 03 октября 2019
2 голосов
1 ответ

Чтение инструкций по этому репо: Соединители Google Cloud Storage и BigQuery Я выполнил приведенное...

Christos Hadjinikolis / 02 октября 2019
2 голосов
1 ответ

В ожидании необходимости отладки нашего кода Python путем поиска сообщений об ошибках в файлах...

singhj / 01 октября 2019
0 голосов
1 ответ

Когда мы запускаем импорт sqoop в кластерах GCP dataproc в файл avrodatafile или parquetfile,...

user3752941 / 01 октября 2019
2 голосов
1 ответ

У меня есть сценарий использования, когда мне нужно переписать письмо через кластер dataproc после...

Sourav Chatterjee / 01 октября 2019
4 голосов
2 ответов

У меня есть долгосрочное задание на структурированную потоковую передачу Spark, запущенное в Google...

iamyojimbo / 01 октября 2019
1 голос
2 ответов

Мне довольно сложно получить доступ к моей файловой системе данных hadoop с помощью облачной...

Santosh Bitra / 30 сентября 2019
1 голос
0 ответов

Я на GCP и читаю разные посты об управлении pyspark журналированием, и я не мог заставить что-либо...

MrCartoonology / 24 сентября 2019
1 голос
2 ответов

Я хочу использовать GraphFrames с PySpark (в настоящее время используется Spark v2.3.3 в Google...

Alex / 23 сентября 2019
2 голосов
2 ответов

Я использую рабочие процессы с Dataproc.Я хотел бы сделать 3 вещи: создать один шаг рабочего...

Rolintocour / 20 сентября 2019
2 голосов
1 ответ

На странице dataproc, описывающей поддержку druid, нет раздела о том, как загружать данные в...

radialmind / 20 сентября 2019
1 голос
1 ответ

Я настраиваю новый сервер dataproc и использую initilization-action для запуска пользовательского...

PanwarS87 / 11 июля 2019
1 голос
1 ответ

Запуск задания pyspark на GCP (с использованием dataproc 1.4), где я пытаюсь читать из хранилища...

John / 03 июля 2019
1 голос
1 ответ

Я получаю сообщение об ошибке ниже, когда пытаюсь составить список больших двоичных объектов,...

Gomzi / 30 июня 2019
3 голосов
1 ответ

Я пытаюсь изменить промежуточный каталог Spark, чтобы предотвратить потерю данных при выводе...

Fred Rouvier / 20 июня 2019
1 голос
0 ответов

При создании экземпляра Dataproc и подключении через Jupyterhub он постоянно отключается.Это...

wordsforthewise / 19 июня 2019
1 голос
1 ответ

Я пытаюсь запустить скрипт в PySpark, используя Dataproc. Этот скрипт является своего рода...

D Andreea / 15 июня 2019
2 голосов
1 ответ

Я только что познакомился с этим удивительным миром технологий больших данных и облачных вычислений...

ramd / 13 июня 2019
2 голосов
1 ответ

Я использую dataproc для отправки работ на спарк. Однако при искровой подаче неискровые аргументы...

pavbagel / 10 июня 2019
1 голос
1 ответ

В настоящее время я работаю в кластере Dataproc в регионе Европа. Я использую приложение spark на...

Sarang Shinde / 09 июня 2019
1 голос
1 ответ

У меня работает кластер dataproc на облачной платформе Google. Я намерен передать этот кластер в...

Shalanki Gupta / 09 июня 2019
1 голос
0 ответов

Простое потоковое приложение Spark без каких-либо значительных вычислений в памяти потребляет 17 ГБ...

Devester / 08 июня 2019
1 голос
1 ответ

Мы переходим из среды On-Premises к облачному хранилищу данных Google для рабочих заданий.Я могу...

user3858193 / 06 июня 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...