Вопросы с тегом амазонка-ЭЙ - PullRequest

Вопросы с тегом амазонка-ЭЙ

0 голосов
1 ответ

Я пытаюсь выполнить sqoop import в Amazon EMR (hadoop 2.8.5 sqoop 1.4.7). Импорт идет очень хорошо,...

Antonio González Borrego / 30 октября 2019
0 голосов
1 ответ

Я пытаюсь запустить улей, используя метаданные Glue. Из документации aws В настройках каталога...

aherve / 28 октября 2019
1 голос
1 ответ

AFAIK, EMR высоко оптимизирован для чтения / записи с / на S3 и имеет локальность данных RACK_LOCAL...

VB_ / 26 октября 2019
0 голосов
0 ответов

Я столкнулся с проблемой при попытке запустить параллельные задания Spark Streaming на EMR. YARN...

goutham r / 26 октября 2019
0 голосов
0 ответов

Я использую emr 5.26.0 и sqoop 1.4.7 для импорта таблицы в hdfs. Импорт выполняется в формате...

tomkurian77 / 25 октября 2019
1 голос
1 ответ

В основном я выполняю структурированное потоковое задание 24 x 7, записывая в S3. Но натолкнулся на...

TsimmisT / 24 октября 2019
1 голос
2 ответов

Я запускал кластер AWS ERM с использованием Java SDK (ниже приведен фрагмент кода), который...

Mehaboob Khan / 24 октября 2019
0 голосов
0 ответов

Я использую кластер Spark K-means на кластерах AWS EMR. Набор данных содержит 10 ^ 7 строк и 9...

Christopher Ferris / 23 октября 2019
1 голос
1 ответ

Я ищу ссылки на файлы, не относящиеся к Python (например, SQL, config, txt), сохраненные в формате

simonslav / 23 октября 2019
0 голосов
1 ответ

Я создал кластер EMS AWS и загрузил sparkify_log_small.json И создал блокнот EMR Jupyter с кодом...

bobby.dreamer / 23 октября 2019
0 голосов
1 ответ

При попытке записать фрейм данных в S3 я получаю сообщение об ошибке ниже с nullpointerexception....

Dinesh J / 23 октября 2019
0 голосов
1 ответ

Я использую Spark MLLib для выполнения K-средних кластеров в AWS EMR. Набор данных имеет порядок 10...

Christopher Ferris / 23 октября 2019
0 голосов
1 ответ

Я выполняю задания Spark на EMR с YARN и не понимаю, как подготовить и сообщить о памяти из...

blu / 23 октября 2019
0 голосов
0 ответов

Я создаю кластер EMR из terraform и вызываю пользовательский сценарий в качестве действия начальной...

mt_leo / 22 октября 2019
0 голосов
1 ответ

Как использовать переменную, определенную в экземпляре Python кластера EMR, когда я запускаю код на...

THIRDLOOKintern / 22 октября 2019
0 голосов
3 ответов

У меня сложный запрос с несколькими левыми внешними объединениями, запущенными в течение последнего...

Srihari Karanth / 22 октября 2019
0 голосов
2 ответов

В настоящее время я импортирую данные postgres в hdfs. Я планирую перенести хранилище с hdfs на S3....

Makubex / 21 октября 2019
0 голосов
0 ответов

Мы думаем об использовании AWS EMR Jupyterhub для запуска проекта с большими потребностями в данных...

Vidya Subramanian / 19 октября 2019
0 голосов
0 ответов

Я получил настроенные спарк-банки jar sql, и я хотел бы обновить его на существующих кластерах EMR....

Bostonian / 19 октября 2019
0 голосов
0 ответов

Мы создали отчет, который для указанного диапазона дат просматривает БД и получает поступления от...

max1221 / 19 октября 2019
0 голосов
0 ответов

Я создаю кластер в регионе AWS EMR (emr-5.27.0) eu-west-3 (paris) с: Hive 2.3.5 Hue 4.4.0 Spark 2.4

Raouf / 18 октября 2019
1 голос
1 ответ

Документация по шагам AWS гласит, что шаги выполняются только на главном компьютере, означает ли...

Kshitij Kohli / 18 октября 2019
0 голосов
1 ответ

Я пытаюсь применить хеш-функцию к коротким строкам в столбце PySpark DataFrame (запущенном в...

Alt / 16 октября 2019
2 голосов
2 ответов

Учитывая приложение, преобразующее csv в паркет (из и в S3) с небольшим преобразованием: for table...

Jay Cee / 15 октября 2019
0 голосов
0 ответов

У меня есть несколько пакетных заданий, которые я планирую запустить на EMR. Я планирую создать...

Makubex / 14 октября 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...