Вопросы с тегом апач-луч - PullRequest

Вопросы с тегом апач-луч

0 голосов
1 ответ

Я хочу получить общее количество элементов в PCollection<String, String> в Apache Beam.Я хочу...

Chinmay / 22 апреля 2019
0 голосов
1 ответ

У меня есть каталог, заполненный 99 файлами, я хочу прочитать эти файлы и затем хэшировать их в...

dmc94 / 21 апреля 2019
5 голосов
0 ответов

У меня есть задание Dataflow, которое считывает данные из pubsub и на основе времени и имени файла...

Scicrazed / 18 апреля 2019
1 голос
0 ответов

Мы написали конвейер Beam для версии 2.11, но когда мы пытаемся запустить его в Cloud Composer с...

Christopher Larsen / 17 апреля 2019
2 голосов
2 ответов

Я пытаюсь объединить две неограниченные PCollection, которые я получаю из двух разных тем кафки на...

capt2101akash / 15 апреля 2019
3 голосов
1 ответ

Цель: Я хочу загрузить потоковые данные, затем добавить ключ и затем подсчитать их по ключу....

Saeed Mohtasham / 12 апреля 2019
0 голосов
1 ответ

Мне нужно удалить элементы в конвейере, которые соответствуют старым данным.то есть: данные до 1...

cloudpython / 11 апреля 2019
0 голосов
2 ответов

Я пытаюсь запустить конвейер Apache Beam в облачном потоке данных Google, который использует FFmpeg...

John Allard / 08 апреля 2019
0 голосов
1 ответ

Попытка использовать агрегатную функцию ApproximateDistinct.ApproximateDistinctFn из apache beam...

Brachi / 08 апреля 2019
0 голосов
1 ответ

Чтобы объединить две вложенные структуры PCollection, нам нужно отсоединить PCollection перед...

lourdu rajan / 05 апреля 2019
0 голосов
1 ответ

Я пытаюсь разрушить слияние с GroupByKey. Это создает одно огромное окно, и, поскольку моя работа...

Graham Holker / 05 апреля 2019
0 голосов
2 ответов

У меня есть PCollection[str], и я хочу генерировать случайные пары. Исходя из Apache Spark, моя...

anthonybell / 03 апреля 2019
0 голосов
1 ответ

Моя цель - объединить две таблицы, где вторая таблица нормальная, а первая таблица вложенной...

lourdu rajan / 02 апреля 2019
0 голосов
1 ответ

Я пытаюсь запустить скрипт Python Apache Beam на моей локальной машине, чтобы провести некоторую...

DataEng / 02 апреля 2019
0 голосов
2 ответов

У меня есть простой конвейер потока данных и я пытаюсь выполнить его из облачной оболочки, Код:...

Jaison / 30 марта 2019
1 голос
2 ответов

Я хочу использовать группировку с помощью пользовательского ключа, но пока моя попытка Мы...

Naoki Hyu / 29 марта 2019
2 голосов
1 ответ

У меня есть конвейер DataFlow, пытающийся построить индекс (пары ключ-значение) и вычислить...

kpax / 28 марта 2019
0 голосов
1 ответ

Мы запускаем несколько потоковых конвейеров Dataflow, которые всегда в конечном итоге зависают и...

pnadolny / 22 марта 2019
0 голосов
0 ответов

Как можно автоматически сгенерировать шаблон потока данных _метаданных файла из кода конвейера Beam

marengaz / 21 марта 2019
0 голосов
1 ответ

Я тестирую функцию Google Cloud Dataflow Pipeline следующим образом: @Test public void...

Eric H / 21 марта 2019
0 голосов
1 ответ

При чтении данных из таблицы bigQuery с помощью Dataflow Job старается избегать дублирования в...

lourdu rajan / 20 марта 2019
1 голос
1 ответ

В соответствии с указанием в ссылке попытался создать файл JAR для планирования задания потока...

lourdu rajan / 19 марта 2019
0 голосов
0 ответов

Проблема начала появляться на выходных.По некоторым причинам, это чувствует, что проблема DataFlow....

GRS / 18 марта 2019
1 голос
1 ответ

Я пытаюсь запустить задание потока данных, у меня есть следующий файл setup.py: import setuptools...

Salma R / 18 марта 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...