Spark Структурированный потоковый кинезис Источник данных - PullRequest
0 голосов
/ 26 августа 2018

Можно ли использовать потоки Kinesis в качестве источника данных для структурированной потоковой передачи Spark?Я не могу найти ни одного доступного разъема.

1 Ответ

0 голосов
/ 28 августа 2018

Qubole имеет библиотеку kinesis-sql именно для этого.

https://github.com/qubole/kinesis-sql

Затем вы можете использовать источник, аналогичный любому другому источнику структурированной потоковой передачи Spark:

val source = spark
   .readStream
   .format("kinesis")
   .option("streamName", "spark-source-stream")
   .option("endpointUrl", "https://kinesis.us-east-1.amazonaws.com")
   .option("awsAccessKeyId", [YOUR_AWS_ACCESS_KEY_ID])
   .option("awsSecretKey", [YOUR_AWS_SECRET_KEY])
   .option("startingPosition", "TRIM_HORIZON")
   .load
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...