Я подготовил код pyspark для чтения данных из AWS Kinesis во время потоковой передачи искры.Код работает нормально без каких-либо ошибок, но не получает никаких записей.
Я создал один поток данных Kinesis только с одним осколком и использовал утилиты Kinesis для создания искрового потока Kinesis.
spark_session = SparkSession.builder.getOrCreate()
ssc = StreamingContext(spark_session.sparkContext, 10)
sc = spark_session.sparkContext
Kinesis_app_name = "test"
Kinesis_stream_name = "aip4_idc_sensor_data"
endpoint_url = "kinesis.us-east-1.amazonaws.com"
region_name = "us-east-1"
data = KinesisUtils.createStream(
ssc, Kinesis_app_name, Kinesis_stream_name, endpoint_url,
region_name, InitialPositionInStream.LATEST, 10, StorageLevel.MEMORY_AND_DISK_2)
data.pprint()
ssc.start() # Start the computation
ssc.awaitTermination() # Wait for the computation to terminate
Командадля записи ставок aws:
запись ставок awines kinesis - имя потока aip4_icd_sensor --data "test" - ключ раздела "sixty"