Я пытаюсь создать конвейер в реальном времени от Kafka до HBase, используя Pyspark, используя блог: https://datafloq.com/read/real-time-kafka-data-ingestion-into-hbase-pyspark/2658
При импорте пакета возникает ошибка ниже:
из импорта pyspark_ext *
Traceback (последний вызов был последним): файл "", строка 1, в ModuleNotFoundError: нет модуля с именем 'pyspark_ext'
Является ли этот пакет обязательным?
Я искал в Интернете, номожет найти только одну ссылку: py4j.protocol.Py4JJavaError: org.apache.spark.SparkException: необходимо указать metadata.broker.list или bootstrap.servers - но решение не предусмотрено.Спасибо, если кто-то может прокомментировать этот запрос.
Заранее спасибо