Я новичок в Spark (PySpark) и MongoDB.
Я очень много учусь, как я go, но в моем коде Python я хочу подключиться к коллекции MongoDB и прочитать данные из этой коллекции.
Расположен MongoDB на локальной виртуальной машине - http://localhost: 27017
Кто-нибудь может мне помочь с этим синтаксисом? Я изо всех сил пытаюсь выяснить, как подключиться к нему.
Я пробовал ниже, но, похоже, просто возвращает пустые данные.
client = MongoClient("localhost", 27017)
db = client['Raw_Data']
collection = db['Raw_Data_Collection']
import pyspark
from pyspark import SparkContext
sc = SparkContext.getOrCreate();
df = pyspark.read.format("mongodb://localhost").load()
df = pyspark.read.format("mongo").option(client, "mongodb://localhost/Raw_Data.Raw_Data_Collection").load()
if(df.count > 0):
print("Not empty")
df.show()
Кто-нибудь может мне здесь помочь? Я полный новичок, поэтому приведенный выше код может быть выход!