Я совсем новичок в pyspark. Выполняя приведенный ниже фрагмент кода в pycharm, я получаю желаемый результат. Но я получаю ошибку ниже
Traceback (most recent call last):
File "C:\Study\Spark\spark\python\lib\py4j-0.10.7-src.zip\py4j\java_gateway.py", line 1067, in start
ConnectionRefusedError: [WinError 10061] No connection could be made because the target machine actively refused it
ERROR:py4j.java_gateway:An error occurred while trying to connect to the Java server (
Traceback (most recent call last):
File "C:\Study\Spark\spark\python\lib\py4j-0.10.7-src.zip\py4j\java_gateway.py", line 929, in _get_connection
IndexError: pop from an empty deque
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "C:\Study\Spark\spark\python\lib\py4j-0.10.7-src.zip\py4j\java_gateway.py", line 1067, in start
ConnectionRefusedError: [WinError 10061] No connection could be made because the target machine actively refused it
**Process finished with exit code 0**
Как вы можете видеть в последней строке Процесс завершен с кодом выхода 0, и я также получаю ожидаемый результат
Вот мой пример кода
Python -3.7
def func(row):
temp["concat_val"]="|".join([str(x) for x in row])
return put
if __name__ == "__main__":
spark = SparkSession\
("1", 'foo'),
("2", 'bar'),
['id', 'txt']
row_rdd = data1.rdd.map(func)
concat_df = row_rdd.toDF()
hash_df = concat_df.withColumn("hash_id", md5(F.col("concat_val")))