Спарк команда "sum" дает метод sum ([класс java.util.ArrayList]) не существует - PullRequest
1 голос
/ 17 октября 2019

Я схожу с ума?

from pyspark.sql.functions import *
sum([2,3,2])

Дает:

py4j.Py4JException: Method sum([class java.util.ArrayList]) does not exist

Как я могу просто получить простую сумму?

Что происходит за кулисами с искрой, чтобы сделать вещи такими сложными?

1 Ответ

2 голосов
/ 17 октября 2019

По from pyspark.sql.functions import * вы перезаписываете функцию суммы из стандартной библиотеки Python с помощью функции суммы из модуля pyspark.sql.functions. Чтобы избежать перезаписи, вы можете либо импортировать модуль:

import psypark.sql.functions as f

и ссылаться на две функции сумм как f.sum и sum.

, либо присваивать псевдоним сумме. функция от pyspark.

from pyspark.sql.functions import sum as fsum

Чтобы не вводить две функции сумм в одну и ту же область.

...