Что означает значение нейтрального нуля в функции сгиба pyspark? - PullRequest
0 голосов
/ 10 октября 2019

Вот фрагмент кода

from operator import add
iris1 = sc.textFile("./dataset/iris_site.csv")
iris1_split = iris1.map(lambda var1: var1.split(","))
iris1_split.map(lambda col:float(col[0])).fold(0,add)

Вот что я понял о функции fold :

  1. Используется для агрегации .
  2. add является оператором для добавления данных меры в столбец index 1 .
  3. Первый аргумент называется нейтральное нулевое значение согласно этой записи . (Но что это на самом деле означает, что я не знаю.)
  4. Я пытался изменить нулевое значение с помощью 1, 2, -2, 10 и следующих приращений и уменьшений 2, 4, -4Произошло соответственно 20

    1027 * Наблюдая схему приращения / убывания,
    Уравнение выглядит как result = 2 * нейтральное_зол_значение + агрегатный_результат

Аналогичное нулевое значение можно также увидеть в функции foldByKey.

Нажмите здесь, чтобы получить радужную оболочку Набор данных

...