PySpark: подсчитать каждый элемент в flatmap - PullRequest
0 голосов
/ 05 февраля 2019

У меня проблемы с подсчетом каждого элемента в списке, который я создал в PySpark.

Вот с чем я работаю:

test2 = words.filter (лямбда-строка: re.match (r '^ [AEIOU]', строка)). Take (10)

test2 [u'EBook ', u'Author:', u'English ', u'OF', u'EBOOK ', u'Inc.,', U'Etext', u'Inc., ', U'Etexts', u'Etext ']

Теперь я хочу подтвердить, что счетчик test2 равен 10. Но каждый разЯ использую test2.count (), он выдает мне ошибку:

Traceback (последний вызов был последним): файл "", строка 1, в TypeError: count () принимает ровно один аргумент (задано 0)

Может кто-нибудь помочь мне научиться правильно считать элементы?

Спасибо!

1 Ответ

0 голосов
/ 05 февраля 2019

test2 - это список, поэтому вы должны выполнить len(test2), чтобы найти количество элементов.Функция count () при вызове в списке возвращает количество вхождений того, что вы передаете в качестве параметра.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...