присвоить значение в кадре данных искры - PullRequest
0 голосов
/ 26 июня 2019

У меня есть искровой фрейм данных:

+-----------------+------------+--------------------+------------------+------------------+
|opp_id__reference|oplin_status|               stage|        std_amount|   std_line_amount|
+-----------------+------------+--------------------+------------------+------------------+
|OP-180618-7456377|     Pending|7 - Deliver & Val...|31395.462999391966|13072.069816517043|
|OP-180618-7456377|     Pending|7 - Deliver & Val...|31395.462999391966| 13.85958009943131|
+-----------------+------------+--------------------+------------------+------------------+

Я бы хотел присвоить GREAT для oppt_line, std_line_amount> = 30% std_amount.

Ожидаемый результат:

542 OP-180112-6925769   Pending 7 - Deliver & Validate  363802.836296   31261.159197    False
543 OP-180112-6925769   Pending 7 - Deliver & Validate  363802.836296   46832.656747    False
544 OP-180112-6925769   Pending 7 - Deliver & Validate  363802.836296   118542.329840   False
359 OP-180222-7065558   Pending 7 - Deliver & Validate  2.434888e+05    670.785793  False
389 OP-160712-5051474   Pending 7 - Deliver & Validate  1.288711e+05    1288.780000 False
770 OP-180720-7563258   Pending 7 - Deliver & Validate  1.366182e+05    13.859580   False

Для этого я сделал в pandas dataframe:

DF_BR6['greater']=DF_BR6.std_line_amount.gt(DF_BR6.groupby('opp_id__reference').std_amount.transform('sum')*0.3)

Можете ли вы помочь мне достичь этого в spark dataframe, пожалуйста?

Спасибо

Bests

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...