Заменить значения в столбце на основе условия в Azure ML Studio - PullRequest
2 голосов
/ 07 мая 2019

Как заменить значения в определенном столбце определенным значением на основе условия в Azure ML Studio. Я могу сделать это, используя панд в Python как следующие:

df.loc[df['col_name'] > 1990, 'col_name'] = 1

Я пытаюсь найти модуль в Студии машинного обучения Azure, который бы соответствовал этому.

Я понимаю, что есть опция замены в модуле ConverToDataset и в модуле замены дискретных значений. Но ни один из них, кажется, не делает то, что я хочу. Можно ли заменить значения только в одном столбце конкретным значением на основе условия?

Ответы [ 2 ]

1 голос
/ 09 мая 2019

Вы можете использовать либо более общий Apply SQL Transformation , либо выделенный Clip Values ​​ модуль.Если все остальное терпит неудачу, есть также Выполнить скрипт Python .

Лично, для вашего примера я бы использовал Clip Values с установленными Clip Peaks и Upper Threshold.Для более сложных правил я бы использовал Apply SQL Transformation или Execute Python Script, в зависимости от правил, но с учетом SQL:).

0 голосов
/ 09 мая 2019

возможно, с помощью Preprocess Text модуль решит проблему? Я бы порекомендовал снять все опции и выполнять пользовательские операции поиска и замены с использованием регулярных выражений.

enter image description here

...