Группируйте значения через запятую в строке и создайте новый столбец pandas - PullRequest
0 голосов
/ 17 февраля 2020

У меня есть ситуация, когда мне нужно создать новый столбец pandas, основанный на значениях через запятую, которые присутствуют в соответствующих, используя некоторое совпадение фраз. Например: мой фрейм данных выглядит следующим образом:

ID             INFORMATION
1              HR, MGMT, Leadership, etc
2              Analytics, leader, role, etc
3              Telecom, leader, management, manager, etc
4              IT, leader, role, etc
5              Management, HR, Role, Leadership

Я хочу новый столбец pandas, который даст мне следующий выбор ключевых слов из информационного столбца. Например: если я ищу HR в строке 1, то должны быть возвращены навыки HR. В строке 5, если я ищу HR и менеджмент, должны быть возвращены навыки управления персоналом. Вывод должен выглядеть следующим образом:

ID      SkillSet
1       HR Skills
2       Analytics Skills
3       Telecom Skills
4       IT Skills
5       HR and Management Skills

Проблема скорее в активном поиске по ключевым словам или поиске по нескольким ключевым словам. Как мне этого добиться?

1 Ответ

0 голосов
/ 18 февраля 2020
 df.loc[df['INFORMATION'].str.contains('HR'), 'SkillSet'] = 'HR Skills'
...