В настоящее время у меня есть набор значений в столбце в моем фрейме данных. Для значений нет определенного шаблона, и в большинстве случаев он является случайным, но я бы хотел создать свой собственный словарь или список, чтобы, если строка содержала эти значения, я мог создать новый столбец, соответствующий этим ключевым словам. Я пришел из R-фона, поэтому раньше я создал цикл for, распаковывающий список с помощью grepl.
Допустим, у меня есть словарь:
my_dict:
my_dict = {"BC": "Vancouver", "AB": "Calgary", "SK": ["Regina","Saskatoon"], "MB": ["Winnipeg","Brandon"], "ON":["Toronto","Ottawa"]}
По сути, я хочу, чтобы, если строка когда-либо совпадала, тогда использовали Ключ словаря. Также, если их совпадение не найдено или Ключ не указан в словаре, тогда будет введено «Другое». Это то, что я хотел бы увидеть.
ДФ:
df = pd.DataFrame({"Name": ["Jordan","Paul","Adrian","Sarah","Becky","Shawn"], "City":["Vancouver - Lower Mainland","Calgary/Lethbridge","Regina / Moose Jaw","Brandon","Ottawa_Hamilton","Montreal"],
"Province_Fixed": ["BC","AB","SK","MB","ON","Other"]})
Выходной информацией будет столбец «Provinc_Fixed». Я хотел бы знать, какой метод будет лучшим способом решения этой проблемы. Я просто дал словарь ради вопроса, делать это не нужно.
Спасибо! Я очень ценю это.