На самом деле у меня есть фреймы данных о потоке кликов с примерно 4 миллионами строк. У меня много столбцов, и два из них основаны на URL и домене. У меня есть словарь и хочу использовать его как условие. Например: если домен равен amazon.de
, а URL содержит ключевое слово pillow
, столбец будет иметь значение pillow
. И так далее.
dictionary_keywords = {"amazon.de": "pillow", "rewe.com": "apple"}
ID Domain URL
1 amazon.de www.amazon.de/ssssssss/exapmle/pillow
2 rewe.de www.rewe.de/apple
Ожидаемый вывод должен быть новым столбцом:
ID Domain URL New_Col
1 amazon.de www.amazon.de/ssssssss/exapmle/pillow pillow
2 rewe.de www.rewe.de/apple apple
Я могу использовать метод .str.contain вручную, но мне нужно определить функцию, которая принимает ключ и значение словаря какусловие.
Примерно так df[df['domain] == 'amazon.de'] & df[df['url'].str.contains('pillow')
Но я не уверен. Я новичок в этом.