У меня есть следующий фрейм данных Python
И я написал следующий код, который я хочу:
URL
- для каждого URL-адреса в столбце Landing_Page, найдите URL-адреса, содержащие в себе «/ 2019 /», и назначьте им новую переменную с именем «new_model_core_incentives»
- для каждого URL в столбце Landing_Page, найдите URL, которые содержат любой год, кроме 2019, и назначьте им новую переменную с именем "used_model_core_incentives"
ключевые слова
- поиск в каждой строке столбца ключевых слов, и для ключевых слов, содержащих в себе «2019», создайте новую переменную и назовите ее new_word
- поиск в каждой строке столбца ключевых слов, а для ключевых слов, которые не содержат ни одного года, назовите эти new_word
- искать в каждой строке столбца ключевых слов, а для ключевых слов, которые содержат годы, а не 2019, назовите их old_words
for Landing_Page in zip(df.Landing_Page):
# the url
if "/2019/" in Landing_Page:
new_model_core_incentives = Landing_Page
print(f"new_model_core_incentives {new_model_core_incentives}")
elif re.search("/(?:(?:20)|(?:19))\d{2}/", url):
used_model_core_incentives = Landing_Page
print(f"used_model_core_incentives {used_model_core_incentives}")
# the "keywords"
if "2019" in Keyword:
new_word = Keyword
print(f"new_word {new_word}")
elif re.search("(?:(?:20)|(?:19))\d{2}", Keyword) is None:
old_word = Keyword
print(f"old_word {old_word}")
Когда я запускаю этот код, я получаю следующие ошибки:
Когда я пытаюсь запустить блоки отдельно, я сталкиваюсь с проблемой того, что все URL-адреса классифицируются как «used_model_core_incentives», несмотря на то, что они содержат «/ 2019 /» в них.
Я также не могу заставить функцию смотреть на блок ключевых слов вообще.
Есть идеи?