Как исправить функцию регулярного выражения, которая игнорирует оператор if? - PullRequest
0 голосов
/ 23 марта 2019

У меня есть следующий фрейм данных Python

enter image description here

И я написал следующий код, который я хочу:

URL

  1. для каждого URL-адреса в столбце Landing_Page, найдите URL-адреса, содержащие в себе «/ 2019 /», и назначьте им новую переменную с именем «new_model_core_incentives»
  2. для каждого URL в столбце Landing_Page, найдите URL, которые содержат любой год, кроме 2019, и назначьте им новую переменную с именем "used_model_core_incentives"

ключевые слова

  1. поиск в каждой строке столбца ключевых слов, и для ключевых слов, содержащих в себе «2019», создайте новую переменную и назовите ее new_word
  2. поиск в каждой строке столбца ключевых слов, а для ключевых слов, которые не содержат ни одного года, назовите эти new_word
  3. искать в каждой строке столбца ключевых слов, а для ключевых слов, которые содержат годы, а не 2019, назовите их old_words
for Landing_Page in zip(df.Landing_Page):
      # the url
    if "/2019/" in Landing_Page:
        new_model_core_incentives = Landing_Page
        print(f"new_model_core_incentives {new_model_core_incentives}")
    elif re.search("/(?:(?:20)|(?:19))\d{2}/", url):
        used_model_core_incentives = Landing_Page 
        print(f"used_model_core_incentives {used_model_core_incentives}")    

        # the "keywords"
    if "2019" in Keyword:
        new_word = Keyword
        print(f"new_word {new_word}")
    elif re.search("(?:(?:20)|(?:19))\d{2}", Keyword) is None:
        old_word = Keyword
        print(f"old_word {old_word}")

Когда я запускаю этот код, я получаю следующие ошибки:

1. List item

Когда я пытаюсь запустить блоки отдельно, я сталкиваюсь с проблемой того, что все URL-адреса классифицируются как «used_model_core_incentives», несмотря на то, что они содержат «/ 2019 /» в них.

Я также не могу заставить функцию смотреть на блок ключевых слов вообще.

Есть идеи?

1 Ответ

0 голосов
/ 23 марта 2019

elif re.search("(?:(?:20)|(?:19))\d{2}", Keyword) is None:

пропущено без знаков предвкушения, оно должно быть:

elif re.search("/(?:(?:20)|(?:19))\d{2}/", Keyword) is None:

РЕДАКТИРОВАТЬ:

при упоминании @ s3n0 вы уверены, чтоKeyword это строка?Я проверил оба случая, и он выполняется в обоих случаях.

...