Question

Я пытаюсь извлечь все символы (обычно несколько слов, включая пробел) между специальным символом > и шаблоном слова .myword. в моем панде dataframe.

Я пробовал следующее, которое приносит только одно слово, прикрепленное к .myword:

df['my_column'] = df['text'].str.findall(r'(\w+.myword)')

Некоторые примеры строк:

str1 = 123abc >I want this1.myword #extract I want this1.myword
str2 =  123<>I want this2.myword<> #extract I want this2.myword

natka_m · Answer 1 · 28 апреля 2019

Во-первых, простая точка . соответствует любому символу, поэтому вы хотите экранировать его в своем регулярном выражении: \. В противном случае регулярное выражение также найдет совпадение, например:
123>Iwantthis!myword # extracts Iwantthis!myword

Во-вторых, вы должны разрешить использование пробельных символов в захваченной группе: \s.

Полагаю, это должно сработать за вас: r'([\w\s]+\.myword)'

D Emma · Answer 2 · 28 апреля 2019

Вместо использования регулярного выражения я бы определил определенную функцию для извлечения подстроки:

код

def substring(original_string):
    start = original_string.find(">")
    end = original_string.find(".myword")

    if (start > -1) and (end > -1):
        return original_string[start + 1:end]
    else:
        return None


df['my_column'] = df['text'].apply(lambda x: substring(x))

vintnes · Answer 3 · 28 апреля 2019

$ grep -Po '(?<=>)[^<$]+' <<EOF
123abc >I want this1.myword
123<>I want this2.myword<>
EOF

I want this1.myword
I want this2.myword

(?<=) Позитивный взгляд за спиной
[^] Отрицательный набор символов

RegEx для извлечения всех символов между специальным символом и словом

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

код

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

RegEx для извлечения всех символов между специальным символом и словом

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

код

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов