Question

Вот мои наборы данных

      domainname
0     address=/000007.ru/0.0.0.0
1     address=/000007.ru/::
2     address=/000free.us/0.0.0.0
3     address=/000free.us/::

Я хочу извлечь слово между / и /, чтобы получить желаемый результат

      domainname                        website
0     address=/000007.ru/0.0.0.0        000007.ru
1     address=/000007.ru/::             000007.ru
2     address=/000free.us/0.0.0.0       000free.us
3     address=/000free.us/::            000free.us

Вот что я пытаюсь

adsdata_vector = df["domainname"]
ads = []
for i in range(len(adsdata)):
   ads.append(re.split(r"[/]+",adsdata_vector[i]))
ads[0:4]

Вот что я получаю

[['address=', '000007.ru', '0.0.0.0'],
['address=', '000007.ru', '::'],
['address=', '000free.us', '0.0.0.0'],
['address=', '000free.us', '::']]

Мне нужен только второй столбец, пожалуйста, предложите что-нибудь?

Mohit Motwani · Answer 1 · 28 марта 2019

Вы можете использовать Series.str.extract :

df['website'] = df.domainname.str.extract(r'/(.+)/')

      domainname                        website
0     address=/000007.ru/0.0.0.0        000007.ru
1     address=/000007.ru/::             000007.ru
2     address=/000free.us/0.0.0.0       000free.us
3     address=/000free.us/::            000free.us

Регулярное выражение r'/(.+)/' найдет любой символ, повторенный один или несколько раз между двумя /

Maged Saeed · Answer 2 · 28 марта 2019

, если адрес всегда address=/000007.ru/0.0.0.0 и вы хотите извлекать второй столбец каждый раз, почему бы не использовать:

website = address.split('/')[1]

jezrael · Answer 3 · 28 марта 2019

Если хотите извлечь первые совпадающие значения, используйте Series.str.extract:

df['website'] = df['domainname'].str.extract('/(.*?)/')
print (df)
                    domainname     website
0   address=/000007.ru/0.0.0.0   000007.ru
1        address=/000007.ru/::   000007.ru
2  address=/000free.us/0.0.0.0  000free.us
3       address=/000free.us/::  000free.us

Или, если нужно, все совпадающие значения используйте Series.str.findall с Series.str.join:

df['website'] = df['domainname'].str.findall('/(.*?)/').str.join(', ')

Если нужно только второе значение после разбиения на /, используйте Series.str.split с индексированием:

df['website'] = df['domainname'].str.split('/').str[1]

Как извлечь слова между определенными символами

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 4 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как извлечь слова между определенными символами

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 4 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов