Question

У меня есть фрейм данных panda с именем столбца - AA_IDs. Значения имени столбца имеют специальный символ «- #» в нескольких строках. Мне нужно определить три вещи:

Положение этих специальных символов или разделителей
найти строку перед специальным символом
Найти строку после специального символа

Например, AFB001 9183Daily- # 789876A

Ответ будет перед разделителем - AFB001 9183Daily и после разделителя - 789876A

Akshay Sehgal · Answer 1 · 11 июля 2020

Просто используйте функцию apply с split -

df['AA_IDs'].apply(lambda x: x.split('-#'))

Это должно дать вам серию со списком для каждой строки как [AFB001 9183Daily, 789876A]

Это будет значительно быстрее, чем использование регулярного выражения, и не говоря уже о читабельности.

kwehmeyer · Answer 2 · 10 июля 2020

Допустим, фрейм данных называется df, а столбец с текстом - A. Вы можете использовать

import re # Import regex

pattern = r'<your regex>'

df['one'] = df.A.str.extract(pattern)

. Это создает новый столбец, содержащий извлеченный текст. Вам просто нужно создать регулярное выражение, чтобы извлечь то, что вы хотите из своей строки (строк). Я настоятельно рекомендую regex101 , чтобы помочь вам создать ваше регулярное выражение.

Надеюсь, это поможет!

Разделение значений столбца на основе разделителя (Pandas)

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Разделение значений столбца на основе разделителя (Pandas)

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов