Поиск похожих элементов в кадре с использованием python - PullRequest
0 голосов
/ 01 октября 2018

Новичок в Python.

У меня есть список из 20 000 товаров с его описанием.Моя задача состоит в том, чтобы найти все продукты, которые содержат элемент, который выглядит как «00320047S01» или «02201179S02».

Список продуктов с выделенными номерами продуктов

Я попробовал это

df1 = pd.read_excel(r'C:..\Desktop\Book1.xlsx') # Read the excel file

df1['A'] = df1['A'].astype(str).str.lower() # To lower case the data

new = df1['A'][df1['A'].str.contains(r'00[0-9]{6}S0[0-9]{2}',regex=True)].tolist() # trying out regex  

[] #output

Где я ошибаюсь?

PS - У всех товаров нет номера продукта, как вкартинка прилагается.

1 Ответ

0 голосов
/ 01 октября 2018

Попробуйте шаблон r'00\d+S0\d+ или r'00\d{6}S\d{2}'

Пример:

import pandas as pd

df = pd.DataFrame({"A": ['00320047S01', '00201179S02', "Hello World"]})
print( df[df['A'].str.contains(r'00\d+S0\d+',regex=True)] )

Выход:

             A
0  00320047S01
1  00201179S02
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...