У меня есть журнал вызовов службы поддержки в листе Excel. Ниже приведен формат данных, которые у меня есть
So# Comments
1 sjhsh QUOTE 234566
1 sdsds customer call QUote 239876 Call back
2 adsdfh unknown call from customer QUOTE 189067 sdkjsd woieweio
3 QUOTE 657894 customer called for service
Я читаю эти данные из Excel и мне нужно получить 6 цифр после текста "QUOTE" в каждой строке, а затем добавить извлеченные цифры в качестве нового столбца
1.В строках может быть несколько упоминаний "QUOTE"
2.Строки могут вообще не иметь «QUOTE»
Может кто-нибудь помочь мне с этим поиском подстроки, используя python
import pandas as pd
import re
file=pd.read_excel("C:/Users/rkatta/Desktop/Book1.xlsx")
file.set_index('Index', inplace=True, drop=True)
comments=file['InternalComments']
quotenum=[]
keyword= 'QUOTE'
for i in comments:
try:
befor_keyowrd, keyword, after_keyword = comments[i].partition(keyword)
num=after_keyword[:6]
quotenum.append(num)
except AttributeError:
befor_keyowrd, keyword, after_keyword =''
quotenum.append(after_keyword)