import spacy, en_core_web_sm
nlp = en_core_web_sm.load()
doc = nlp(u"I will go to the mall")
chk_set = set(['VERB'])
print chk_set.issubset(t.pos_ for t in doc)
Приведенный выше код возвращает True if POS = verb
.
Теперь я хочу расширить этот код, чтобы прочитать список предложений, сохраненных в листе Excel.Чтобы проверить наличие пунктуации в предложении, я могу добиться этого, используя приведенный ниже код.
Вопрос в том, как расширить этот код ниже, чтобы включить проверку глагола выше.
from pandas import read_excel
import pandas as pd
import xlsxwriter
my_sheet_name = 'Metrics'
df = read_excel('sentence.xlsx', sheet_name = my_sheet_name)
df['.']=df['Sentence'].str.contains('.')
# df['VERB']=df['Sentence'].str.contains('.')
writer = pd.ExcelWriter('sentence.xlsx', engine='xlsxwriter')
df.to_excel(writer, sheet_name='Metrics')
writer.save()
Ожидаемый результат:
Sentence Verb
I will go to the mall True
the mall False
I may be here tomorrow. True