Я работаю над программой ag, которая проверит определенные закономерности в названии исследования, чтобы определить, может ли заголовок быть актуальным.Как правило, будет уместно, если слова «доступ» и «уход» находятся в пределах 4 слов друг от друга.Могут быть такие фразы, как «доступ к лечению», «доступ к пациенту» или «доступ к лечению диабета».
Сейчас я перечислил и разбил каждую строку и отфильтровал строки, которые имеют«доступ» и «забота» в них, а также число, но я изо всех сил пытался создать двоичную переменную «да / нет», если они находятся в пределах 4 слов друг от друга.Например:
string = "Обеспечение доступа к медицинской помощи имеет важное значение."
релевантно = 'да'
string = "Обеспечение доступа к билетам на бейсбол важно, но, честно говоря, мне все равно."
релевантно = 'нет'
Буду признателен за любые идеи, как это сделать.Вот что у меня есть:
sentence = 'A priority area for this company is access to medical care
and how we address it.'
sentence = sentence.lower()
sentence = sentence.split()
for i, j in enumerate(sentence):
if 'access' in j:
x = 'yes'
else:
x = 'no'
if 'care' in j:
y = 'yes'
else:
y = 'no'
if x == 'yes' or y == 'yes':
print(i, j, x, y)