Указатель совпавших слов заданного текста - PullRequest
0 голосов
/ 29 июня 2018

Я работал над тем, чтобы найти клинические термины более низкого уровня в данном документе либо в тех же самых точных словах, либо в разных словах, но в одном и том же значении. Я использовал сопоставление косинусного сходства для данного текста со всеми терминами, с которыми мне нужно совпасть, и я получаю значение того, насколько оно соответствует данному тексту. Наивысшее значение cos дает мне точное значение.

sent_list = process.SBD("The patient has been given paracetamol for fever in interval of every two hour. There has been sever headache and abnorm of the labor. Continuation of these medicine might lead to abdomen has been crushing.")

Выход: [['Arenaviral haemorrhagic fever'], ['Abnormal labor'], ['Abdomen crushing']]

но мне также нужно получить индекс слов, которые совпадают в тексте Любой алгоритм для получения индекса слов, совпадающих в данном тексте.

1 Ответ

0 голосов
/ 29 июня 2018

Я надеюсь, что это поможет вам, приятель, и это то, чего вы пытаетесь достичь, если нет вот что я понял ты пытаешься сделать

a = 'this is a test of getting the words indexes'

b = [['this is a'],[ 'the words']]
for i in b:
    #using the lower() so there is no a case mismatch
    if ''.join(i).lower() in a.lower():
        print(b.index(i))
...