У меня есть набор данных, где i
и j
извлечены в двух списках.Теперь я должен проверить, должны ли i
и j
в одном предложении возвращать 0
, иначе посчитать количество предложений между i
и j
.
a
b
c
<coref coref_coref_class="set_0" coref_mentiontype="ne" markable_scheme="coref" coref_coreftype="atr">
aa
bb
</coref>
,
<coref coref_coref_class="set_0" coref_mentiontype="np" markable_scheme="coref" coref_coreftype="atr">
aa
dd
ff
</coref>
m
n
.
# first senetence end here
Теперь яизвлекли только текст из списка тегов i
в i_NP
и списка j
в j_NP
.Как включить .
, чтобы проверить, если i
и j
в одном предложении, затем вернуть 0
, иначе 1
i_NP = []
j_NP = []
find_coref = re.findall(r'<coref.*?coref_coref_class="set.*?>(.*?)</coref>', read_dataset, re.S)
coref_list = list(map(lambda x: x.replace('\n', ' '), find_coref))
for i in range(0,len(coref_list)-1,2):
i_NP.append(str(coref_list[i]))
j_NP.append(str(coref_list[i+1]))