Как получить доступ к тексту внутри этих тегов в Python? - PullRequest
0 голосов
/ 26 сентября 2018

У меня есть набор данных, где я пометил существительные фразы.Как найти эти теги и извлечь данные из тега.

در
همین
حال
<coref coref_coref_class="set_0" coref_mentiontype="ne" markable_scheme="coref" coref_coreftype="ident">
نجیب
الله
خواجه
عمری
</coref>
<coref coref_coref_class="set_0" coref_mentiontype="np" markable_scheme="coref" coref_coreftype="ident">
سرپرست
وزارت
تحصیلات
عالی
افغانستان
</coref>
گفت
که


 def ex_feature(text):
    for w in text:
        if w.startswith("<coref") and w.endswith("</coref>"):
            print(w)

1 Ответ

0 голосов
/ 26 сентября 2018

Как насчет

import re
print(re.findall(r'<coref.*?>(.*?)</coref>', text, re.S))
...