Я хочу пометить текстовый файл, который содержит теги XML. Однако, когда я использую тег Стэнфорда, все аннотируется, даже теги XML. Есть ли флаг или какой-либо другой параметр, который позволяет мне указать, что я хочу только аннотировать текст и что теги XML следует игнорировать? Вот что мне нужно исправить:
<h> NNP <h> O
-> Эти теги следует игнорировать.
TreeTagger по умолчанию игнорирует теги XML, например.