Я застрял с основной вещью, но я не мог понять, как заставить это работать. Мои извинения, если это что-то супер базовое. Просто я очень новичок в Spacy и не знаю, как это сделать. Не смог найти ни одного ресурса в интернете.
У меня есть несколько предложений вроде
a = "<sos> Hello There! <eos>"
Я использую следующие строки кода для токенизации, используя Spacy
import spacy
nlp = spacy.load('en_core_web_sm')
for token in nlp(a):
print(token.text)
То, что он печатает, выглядит примерно так
<
sos
>
Hello
There
!
<
eos
>
Как видите, он проанализировал метатеги <sos>
и <eos>
. Как я могу избежать этого? Вывод, который я хотел бы увидеть, выглядит примерно так:
<sos>
Hello
There
!
<eos>
Я не мог понять, как этого добиться. Любая помощь будет отличной.
Заранее спасибо