Есть ли способ получить минимальные требования к токенам для метода классификации текста Google NLP API? Я пытаюсь ввести короткое простое предложение, например «Я не могу дождаться президентских дебатов», но это приведет к ошибке:
Invalid text content: too few tokens (words) to process.
Есть ли способ обойти это? Я ввожу случайные слова до тех пор, пока вводимая строка не достигнет 20 символов, но это часто портит метки и уверенность. Если есть какой-либо способ обойти это, например, установить параметр или добавить что-то, что было бы круто! Если обходного пути нет, дайте мне знать, если вам известна другая предварительно обученная модель классификации текста, которая подойдет мне!
Кроме того, я не могу создавать нужные категории и метки. Для того, что я делаю, было бы слишком много, поэтому эти предопределенные категории в nlp api великолепны. Просто нужно избавиться от требования в 20 символов.