Как API языка Google разбивает текст на предложения для определения настроения? - PullRequest
0 голосов
/ 12 сентября 2018

Вопрос в заголовке.

Я объединил предложения в большой текст, который я затем назвал analyze_sentiment.Цель состоит в том, чтобы вытащить чувства к отдельным предложениям - точно к тем, которые первоначально присоединились.

Сначала я убираю все знаки препинания, lower символы, capitalize предложения, заканчиваю их . и join пробелом.

Вот пример двух предложений, которые Google считает одним предложением.

Она с легкостью ответила на мои вопросы, Thx.Тайлер был очень внимателен.

Однако,

Она легко ответила на мои вопросы, Thx.Сэм был очень внимателен.

работает правильно.

Вы можете попробовать это самостоятельно, перейдя на их страницу на естественном языке и попробовав API.

Если я знаю условия разделения, я могу соответствующим образом отформатировать свои оригинальные предложения,

1 Ответ

0 голосов
/ 13 сентября 2018

Похоже, модель границ предложений перепутана.Я открою для этого ошибку со стороны Google.

Если вам нужно найти настроение для каждого предложения, вы можете отправить предложения по отдельности в API, чтобы проблема с границами предложений не попала в ваш запрос.путь.Вы объединяете предложения из-за экономии на квоте или выставлении счетов или задержке?Потому что с точки зрения того, как работает модель, и расчета оценки настроения, нет разницы между отправкой предложений по отдельности против всех в одном большом фрагменте.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...