Подготовка учебных примеров Watson Assistant - PullRequest
0 голосов
/ 06 февраля 2019

Я использую Watson Assistant для классификации электронных писем клиентов.

Я прочитал хороший ответ о лучших методах создания намерений Лучшие методы создания намерений / сущностей с помощью IBM Conversation Service .Это дало мне некоторые идеи, как улучшить результаты.

Однако у меня есть вопрос о примерах очистки перед добавлением их в Watson .

Должен ли я удалить все числа,имена, даты и т. д.?Должен ли я удалить фразы типа «Здравствуйте, спасибо, жду вашего ответа… ..»?

Например, исходный адрес электронной почты :

Здравствуйте, я перееду в другой город, и мой адрес изменится после 21 апреля.Мой новый адрес будет Лондон, ABC Street 123, приложение.34. Не могли бы вы обновить его в моем профиле?Заранее спасибо.С уважением, Марк

«очищенное» письмо :

Я перееду в другой город, и мой адрес изменится.Мой новый адрес будет

Должен ли я удалить всю ненужную информацию или лучше добавить начальную фразу в Watson?

Знаете ли вы, какие алгоритмы Watson Assistant использует для классификации(намерения)?

Заранее спасибо за любой ответ.

1 Ответ

0 голосов
/ 06 февраля 2019

Вы не должны тренироваться на информации PII.Это ничего не добавляет к вашей модели.Это также создает риск, если существует аудит, связанный с данными.Например, ВВПР.

Найдите суть почтовых намерений и обучайтесь этому.

Ваш пример - они хотят обновить свой профиль.


Имейте в виду, что WA не предназначен для классификации электронных писем.Таким образом, вам может понадобиться разработать механизм для оценки каждого предложения или обрабатывать несколько намерений в электронном письме.

Другим вариантом является Watson NLC, который, как я видел, используется в качестве классификатора почты.


Вам также следует попытаться уменьшить PII, сохраняемый в Watson Assistant, хотя он соответствует PII и поддерживает GDPR.

...