Я создаю бота с Rasa.ai . При обучении бота с помощью Rasa NLU мы используем файл обучающих данных, в котором указаны текст, намерение, сущность и т. Д. Например, для простого ресторанного чат-бота обучающий файл data.json
может содержать
{
"text": "central indian restaurant",
"intent": "restaurant_search",
"entities": [
{
"start": 0,
"end": 7,
"value": "central",
"entity": "location"
},
{
"start": 8,
"end": 14,
"value": "indian",
"entity": "cuisine"
}
]
}
Мы используем это для обучения модели. Но нам нужно создать этот обучающий файл вручную (или через графический интерфейс).
Есть ли какой-нибудь инструмент, где я могу кормить предложения, и он может автоматически создавать намерение и сущность?
Sample Input: Is there any central Indian restaurant?
Sample Output: The above data.json
EDIT:
Чтобы лучше объяснить этот вопрос - предположим, у меня есть огромный набор журналов обслуживания клиентов. Насколько я понимаю, с Rasa (или другой подобной структурой) - человеку нужно пройти через журнал вызовов и понять все возможные намерения, комбинации сущностей, которые произошли в прошлом, и создать файл, такой как data.json
, такой как выше, перед обучением модели. , Это кажется по-настоящему не масштабируемой проблемой. Есть ли способ сгенерировать этот файл data.json
из этих журналов вызовов размером в ГБ без участия человека? Я что-то здесь упускаю?