Похоже, что вы успешно выучили hi
модель с помощью spaCy.Следующим шагом является написание файла конфигурации, например:
language: "hi"
pipeline:
- name: "tokenizer_whitespace"
- name: "ner_crf"
- name: "ner_synonyms"
- name: "intent_featurizer_count_vectors"
- name: "intent_classifier_tensorflow_embedding"
Если ваша hi
модель, которую вы только что узнали, также имеет токенизатор, вы можете заменить tokenizer_whitespace
на tokenizer_spacy
.
Я должен упомянуть, что новому целевому классификатору rasa, основанному на тензорном потоке, не нужны векторные слова вашей hi
модели, он извлекает вордервекторы с нуля, см. здесь .Для извлечения сущности вам также не нужна модель hi
, просто токенизатор сделает все за вас!Таким образом, в целом вы можете иметь своего бота даже без hi
модели!
Файл обучающих данных должен быть json или markdown, как полностью объяснено в doc .Я думаю, что ваши намерения и сущности должны быть на английском языке, но ясно, что примеры запросов могут быть на любом языке utf-8, например хинди.
Затем вы можете изучить свою модель, используя различные методы, которые объяснены вдок.например:
python3 -m rasa_nlu.train \
--config YOUR_CONFIG_FILE.yml \
--data YOUR_TRAIN_DATA.json \
--path PATH_TO_SAVE_MODEL
Хороший быстрый старт можно найти в doc .