Я пытаюсь разработать чат-бота на языке урду, используя rasa_nlu. Моя модель правильно классифицирует намерения, но не может извлечь сущности. Я использую python 3.7.2 и моя версия rasa nlu 0.14.6 на компьютере с Windows 10.
Я убедился, что формат обучающих данных правильный, т. Е. Начальная и конечная позиции сущностей правильные. Я не могу понять проблему.
Ниже приведено содержимое моего файла config.yml:
язык: "ур"
Трубопровод:
- name: "tokenizer_whitespace"
- имя: "ner_crf"
- имя: "ner_synonyms"
- name: "intent_featurizer_count_vectors"
- name: "intent_classifier_tensorflow_embedding"
Обновление:
Я смог решить эту проблему, дав имена сущностей на английском языке, сохранив значения сущностей на урду в моих данных обучения. Например:
Цель: факел