Как заставить ner_crf перестать добавлять пробелы? - PullRequest
0 голосов
/ 10 апреля 2019

У меня есть rasa_nlu, интегрированная в мое приложение python.Я передаю ему глобус символов, в этом примере '$ {webAddress}', и я хотел бы вернуть этот блок символов обратно как сущность.По какой-то причине ner_crf добавляет пробелы в значение сущности, даже если его нет в тексте ответа.Как мне заставить это перестать делать это?

Я использую конвейер spacy_sklearn для обучения.Я бы расширил его, указав отдельные компоненты, но в любом случае не могу найти информацию о том, как настроить отдельные компоненты.Я включил очень похожие примеры в свои обучающие данные (заменив некоторую другую строку на webAddress), и она действительно признала это право.Просто ... просто ... прекрати это с пробелами!

$ curl -XPOST localhost:5000/parse -d '{"q":"navigate to ${webAddress}"}'
{
  "intent": {
    "name": "navigate",
    "confidence": 0.1911308126544064
  },
  "entities": [
    {
      "start": 12,
      "end": 25,
      "value": "$ { webaddress }",
      "entity": "url",
      "confidence": 0.5229620578330448,
      "extractor": "ner_crf"
    }
  ],
  "text": "navigate to ${webAddress}",
  "project": "default",
  "model": "model_20190409-153615"
}
...