Watson-discovery и Nodejs: не получили ожидаемого ответа на мой запрос - PullRequest
0 голосов
/ 07 октября 2018

В настоящее время я работаю над приложением с Watson-assistant и Watson-discovery, и недавно у меня возникла проблема.Всякий раз, когда я делаю запрос к своей коллекции Watson-discovery, он правильно интерпретирует запрос, но в отрывках всегда есть такие, которые содержат метаданные или код формата документа.

Я хочу отфильтровать их, так как я будупоказывая пользователю ответ в основном, как он приходит от обнаружения.

Вот мой код для запроса:

 function queryDiscovery(query){
  return new Promise((resolve, reject)=>{
    discovery.query({
      environment_id: environment,
      collection_id: collection,
      configuration_id: configuration,
      natural_language_query: query,
      passages: true,
      count: 3,
    }, (err, data) => {
      if(err){
        reject(err);
      } else {
        const {results} = data;
        resolve(data);
      }
    })
  })
}

А вот такие ответы, о которых я говорю:

{
"matching_results": 1,
"session_token": "1_uy3Xpn0Xbw8XEEN4im2fffLxPA",
"passages": [
    {
        "document_id": "906e52b7e1144ab800c955d4d76f4711",
        "passage_score": 7.251949122793696,
        "passage_text": "Microsoft Word - Diabetes tipo 2 Guines en ESPANOL.docx\n\nGuiones Diabetes Tipo 2 1.1 ¿Qué es la diabetes?\n\n• ¿Qué es?\n\nLa diabetes es una enfermedad de larga evolución. Puede provocar problemas",
        "start_offset": 0,
        "end_offset": 193,
        "field": "text"
    },
    {
        "document_id": "906e52b7e1144ab800c955d4d76f4711",
        "passage_score": 6.680067228882112,
        "passage_text": "content=\"24\" name=\"numPages\"/><title>Microsoft Word - Diabetes tipo 2 Guines en ESPANOL.docx</title></head>\n<body><h3><p>Guiones Diabetes Tipo 2 1.1 ¿Qué es la diabetes? </p></h3><p><b>•</b><b> </b>¿Qué es?",
        "start_offset": 197,
        "end_offset": 403,
        "field": "html"
    },.....

Как видите, в отрывочном тексте содержится много кода формата документа, который мне не нужен.

Существует не так много документации о nodejs + discovery, и то, что я обнаружил, не было на самом делеслишком полезноЯ не знаю, имеет ли загруженный мною PDF-файл какой-то неправильный формат, или мне нужно каким-то образом настроить Discovery, или это может быть что-то другое.

Любая помощь будет признательна!

...