В настоящее время я работаю над приложением с Watson-assistant и Watson-discovery, и недавно у меня возникла проблема.Всякий раз, когда я делаю запрос к своей коллекции Watson-discovery, он правильно интерпретирует запрос, но в отрывках всегда есть такие, которые содержат метаданные или код формата документа.
Я хочу отфильтровать их, так как я будупоказывая пользователю ответ в основном, как он приходит от обнаружения.
Вот мой код для запроса:
function queryDiscovery(query){
return new Promise((resolve, reject)=>{
discovery.query({
environment_id: environment,
collection_id: collection,
configuration_id: configuration,
natural_language_query: query,
passages: true,
count: 3,
}, (err, data) => {
if(err){
reject(err);
} else {
const {results} = data;
resolve(data);
}
})
})
}
А вот такие ответы, о которых я говорю:
{
"matching_results": 1,
"session_token": "1_uy3Xpn0Xbw8XEEN4im2fffLxPA",
"passages": [
{
"document_id": "906e52b7e1144ab800c955d4d76f4711",
"passage_score": 7.251949122793696,
"passage_text": "Microsoft Word - Diabetes tipo 2 Guines en ESPANOL.docx\n\nGuiones Diabetes Tipo 2 1.1 ¿Qué es la diabetes?\n\n• ¿Qué es?\n\nLa diabetes es una enfermedad de larga evolución. Puede provocar problemas",
"start_offset": 0,
"end_offset": 193,
"field": "text"
},
{
"document_id": "906e52b7e1144ab800c955d4d76f4711",
"passage_score": 6.680067228882112,
"passage_text": "content=\"24\" name=\"numPages\"/><title>Microsoft Word - Diabetes tipo 2 Guines en ESPANOL.docx</title></head>\n<body><h3><p>Guiones Diabetes Tipo 2 1.1 ¿Qué es la diabetes? </p></h3><p><b>•</b><b> </b>¿Qué es?",
"start_offset": 197,
"end_offset": 403,
"field": "html"
},.....
Как видите, в отрывочном тексте содержится много кода формата документа, который мне не нужен.
Существует не так много документации о nodejs + discovery, и то, что я обнаружил, не было на самом делеслишком полезноЯ не знаю, имеет ли загруженный мною PDF-файл какой-то неправильный формат, или мне нужно каким-то образом настроить Discovery, или это может быть что-то другое.
Любая помощь будет признательна!