У нас есть коллекция MongoDB, в которой хранятся документы, подобные этим:
{
id: 5,
text: "500.00 was the cost in USD",
entities: [
{text: '500.00', label: 'AMOUNT'},
{text: 'USD', label: 'CURRENCY'}
]
}
(сущности являются результатом применения NER SpaCy.)
У нас есть поисковый компонент, который в идеале запроситдля 500.00
и USD
, а затем дать соответствующие результаты в соответствии с некоторым показателем релевантности.
Было высказано предположение, что компонент поиска должен генерировать представление NER MongoDB в памяти (возможно, Redis) в векторах слови попробуйте найти самое близкое соответствие.
Я видел нечто подобное здесь: https://blog.acolyer.org/2017/07/06/using-word-embedding-to-enable-semantic-queries-on-relational-databases/
Но это относится к базам данных SQL. Каков типичный / предпочтительный подход в таких случаях?