CloudSearch: выполнить запрос по указанным c полям, содержащим неаккуратные фразы, и указать вес для каждого поля, чтобы контролировать оценки релевантности - PullRequest
0 голосов
/ 05 августа 2020

У меня есть база данных о фильмах, и я хотел бы провести исследование специфических c полей , принимая во внимание все небрежные похвалы или слова. Кроме того, я хочу указать вес для каждого поля, чтобы контролировать относительную важность каждого поля, когда Amazon CloudSearch вычисляет оценки релевантности .

Например, загрузив следующий CSV-файл:

tagline,title,video,vote_average
Roll the dice and unleash the excitement!,Love life,False,6.9
"Fortunes will be made, lives will be lost.",The Timber,False,4.1
A Los Angeles Crime Saga,Leave,False,7.7
The biggest kick of the year!,The Big Green,False,5.2
Death means NOTHING to a beast with nine lives!,Seven Dead in the Cat's Eye,False,6.4
She's no angel of mercy.,Guardian Angel,False,6.3
Seven deadly sins. Seven ways to die.,Se7en,False,8.1
All she wanted was a little attention.,To Die For,False,6.7
"In this daring heist, the only color that counts is green",Dead Presidents,False,6.6
"I can smile, and murder while I smile",Richard III,False,6.9
"Get on, or GET OUT THE WAY!",Money Train,False,5.4
"Behind the spiked gates of this ""exclusive"" girls' school, live... ""THE YOUNG, THE EVIL AND THE SAVAGE.""",Naked You Die,False,5.4
Part Dog. Part Wolf. All Hero.,Balto,False,7.1
He Delivers.,The Transporter Refueled,False,5.3
Friends are the people who let you be yourself... and never let you forget it.,Waiting to Exhale,False,6.1
The Happiest Time of My Life,...ing,False,6.6
Three men attempt to become the first humans to run coast to coast across the Sahara Desert,Running the Sahara,False,6.5
"Dead or Alive, They're coming for Steve",A Little Bit Zombie,False,5.4
Savage and Wilson are Combat Cops! A Hard Way To Live... An Easy Way To Die,The Zebra Killer,False,0.0
Love is the best thing in life...until it's over.,Sleepless In New York,False,6.0

Используя онлайн-панель CloudSearch Dashboard, используя Lucene Query Parser, я получил следующий результат: введите описание изображения здесь

Похоже, я не могу повысить важность поля «заголовок» (^) по сравнению с полем «слоган», когда Amazon CloudSearch рассчитывает оценки релевантности.

Как я могу решить эту проблему? Может ли кто-нибудь поделиться точными командами для выполнения запроса по указанным c полям, который учитывает небрежные высказывания, и указать вес для каждого поля, чтобы контролировать относительную важность, когда Amazon CloudSearch вычисляет оценки релевантности? Заранее благодарю!

...