Я пытаюсь реализовать сходство в Elasticsearch. Я хочу использовать полезные данные для расчета баллов вместе со значениями TF и IDF. Когда я проверяю документацию по классическому сходству (https://lucene.apache.org/core/7_4_0/core/org/apache/lucene/search/similarities/ClassicSimilarity.html), появляется функция ScorePayload, которая может быть перегружена. Хотя, когда я расширяю класс ClassicSimility, он показывает ошибку в функции ScorePayload. Я также проверил импортированный класс, и функции полезной нагрузки не существует. Что я делаю не так в этом?
package org.elasticsearch.index.similarity;
import org.apache.lucene.analysis.payloads.PayloadHelper;
import org.apache.lucene.search.similarities.ClassicSimilarity;
import org.apache.lucene.util.BytesRef;
public class CustomTFIDFScorer extends ClassicSimilarity{
@Override
protected float scorePayload(int doc, int start, int end, BytesRef payload) {
if (payload != null) {
return PayloadHelper.decodeFloat(payload.bytes, payload.offset);
}
else {
return 1.0F;
}
}
@Override
public float tf(float freq) {
return freq;
}
@Override
public float idf(long docFreq, long docCount) {
return (float)(Math.log((docCount+1)/(double)(docFreq+1)) + 1.0);
}
@Override
public float lengthNorm(int length) {
// TODO Auto-generated method stub
return 1;
}
}
и это мой файл maven:
<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
<modelVersion>4.0.0</modelVersion>
<groupId>CustomPayloadSimilarity</groupId>
<artifactId>ElasticseachCustomSimilarity</artifactId>
<version>0.0.1</version>
<dependencies>
<!-- https://mvnrepository.com/artifact/org.elasticsearch/elasticsearch -->
<dependency>
<groupId>org.elasticsearch</groupId>
<artifactId>elasticsearch</artifactId>
<version>7.4.0</version>
</dependency>
</dependencies>
</project>