У меня 80000 вопросов и ответов, проиндексированных с помощью Solr, и файл функций.Я пытаюсь извлечь эти функции значения для каждой пары вопросов и ответов, чтобы использовать их для обучения по алгоритму (например, LambdaMart).
Алгоритм обучения получает в качестве входных данных следующий формат:
<label> qid:<qid> <feature>:<value> ... <feature>:<value> # <info>
Например:
3 qid:1 1:1 2:1 3:0 4:0.2 5:0 # 1A
2 qid:1 1:0 2:0 3:1 4:0.1 5:1 # 1B
1 qid:1 1:0 2:1 3:0 4:0.4 5:0 # 1C
1 qid:1 1:0 2:0 3:1 4:0.3 5:0 # 1D
1 qid:2 1:0 2:0 3:1 4:0.2 5:0 # 2A
Может кто-нибудь помочь мне извлечь эти значения функции?Спасибо!