Jena Полнотекстовый поиск с использованием задачи ElasticSearch - PullRequest
1 голос
/ 05 января 2020

У меня есть Graph DB в Jena-Fuseki, и я пытаюсь проиндексировать эту базу данных с помощью кластера ElasticSearch, я перехожу по этой ссылке https://jena.apache.org/documentation/query/text-query.html и когда я запускаю эту команду:

java -cp ./fuseki-server.jar jena.textindexer --desc=run/config.ttl

Я получил эту ошибку:

org. apache .jena.assembler.exceptions.NoSpecificTypeException: файл root: / apache -jena-fuseki-3.12.0 / run / config.ttl # indexES не имеет наиболее определенного типа c, который является подклассом ja: Object

это мой config.ttl

######## Example of a TDB dataset and text index#########################
# The main doc sources are:
#  - https://jena.apache.org/documentation/fuseki2/fuseki-configuration.html
#  - https://jena.apache.org/documentation/assembler/assembler-howto.html
#  - https://jena.apache.org/documentation/assembler/assembler.ttl
# See https://jena.apache.org/documentation/fuseki2/fuseki-layout.html for the destination of this file.
#########################################################################

@prefix :        <http://localhost/jena_example/#> .
@prefix rdf:     <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .
@prefix rdfs:    <http://www.w3.org/2000/01/rdf-schema#> .
@prefix tdb:     <http://jena.hpl.hp.com/2008/tdb#> .
@prefix text:    <http://jena.apache.org/text#> .
@prefix skos:    <http://www.w3.org/2004/02/skos/core#>
@prefix fuseki:  <http://jena.apache.org/fuseki#> .

[] rdf:type fuseki:Server ;
   fuseki:services (
     :myservice
   ) .

:myservice rdf:type fuseki:Service ;
    fuseki:name                       "bfpd" ;     # e.g : `s-query --service=http://localhost:3030/myds "select * ..."`
    fuseki:serviceQuery               "query" ;    # SPARQL query service
    fuseki:serviceUpdate              "update" ;   # SPARQL update service
    fuseki:serviceUpload              "upload" ;   # Non-SPARQL upload service
    fuseki:serviceReadWriteGraphStore "data" ;     # SPARQL Graph store protocol (read and write)
    fuseki:dataset                    :text_dataset ;
    .

## ---------------------------------------------------------------

# A TextDataset is a regular dataset with a text index.
:text_dataset rdf:type     text:TextDataset ;
    text:dataset   :mydataset ; # <-- replace `:my_dataset` with the desired URI
    text:index     <#indexES> ;
.

# A TDB dataset used for RDF storage
:mydataset rdf:type      tdb:DatasetTDB ; # <-- replace `:my_dataset` with the desired URI - as above
    tdb:location "DB" ;
    tdb:unionDefaultGraph true ; # Optional
.

# Text index description
<#indexES> a text:TextIndexES ;
    text:serverList "127.0.0.1:9200" ; # A comma-separated list of Host:Port values of the ElasticSearch Cluster nodes.
    text:clusterName "elasticsearch" ; # Name of the ElasticSearch Cluster. If not specified defaults to 'elasticsearch'
    text:shards "1" ;                  # The number of shards for the index. Defaults to 1
    text:replicas "1" ;                # The number of replicas for the index. Defaults to 1
    text:indexName "jena-text" ;       # Name of the Index. defaults to jena-text
    text:entityMap <#entMap> ;
.

# Entity map (see documentation for other options)
<#entMap> a text:EntityMap ;
    text:defaultField     "label" ;
    text:entityField      "uri" ;
    text:uidField         "uid" ;
    text:langField        "lang" ;
    text:graphField       "graph" ;
    text:map (
        [ text:field "label" ; 
          text:predicate skos:prefLabel ]
    ) . ```


Could anyone please help ????
Thanks

1 Ответ

2 голосов
/ 06 января 2020

Код поиска Jena text elasti c не является частью файла fuseki-server.jar. Это делает банку Fuseki намного больше, потому что ElasticSearch имеет много зависимостей. Для удобства вы можете wi sh создать собственную версию fuseki-сервера - добавьте это в POM из базы кода:

    <!-- Illustration: include the Jena Text ElasticSearch code -->
    <dependency>
      <groupId>org.apache.jena</groupId>
      <artifactId>jena-text-es</artifactId>
      <version>${project.version}</version>
      <exclusions>
        <exclusion>
          <groupId>org.hdrhistogram</groupId>
          <artifactId>HdrHistogram</artifactId>
        </exclusion>
      </exclusions>
    </dependency>

Если вы решили создать специальный fuseki-сервер, перепакуйте баночка, см. также: https://jena.apache.org/documentation/notes/jena-repack.html

...