«java.lang.OutOfMemoryError: пространство кучи Java» при запуске «ga.nlp.annotate» с использованием GraphAware NLP - PullRequest
0 голосов
/ 10 ноября 2018

Windows 10
32 ГБ ОЗУ
8-ядерный процессор Xeon с тактовой частотой 3,4 ГГц

Neo4j 3.4.7
Neo4j Browser 3.2.13
apoc-3.4.0.3.jar
graphaware-nlp-3.4.7.52.13.jar
graphaware-server-community-all-3.4.7.52.jar
nlp-stanfordnlp-3.4.7.52.13.jar
stanford-english-corenlp-2018-10-05-models.jar

Привет. Я пытаюсь аннотировать все текстовые поля в моей базе данных. Есть 25532 узла с текстовыми значениями.

Я использую следующий запрос для этого:

CALL apoc.periodic.iterate(
"MATCH (n:FreeTextResponse) WHERE NOT (n)-[:HAS_ANNOTATED_TEXT]->() RETURN n",
"CALL ga.nlp.annotate({text: n.fullSentenceString, id: id(n), checkLanguage: false})
YIELD result MERGE (n)-[:HAS_ANNOTATED_TEXT]->(result)", {batchSize:1, iterateList:false})

... и получаю следующую ошибку:

java.lang.OutOfMemoryError: Java heap space

Я уверен, что это просто изменение настроек где-то, но я не уверен, что или где. Извините, если это немного новый вопрос!

1 Ответ

0 голосов
/ 11 ноября 2018

Конфигурация по умолчанию составляет 512 МБ, и этого недостаточно для моделей, используемых Stanford NLP. Как предлагается здесь:

https://github.com/graphaware/neo4j-nlp

Измените файл neo4j.conf следующим образом:

dbms.memory.heap.initial_size=3000m
dbms.memory.heap.max_size=5000m

Хотя, учитывая доступность вашей оперативной памяти, я бы предложил 5 ГБ для обоих значений.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...