Ошибка места в куче Java в синтаксическом анализаторе Stanford во множестве оперативной памяти - PullRequest
0 голосов
/ 24 октября 2018

Я использую stanford-parser 3.9.2 для анализа текста патента,

У меня было много ошибок пространства кучи Java ..

Моя аппаратная среда выглядит следующим образом: CPU:Intel (R) Core (TM) i7-7600 CPU @ 3.40GHZ 3.41GHZ Ram: 64,0 ГБ

Я пытался решить эту проблему, используя некоторые опции в Python:

os.environ["STANFORD_PARSER"]='C:/Users/super/Desktop/Python NLP/nlp_root'
os.environ["STANFORD_MODELS"]='C:/Users/super/Desktop/Python NLP/nlp_root'
os.environ["JAVAHOME"]='C:/Program Files/Java/jdk1.8.0_151/bin/java.exe'
os.environ["JAVA_OPTS"]="-Xmx50g"
parser=stanford.StanfordParser(model_path='C:/Users/super/Desktop/Python NLP/nlp_root/englishPCFG.ser.gz')
parser.java_options='-mx50000m'

, но Javaпространство кучи возникает снова и снова ..

Я думаю, что для разбора предложений достаточно 50 ГБ оперативной памяти,

, поэтому в наборе кода опции java есть некоторые ошибки.

errorкод:


* ВНИМАНИЕ!НЕДОСТАТОЧНО ПАМЯТИ!НЕ БЫЛО ХОРОШО ПАМЯТЬ, ЧТОБЫ ЗАПУСТИТЬ ВСЕ ПАРСЕРЫ.ДАВАЙТЕ JVM БОЛЬШЕ ПАМЯТИ, УСТАНАВЛИВАЙТЕ МАКСИМАЛЬНОЕ ПРЕДЛОЖЕНИЕ ДЛИНА С -maxLength, ИЛИ ВОЗМОЖНО ВАМ СЧАСТЛИВАЯ, ЧТОБЫ ИСПОЛЬЗОВАТЬ ПАРСЕР, ОБРАТНО ИСПОЛЬЗОВАТЬ ПРОСТОЙ ПАРСЕР ДЛЯ ОЧЕНЬ ДЛИННЫХ ПРЕДЛОЖЕНИЙ.*


...