Я использую stanford-parser 3.9.2 для анализа текста патента,
У меня было много ошибок пространства кучи Java ..
Моя аппаратная среда выглядит следующим образом: CPU:Intel (R) Core (TM) i7-7600 CPU @ 3.40GHZ 3.41GHZ Ram: 64,0 ГБ
Я пытался решить эту проблему, используя некоторые опции в Python:
os.environ["STANFORD_PARSER"]='C:/Users/super/Desktop/Python NLP/nlp_root'
os.environ["STANFORD_MODELS"]='C:/Users/super/Desktop/Python NLP/nlp_root'
os.environ["JAVAHOME"]='C:/Program Files/Java/jdk1.8.0_151/bin/java.exe'
os.environ["JAVA_OPTS"]="-Xmx50g"
parser=stanford.StanfordParser(model_path='C:/Users/super/Desktop/Python NLP/nlp_root/englishPCFG.ser.gz')
parser.java_options='-mx50000m'
, но Javaпространство кучи возникает снова и снова ..
Я думаю, что для разбора предложений достаточно 50 ГБ оперативной памяти,
, поэтому в наборе кода опции java есть некоторые ошибки.
errorкод:
* ВНИМАНИЕ!НЕДОСТАТОЧНО ПАМЯТИ!НЕ БЫЛО ХОРОШО ПАМЯТЬ, ЧТОБЫ ЗАПУСТИТЬ ВСЕ ПАРСЕРЫ.ДАВАЙТЕ JVM БОЛЬШЕ ПАМЯТИ, УСТАНАВЛИВАЙТЕ МАКСИМАЛЬНОЕ ПРЕДЛОЖЕНИЕ ДЛИНА С -maxLength, ИЛИ ВОЗМОЖНО ВАМ СЧАСТЛИВАЯ, ЧТОБЫ ИСПОЛЬЗОВАТЬ ПАРСЕР, ОБРАТНО ИСПОЛЬЗОВАТЬ ПРОСТОЙ ПАРСЕР ДЛЯ ОЧЕНЬ ДЛИННЫХ ПРЕДЛОЖЕНИЙ.*