Я могу запустить Gensim Mallet в Windows.Но я использую платформу Data Science DataIku для построения моделей.Поскольку в DataIku нет встроенной сборки Gensim Mallet, я использую пользовательское средство кодирования в DataIku (python).DataIku размещается на удаленной машине Linux, на которую я могу войти удаленно.
Я ссылался: http://mallet.cs.umass.edu/download.php,, но не использовать.
Я использую этот код
os.environ.update({'$PATH':r'/PaPData/mallet/'})
mallet_path = '/PaPData/mallet/bin/mallet'
model = gensim.models.wrappers.LdaMallet(mallet_path, corpus=corpus, num_topics=num_topics, id2word=id2word)
Я не могу запустить код из среды Python DataIku, поскольку он выдает сообщение об ошибке ниже
subprocess.CalledProcessError: Command '/ PaPData / mallet / bin / mallet import-file --preserve-case --keep-sequence --remove-stopwords --token-regex "\ S +" --input /tmp/4f13f0_corpus.txt --output /tmp/4f13f0_corpus.mallet 'вернул ненулевой статус выхода 127