Реализация Gensim Mallet на машинах Linux / Unix - PullRequest
0 голосов
/ 03 июля 2019

Я могу запустить Gensim Mallet в Windows.Но я использую платформу Data Science DataIku для построения моделей.Поскольку в DataIku нет встроенной сборки Gensim Mallet, я использую пользовательское средство кодирования в DataIku (python).DataIku размещается на удаленной машине Linux, на которую я могу войти удаленно.

Я ссылался: http://mallet.cs.umass.edu/download.php,, но не использовать.

Я использую этот код

os.environ.update({'$PATH':r'/PaPData/mallet/'})
mallet_path = '/PaPData/mallet/bin/mallet'


model = gensim.models.wrappers.LdaMallet(mallet_path, corpus=corpus, num_topics=num_topics, id2word=id2word)

Я не могу запустить код из среды Python DataIku, поскольку он выдает сообщение об ошибке ниже

subprocess.CalledProcessError: Command '/ PaPData / mallet / bin / mallet import-file --preserve-case --keep-sequence --remove-stopwords --token-regex "\ S +" --input /tmp/4f13f0_corpus.txt --output /tmp/4f13f0_corpus.mallet 'вернул ненулевой статус выхода 127

...