Модель LDA и ошибка параллельных вычислений JobLib - PullRequest
0 голосов
/ 28 августа 2018

У меня есть некоторый код, который делает модель LDA на связке линий CSV.

lda_model = LatentDirichletAllocation(
    n_components=20,           # Number of topics
    max_iter=10,               # Max learning iterations
    learning_method='online',   
    random_state=100,          # Random state
    batch_size=128,            # n docs in each learning iter
    evaluate_every = -1,       # compute perplexity every n iters, default: Don't
    n_jobs = -1,               # Use all available CPUs
)

if __name__ == "__main__":
    lda_output = lda_model.fit_transform(data_vectorized)
    print(lda_model) 

Я запустил его в первый раз без if_name_ line и проблем не было. Во второй раз я запустил ошибку

ImportError: [joblib] Attempting to do parallel computing without
protecting your import on a system that does not support forking. To
use parallel-computing in a script, you must protect your main loop
using "if __name__ == '__main__'". Please see the joblib documentation
on Parallel for more information.

Поэтому я попытался добавить код if_name_, чтобы он заработал. У меня все еще есть проблемы. Я пытался вставить это в различные части моего кода (я на Windows) и не получал ничего, чтобы работать. Нужно ли добавить что-то еще?

...