java.lang.NegativeArraySizeException при создании матрицы тем документа с использованием RMallet - PullRequest
0 голосов
/ 05 марта 2019

Я пытаюсь написать некоторый код для получения файла списка экземпляров Mallet в матрицу тем документа в R. Для этого я прочитал файл списка экземпляров в переменную тренера тем под названием 'topic.model'.Ниже приведен вызов функции, которую я выполняю для создания матрицы тем документа в R:

theta <- mallet::mallet.doc.topics(topic.model, smoothed = TRUE, normalized = TRUE)

Я получил эту работу для меньшего файла списка экземпляров (<1 ГБ), но для большего списка экземпляров (~ 15 ГБ)) Я получаю следующую ошибку: </p>

Ошибка в .jcall (обертка, "[D", "flat_double"):
java.lang.NegativeArraySizeException
Вызовы: myfunc ....jevalArray -> newArray -> Structure -> .jcall -> .jcheck
Выполнение остановлено

Я подозреваю, что где-то существует целочисленное переполнение, в котором превышен INT_MAX, иNegativeArraySizeException происходит.Интересно, что с помощью командной строки Mallet удалось создать файл тем документа, используя параметр --output-doc-topics (> 150 ГБ).Любые предложения будут с благодарностью.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...