Я пытаюсь написать некоторый код для получения файла списка экземпляров Mallet в матрицу тем документа в R. Для этого я прочитал файл списка экземпляров в переменную тренера тем под названием 'topic.model'.Ниже приведен вызов функции, которую я выполняю для создания матрицы тем документа в R:
theta <- mallet::mallet.doc.topics(topic.model, smoothed = TRUE, normalized = TRUE)
Я получил эту работу для меньшего файла списка экземпляров (<1 ГБ), но для большего списка экземпляров (~ 15 ГБ)) Я получаю следующую ошибку: </p>
Ошибка в .jcall (обертка, "[D", "flat_double"):
java.lang.NegativeArraySizeException
Вызовы: myfunc ....jevalArray -> newArray -> Structure -> .jcall -> .jcheck
Выполнение остановлено
Я подозреваю, что где-то существует целочисленное переполнение, в котором превышен INT_MAX
, иNegativeArraySizeException
происходит.Интересно, что с помощью командной строки Mallet
удалось создать файл тем документа, используя параметр --output-doc-topics
(> 150 ГБ).Любые предложения будут с благодарностью.