У меня есть CSV-файл, в котором токены представлены в виде столбцов, а документы - в виде строк, а остальные ячейки представляют собой целые числа, представляющие частоту терминов. Я пытаюсь использовать это в качестве входных данных для Orange 3, но Orange 3, похоже, не готов обрабатывать матрицу терм-документа в качестве входных данных. Есть ли что-то, чего мне не хватает?
Редактировать 1: Я пытаюсь выполнить топи c моделирование (иерархическая обработка дирихле и скрытое выделение дирихлета, чтобы указать c).