Я использую Orange (в Python) для некоторых задач интеллектуального анализа данных.Более конкретно, для кластеризации.Несмотря на то, что я прошел учебник и прочитал большую часть документации, у меня все еще есть проблема.Все примеры в документах и руководствах предполагают, что у меня есть таблица с разделителями табуляции с данными в ней.Тем не менее, ничего не говорится о том, как можно создать новую таблицу с нуля.Например, я хочу создать таблицу частот слов в разных документах.
Может быть, я что-то упускаю, поэтому, если у кого-то есть понимание, это будет оценено.
Спасибо, Джордж
РЕДАКТИРОВАТЬ:
Вот как я создаю свою таблицу
#First construct the domain object (top row)
vars = []
for var in variables:
vars.append(Orange.data.variable.Continuous(str(var)))
domain = Orange.data.Domain(vars, classed) #The second argument indicated that the last attr must not be a class
#Add data rows assuming we have a matrix
t = Orange.data.Table(domain, matrix)