У меня есть набор данных, хранящихся в массиве «numpy»:
array([['4.8', '3.0', '1.4', '0.3', 'Iris-setosa'],
['4.6', '3.2', '1.4', '0.2', 'Iris-setosa'],
['5.3', '3.7', '1.5', '0.2', 'Iris-setosa'],
['5.0', '3.3', '1.4', '0.2', 'Iris-setosa'],
['7.0', '3.2', '4.7', '1.4', 'Iris-versicolor'], dtype='<U15')
- это просто пример, я работаю не только с набором данных iris.
Я пытаюсь использовать Orange для дискретизации этих данных о продолжении.
Я знаю, что могу сделать что-то подобное, чтобы выполнить работу:
import Orange
iris = Orange.data.Table("iris.tab")
disc = Orange.preprocess.Discretize()
disc.method = Orange.preprocess.discretize.EqualFreq(n=3)
d_iris = disc(iris)
Однако этот метод работает только с таблицей данных Orange, а не с массивом numpy.
В любом случае можно ли использовать Orange для дискретизации данных, хранящихся в массиве numpy?