Как использовать «группировать по» в Orange .. то есть я могу «группировать по» значениям таблицы? - PullRequest
0 голосов
/ 22 февраля 2019

Относительно платформы Orange Data Science Я не могу найти какой-либо метод для агрегатных функций в таблицах данных.То есть я хотел бы суммировать числа определенного категориального значения в наборе данных (например, сколько экземпляров определенного цветка).Есть ли способ сделать это, не прибегая к скрипту Python?Спасибо ..

1 Ответ

0 голосов
/ 02 мая 2019

Я не нашел в пользовательском интерфейсе способа сделать это, кроме скрипта на python - но хотел побудить вас рассмотреть возможность использования скрипта, потому что для панд это не требует много:

import pandas as pd
from Orange.data.pandas_compat import table_from_frame

#read file into Orange
newData = pd.read_csv('yourfile.tab', sep=chr(0x09))

#group data on categories in 'column'
grouped = newData.groupby('column')

#calculate the sum from the grouping, convert to Orange table and set to out_data
out_data = table_from_frame(grouped.sum())

Плюсы: открывает много возможностей для загрузки / манипулирования вашими данными

Минусы: подход работает только при загрузке файла с использованием python, так как я не определил, как преобразовать таблицу Orange в кадр данных pandas, чтобы онавместо этого можно использовать in_data.

...