Типичные данные машинного обучения состоят из измерений или событий, которые можно интерпретировать как отдельную таблицу фактов .
Числовые атрибуты (такие как price
или points
) являются атрибутами измерения таблицы фактов .
Атрибуты factor (или time ) (такие как country
, province
или tester_name
) представляют собой внешние ключи для таблицы размеров .
Размеры не содержатся в ваших данных, но их можно косвенно восстановить с помощью клавиш distinct
.