Что такое измерение в данных? - PullRequest
0 голосов
/ 07 мая 2018

Предположим, у меня есть набор данных, как на картинке ниже.Вопрос в том, какой размерности здесь строки или столбцы?

demo_data.png

1 Ответ

0 голосов
/ 09 мая 2018

Для алгоритма кластеризации, который вы предлагаете в комментариях, каждая строка должна представлять точку. Эта точка находится в пространстве, которое имеет некоторую размерность, характеризуемую количеством столбцов. Итак, у вас есть четыре точки (Row1, Row2, Row3, Row4) в четырехмерном пространстве. Когда вы читаете о «размерности» в контексте науки о данных, речь идет о количестве атрибутов для каждой точки данных, а не о количестве точек данных. Это отдельно от представления данных, например, в виде двумерного массива.

...