масса данных?Что ж, вы можете считать, что все запросы Google, рассматриваемые как поток, содержат массу данных.
Массовые размеры?Представьте себе инженера Google, который рассматривает несколько тем, таких как «пятиногие собаки».Он может думать, что каждый пользователь представляет измерение, и вычислять некоторые корреляционные вещи.И там много пользователей.
Теперь, вернемся к сути, нет четких определений массовых данных или больших измерений.Однако вы можете учесть, что:
- Если у вас так много данных, что вы не можете загрузить все их в память (я говорю о жестком диске, а не только ОЗУ), это массовые данные
- Если ваши алгоритмы начинают терпеть неудачу из-за проклятия размерности, это высокая размерность.1.000.000 размеров, безусловно, большой размер.Вы часто можете считать, что 1.000 - это тоже высокое измерение.