Сравнение больших данных и озер данных, различий и сходств - PullRequest
0 голосов
/ 03 января 2019

Может кто-нибудь сказать мне сходства и различия между большими данными и озерами данных.

Не может найти удовлетворительного ответа нигде.

Ответы [ 3 ]

0 голосов
/ 22 марта 2019

Большие данные и озеро данных - это две разные вещи. Озеро данных - это концепция, в которой все ваши данные хранятся и легко доступны с использованием другого механизма. Озеро данных может поддерживаться на s3 или красном смещении или любой другой платформе хранения. Большие данные - это термин, используемый для обработки большого объема данных. В основном это были решения с большими данными, такими как Hadoop, Spark.

0 голосов
/ 06 июня 2019

Большие данные - это термин, используемый по-разному, его можно назвать даже модным словом.Часто он используется как собирательный термин для цифровых технологий, оцифровка , промышленность 4.0 и многие темы, связанные с цифровым преобразованием.

В менее общей интерпретации большие данные просто относятся к сложному, большому набору данных.Термин «большой» относится к трем измерениям (см. Википедия о больших данных )

  1. объем , то есть размер набора данных
  2. скорость , при которой создаются объемы данных
  3. разнообразие типов данных и источников

A Озеро данных относится к подходу к хранению больших данных .Другими возможностями хранения данных являются традиционная база данных, также называемая система управления реляционными базами данных (RDBMS) , с одной стороны, и хранилище данных , с другой стороны, см., Например, ДанныеОзеро против хранилища данных и базы данных: в чем разница?

0 голосов
/ 03 января 2019

Я думаю, мы не можем сравнивать и дифференцировать терминологию обоих, потому что озеро данных является синонимом больших данных.Озеро данных = данные предприятия + неструктурированные данные + данные полуструктуры.

С другой стороны, это хранилище данных, в котором вы можете хранить любые данные и использовать их для целей анализа.В основном данные будут храниться в Hadoop FileSystem (HDFS), где, как и в случае «больших данных», используется хранилище и некоторые другие технологии обработки.

...