Я совершенно новичок в Datawarehouse, OLAP и hive. У меня есть единственный файл csv, содержащий обучающие данные об онлайн-рынке, таком как ebay (см. Данные в столбце). Моя задача - создать звездную схему в улье (через Data Analytics Studio, Spark или что-то еще).
Я построил измерение следующим образом:
Факт и размеры
Как я могу создать эти таблицы измерений и особенно сгенерировать новый идентификатор для каждой строки? Мой SELECT New_Guid(), listing_title, listing_subtitle, listing_type_code, start_price, buy_it_now_price, buy_it_now_listed_flag, qty_available_per_listing From auctions
, который я нашел в другом уроке. Но New_Guid()
вообще не работает в моей Data Analytics Studio.
Большое спасибо!