Power BI - прямой запрос в hadoop с миллионами записей - PullRequest
0 голосов
/ 04 ноября 2019

Я новичок в Power BI. Меня попросили сгенерировать отчеты Power BI для большого набора данных (в Hadoop), который затем будет опубликован в службе Power BI.

Я попытался подключиться к базе данных Hadoop с помощью коннектора ODBC (что сработало)но я не могу использовать его, так как мои данные имеют размер более 500 ГБ, и я не хочу импортировать все эти данные. Вместо этого я хотел бы использовать метод Direct-Query для извлечения данных.

Каким должен быть идеальный подход, поскольку запросы в Hadoop в режиме реального времени занимают много времени? Можно ли даже запросить Hadoop с помощью метода Direct-Query?

И как повлияет производительность системы, когда пользователь взаимодействует с визуализациями в отчете? (при условии, что размер данных большой)

...