моделирование хранилища данных мультиязычное - PullRequest
0 голосов
/ 22 февраля 2019

Мне нужна ваша помощь.

Я работаю в исследовательской компании и отвечаю за создание ее архитектуры и моделирование хранилища данных, которое анализирует результаты международного опроса (50 стран).

Для архитектуры мы решили создать табличную модель в PowerBI для анализа наших данных и создания наших отчетов.Ниже приведена модель, как я думал:

enter image description here

Однако у меня возникла проблема с дизайном.

Поскольку опрос является международным,формулировка моих измерений отличается от страны к стране.

Мой 1-й вопрос: - Будет ли более целесообразным создать только одну встроенную модель PowerBI для всех стран или 50 отчетов PowerBI?

Мой второй вопрос: Моя модель должна быть многоязычной. В моих 50 странах у меня есть несколько языков (5 языков), и для одного и того же языка у меня есть несколько вариантов.

Британские английские метки отличаются от американских английских меток.

Например, для измерения Response для Франции IdReponse = 1 имеет формулировку «Vrai», в то время как для США - «True», а для Британии - «True».«ОК».

Знаете ли вы, как моделировать многоязычность в хранилище данных?

Ответы [ 2 ]

0 голосов
/ 22 февраля 2019

О вопросе № 1: Да, вам нужна только одна модель данных.

О вопросе № 2: Вы загружаете вопрос на языке, на котором он задается, и ответ, который вы получаете, как есть, в ответном DIM.Вы должны создать новый столбец в вашем DIM ответа, такой как Clean_response, где вы преобразовали исходный ответ в унифицированное значение.например, «Vrai», «OK», «True» имеют то же значение, поэтому вы можете выбрать «Да» в столбце «Чистая_ответ».Вы также можете преобразовать различные варианты «Нет», «Нада», «noops», «Нах» в чистое значение «Нет», но также сохраните исходное значение.

Пометка столбца в отчетедолжен быть обработан в коде отчета.Например, при написании отчета на французском языке следует использовать имя dim столбца «Question» и указывать его как «interroger» в качестве заголовка отчета.

0 голосов
/ 22 февраля 2019

О вопросе № 1 - Всегда лучше, если есть только одна модель.Это будет намного легче поддерживать.Из вашего вопроса не ясно, будут ли эти 50 отчетов показывать одни и те же данные (исключая интернационализацию текстов, таких как Vrai / True / OK), или в каждом отчете / стране должно быть свое подмножество данных.В случае, если во всех отчетах будут отображаться одни и те же данные, определенно будет лучше создать одну общую модель и использовать ее во всех отчетах.Это можно сделать с помощью Power BI, сделав один «основной» отчет и опубликовав его, а затем остальные ваши отчеты «по стране» используют его в качестве источника данных .И вам понадобятся отдельные отчеты для каждой страны, потому что вам нужно будет переводить тексты (имена столбцов, статические тексты и т.в базе, это зависит от вас).Значение ключа (1) будет связано с ключом таблицы, и для каждого языка будут столбцы.В зависимости от языка текущего отчета, вы выберете соответствующий столбец (например, французский, британский и т. Д.), И даже вы можете использовать, скажем, американский английский, в случае, если для текущего языка не введен перевод (например, путемвычисляемый столбец).Также есть возможность создать отдельную таблицу поиска для каждого языка, но я думаю, что поддерживать такой способ будет более громоздким.

...