Модель базы данных качества данных - PullRequest
1 голос
/ 05 февраля 2011

Нужен пример модели базы данных, которая будет присоединена к базе данных для качества данных.Наилучшей формой ответа будет, по крайней мере, DDL, исполняемый в MySQL;с другими DDL RDMS все в порядке, я просто опубликую еще один вопрос с просьбой о переносе кода.

Хорошим объяснением будет огромный плюс.

Вопросы, комментарии, отзывы и т. д.- просто комментарий, спасибо !!

1 Ответ

1 голос
/ 06 февраля 2011

Самой большой проблемой является определение значимых показателей качества. Это так сильно зависит от приложения, я сомневаюсь, что кто-нибудь сможет вам очень помочь. (По крайней мере, не намного больше информации - возможно, больше, чем вы можете дать.)

Но, допустим, ваше приложение записывает наблюдения за птицами отдельными людьми. (Я просто выбрасываю это вместе с макушки головы. Прочтите это для сути, и ожидайте, что детали рухнут под пристальным вниманием.)

  • некоторым видам даже новичку трудно ошибиться
  • эксперту сложно разобраться в некоторых видах
  • способность конкретного человека меняется нерегулярно с течением времени (хорошие дни, плохие дни)
  • люди обычно становятся более квалифицированными со временем
  • вы, возможно, обладаете высокой квалификацией в идентификации ястребов и полностью отстой в идентификации чаек
  • люди склонны к внушению (с кем они имеют значение в их надежности)

Итак, чтобы оценить качество идентификации, вы можете попытаться записать много информации, помимо наблюдения «3 красных ястреба в Кейп-Мей 5 февраля 2011 г. в 16:30». , Вы можете попробовать записать

  • погода
  • освещение
  • температура (некоторые птички сосут на морозе)
  • часов в поле (некоторые птички сосут через 3 часа или после 20 холодных минут)
  • имена других присутствующих
  • средняя сложность правильно выявление краснохвостых ястребов
  • вероятность того, что этот человек мог правильно определить красные хвосты в этих полевых условиях
  • употребление алкоголя

Хотя это может быть «мета» для полевых птиц, для дизайнера базы данных это просто данные. И вы будете разрабатывать таблицы так же, как вы разрабатывали бы их для любого другого приложения. (Во всяком случае, так я и сделал.)

...