Как хранить очищенные и необработанные данные в базе данных? - PullRequest
2 голосов
/ 06 мая 2011

Необработанные данные хранятся в базе данных (несколько таблиц). это должно быть вручную проверено и исправлено. Проверенные данные должны храниться в базе данных вместе с необработанными данными. В таком случае, будет ли хорошей идеей создать две отдельные базы данных (например, raw_data и checked_data)? Или должна быть только одна база данных? Спасибо

Ответы [ 3 ]

0 голосов
/ 06 мая 2011

Здесь нет рекомендуемого метода, кроме ваших собственных предпочтений.Вы можете хранить очищенные данные с необработанными данными в одной и той же базе данных, но в разных таблицах, и к таблицам необработанных данных можно добавить что-то вроде raw_.

В противном случае вы можете иметь отдельную базу данных для каждого типа данных.Преимущество будет разделение, когда недостаток будет более дорогим, присоединиться и т. Д., Если это необходимо сделать между этими двумя.

0 голосов
/ 06 мая 2011

Вообще говоря, гораздо проще работать в одном экземпляре, чем в нескольких.Распределенные транзакции работают медленнее.Они требуют большего набора текста (всегда нужно добавить ссылку на базу данных).Это не просто вопрос удобства, но и целостности.Возможно, вы захотите убедиться, что данная запись находится либо в наборе данных RAW, либо в наборе данных CLEANSED, но не в обоих.Проверка такого рода вещей более управляема в одной базе данных.

Способ организации вещей в одной базе данных зависит в некоторой степени от выбранной вами разновидности СУБД и от того, что она поддерживает.Вы можете иметь одну схему (учетную запись пользователя) и использовать соглашение об именах, такое как префикс, например RAW_TABLE_1 и CLEAN_TABLE_1.Или вы можете использовать разные схемы, которые позволят вам сохранить одно и то же имя таблицы, например, RAW_USER.TABLE_1 и CLEAN_USER.TABLE_1.Оба подхода имеют свои преимущества.Всегда хорошо иметь постоянное напоминание о том, работаем ли мы с необработанными или чистыми данными.С другой стороны, у нас могут быть инструменты или приложения, которые мы хотели бы использовать, которые ожидают обычных имен таблиц.Синонимы могут помочь в этом отношении.

0 голосов
/ 06 мая 2011

Если ваши необработанные данные и проверенные данные будут очень громоздкими, используйте только две разные базы данных

С нормализацией и с помощью процедур вы можете поддерживать его в одной базе данных.

...