У меня есть интересная задача создания базы данных, которая импортирует данные из примерно 500 различных источников.
Каждый источник имеет свою собственную схему, и многие очень разные. Однако все они являются данными об общем объекте.
Моя первая мысль - это типичная схема сущности / атрибута / значения, однако после преобразования денормализованного импорта из одного источника (550 тыс. Строк) в AEV у меня получается 36 миллионов строк в таблице Attribute_Value. При правильных индексах это все еще очень быстро, но пока это только один из 500 источников импорта.
Я не думаю, что это будет масштабироваться, однако это обеспечивает очень хорошее логическое разбиение, нам не нужно объединять источники импорта, поэтому мы можем построить (теоретически) около 50 отдельных баз данных.
Я ищу людей, которые работали с массивными источниками данных, и их опыт работы с вещами, когда количество строк исчисляется сотнями миллионов.