В основном это размер таблицы.
Я предполагаю, что здесь вы будете использовать плагин Oracle innoDB для mysql в качестве движка. Если вы этого не сделаете, это, вероятно, означает, что вы используете коммерческий движок, такой как infiniDB, InfoBright для Tokutek, и в этом случае ваши вопросы следует направлять им.
InnoDB становится немного неприятным с очень большими таблицами. Рекомендуется разбить ваши таблицы, если это вообще возможно, на очень большие экземпляры. По сути, если ваши (часто используемые) индексы не все вписываются в оперативную память, вставки будут очень медленными, так как они должны касаться большого количества страниц, не принадлежащих оперативной памяти. Это нельзя обойти.
Вы можете использовать функцию разбиения MySQL 5.1, если она делает то, что вы хотите, или разбивать ваши таблицы на уровне приложения, если это не так. Если вы можете сделать так, чтобы индексы ваших таблиц вписывались в оперативную память, и загружать только одну таблицу за раз, то вы выиграли.
Вы можете использовать сжатие плагина, чтобы заставить ваш оперативный диск идти немного дальше (поскольку страницы сжимаются как в оперативной памяти, так и на диске), но это не может преодолеть фундаментальное ограничение.
Если индексы вашей таблицы не все (или, по крайней мере, БОЛЬШИНСТВО - если у вас есть несколько индексов, которые в 99,99% случаев имеют значение ПУСТО (NULL), которые вы можете обойтись без них) вписываются в оперативную память, скорость вставки будет плохой.
Размер базы данных не является большой проблемой, если ваши таблицы по отдельности помещаются в оперативную память, пока вы выполняете массовую загрузку (и, конечно, вы загружаете только одну сразу).
Эти ограничения действительно встречаются в большинстве баз данных на основе строк. Если вам нужно больше, рассмотрите базу данных столбцов.
Infobright и Infinidb используют ядро на основе mysql и являются движками на основе столбцов, которые могут обрабатывать очень большие таблицы.
Токутек тоже довольно интересен - вы можете связаться с ними для оценки.
Когда вы оцениваете пригодность двигателя, убедитесь, что загружаете его очень большими данными о серийном оборудовании. Нет смысла тестировать его с (например) базой данных 10G, это ничего не доказывает.