Я реализую статистический алгоритм, который требует доступа к большому выборочному набору данных для правильного тестирования. Большой размер - 50 000 строк в одной таблице, MySQL.
Я бы хотел использовать традиционные методы RSpec для тестирования, но создание набора образцов и загрузка его в БД приводит к двум проблемам.
- Очень медленно / интенсивно с использованием Active Record create. Я не исследовал различные варианты создания, чтобы пропустить проверку, так как модели довольно простые, и я предполагаю, что это не будет иметь большого значения для скорости
- Неправильная очистка с использованием хаки
mysqlimport
(имеется в виду данные, оставленные в базе данных после теста, несмотря на явный вызов DatabaseCleaner в блоке: after)
Создание графа объектов в памяти возможно, но я не боюсь, что я немного боюсь переопределить функциональность AR.
Есть идеи, лучшие практики?
Спасибо!
Джастин