Проблема тестирования с реальными данными заключается в том, что они содержат много повторяющихся значений и недостаточно краевых случаев. Также трудно понять, какими должны быть ожидаемые значения (особенно если ваша живая база данных очень большая). Да, и в зависимости от того, что делает живое приложение, использование данных для целей тестирования или разработки может быть незаконным.
Как правило, лучше всего писать тестовые данные для проведения тестов. Это трудоемко и скучно, поэтому многие практикующие TDD ненавидят базы данных. Но если у вас есть действующий набор данных (который вы можете использовать для тестирования), тогда возьмите очень урезанный поднабор данных для ваших тестов. Если вы можете написать действительные утверждения для набора данных из тридцати записей, выполнение ваших тестов для набора данных из тридцати тысяч - просто трата времени.
Но определенно, как только вы получите запросы, возвращающие правильные результаты, выполните запросы через некоторые тесты производительности.