Это не связанный с robots.txt ответ, он связан с протоколом Robots в целом, и в прошлом я очень часто использовал эту технику, и она работает как чудо.
Насколько я понимаю, ваш сайт динамичный, так почему бы не использовать метатег robots ? Как сказал x0n, файл размером 30 МБ, вероятно, создаст проблемы как для вас, так и для сканеров, а добавление новых строк в файлы размером 30 МБ - это головная боль ввода-вывода.
В любом случае, на мой взгляд, лучше всего вставлять на страницы, которые вы не хотите, индексированные, что-то вроде:
<META NAME="ROBOTS" CONTENT="NOINDEX" />
Страница все равно будет сканироваться, но она не будет проиндексирована. Вы по-прежнему можете отправлять карты сайта с помощью ссылки на карту сайта в файле robots.txt, вам не нужно остерегаться, чтобы не включать в страницы карты сайта, на которых есть метатег, и это поддерживается всеми основными поисковыми системами, насколько я помню и по Baidu.