Мы используем вариант 2 по ряду причин.
1) Мы пытаемся смоделировать взаимодействие с пользователем во время тестирования (отключение обновления имитирует отклонение от нормы)
2) Скорее обнаружит дефект в последнем раунде тестирования, чем пользователи сообщат о них
3) Я не могу вспомнить время, когда у нас возник серьезный дефект при тестировании таким способом. Как уже упоминал Мэтт, весьма маловероятно, что их обновления нарушат важные функции.
Чтобы помочь снизить часть этого риска, мы стараемся использовать селен для нашего основного тестирования функциональной автоматизации для постоянного тестирования различных браузеров. Это не все, но, по крайней мере, найдет большие проблемы (например, отсутствующий столбец). Это также помогает быть гибким в этих вещах. Мы можем выпускать по любому необходимому графику (ежемесячно, еженедельно, ежедневно, если необходимо), поэтому, если серьезная проблема найдена, мы можем исправить ее в тот же день.