Вы не делаете ничего плохого.Firefox фокусирует корневой элемент, чтобы пользователь, который просто использует клавиатуру, мог прокручивать iframe, если он этого хочет.Например, если бы фокус был направлен непосредственно на первый текстовый ввод, пользователь не смог бы прокрутить рамку.
И действительно, именно это происходит в Chrome.Если в подкадре нет текстовых элементов управления, пользователь может прокрутить его после перехода на него.Если у него есть текстовые элементы управления, пользователь облажается, если хочет прокрутить.
Для чего он стоит, я просто сообщил об этом как https://bugs.webkit.org/show_bug.cgi?id=79558, потому что это похоже на явную ошибку доступности ...