Я не понимаю, почему так важно, откуда приходит html, насколько это касается ваших юнит-тестов.
Для пояснения: ваш модульный тест обрабатывает html-контент, откуда этот контент не имеет значения, поэтому чтение его из файла подходит для ваших юнит-тестов. как вы говорите в своем комментарии, вы определенно не хотите подключаться к сети для каждого теста, поскольку это просто накладные расходы.
Вы также можете добавить один или два интеграционных теста для проверки правильности обработки URL-адресов (т. Е. Вы можете подключаться и обрабатывать внешние URL-адреса).