Прежде всего, BLOB - это Двоичный Большой ОБЪЕКТ. HTML - это текстовый формат, который не требует декодирования, кроме одной из нескольких кодировок Unicode. Современные текстовые программы и / или браузеры должны обнаруживать любую такую кодировку текста и отображать результаты в виде веб-страницы и / или читаемого текста HTML. Если это не так, то, скорее всего, это не простая HTML-страница, как вы предполагаете.
Кстати, если это HTML-файл, зачем экспортировать имя файла с расширением .txt
?
Если данные действительно хранятся в двоичном виде, то их экспорт в виде текста, скорее всего, будет бесполезен. Экспортируйте его как двоичный файл, чтобы не было проблем с кодировкой текста. Если это действительно текстовый HTML, то все равно будет полезно экспортировать его в двоичном виде, чтобы каждый байт записывался без изменений. После этого вы сможете открыть его в средстве просмотра текста и / или браузере для просмотра HTML-страницы.
Но если он выглядит нечитаемым, то HTML-файл, по-видимому, кодируется каким-то другим способом, и можно только угадать формат, не проверяя первые несколько байтов. Получите двоичный шестнадцатеричный редактор и запишите первые 8 шестнадцатеричных байтов. Отредактируйте вопрос и опубликуйте эту информацию.
(Что касается второй части ... перекодировать ее. Что ж, этот вопрос, очевидно, должен касаться выяснения формата, его правильного сохранения и декодирования. - кодирование его в тот же формат и сохранение его в базе данных обязательно будет совершенно новым вопросом. Возможно, вы все равно захотите переосмыслить это, так как сравнение файла HTML путем его сначала преобразования в некоторый двоичный формат, вероятно, не очень полезно.)