Нет встроенной поддержки для чтения большинства файлов этих типов. HTML - это простой текст, поэтому вы можете использовать System.IO/StreamReader для его чтения, но вы должны проанализировать его самостоятельно.
Существуют сторонние компоненты, которые будут читать эти типы файлов, но я не уверен, есть ли один полностью охватывающий компонент.
Я полагаю, что для PDF iTextSharp позволяет читать.
Для RTF / Word вы можете использовать Первичные сборки взаимодействия