Посмотрите на http://java -source.net / open-source / html-parsers для получения списка библиотек Java, которые разбирают HTML-файлы в объекты Java, которыми можно манипулировать.
Если html-файлы, с которыми вы работаете, хорошо сформированы (xhtml), то вы также можете использовать библиотеки XML в java для поиска определенных тегов и их изменения. Сам IO должен обрабатываться конкретными библиотеками, которые вы используете.
Если вы решите вручную анализировать строки, вы можете использовать регулярные выражения для поиска определенных тегов и использовать библиотеки java io для записи в файлы и создания новых HTML-документов. Но этот метод, так сказать, заново изобретает колесо, потому что вам нужно управлять открытием и закрытием тегов, и все эти вещи обрабатываются уже существующими библиотеками.