Как правило, чтобы прочитать файл, пока не будет достигнут определенный символ, вы используете std::getline
и задаете второй параметр для вашего терминатора, так что если вы читаете до символа «<», вы можете сделать </p>
std::getline( infile, str, '<' );
затем вы можете сделать то же самое с >
символом
В вашем случае, если вы анализируете HTML, то, вероятно, для него уже есть определенные парсеры.Я думаю, что HTML1.1 совместим с XML, но HTML1.0 не так, как не всегда было необходимо закрывать все ваши теги, поэтому синтаксический анализатор XML не обязательно будет работать.
Вы должны предположить, что открыт изакрывающие теги не являются частью комментариев или цитируемого текста, и методология, которую я описал выше, не обещает вам, что вам понадобится полный конечный автомат.