<html>
<head>
<title>My Headline</title>
<meta name="targetUrl" value="xyz.html?sym=abc"/>
<meta name="summary" value="A & B"/>
</head>
<body>
abc abc, pqr, xyz, rst tsd, prrrr, qqqqqqq, oooooo, opop opop, rtrttrt rtrtrtrt
</body>
</html>
Тег body должен быть изменен на csv, поэтому выходные данные должны быть такими:
abc abc, pqr, xyz, первый tsd, prrrr, qqqqqqq, oooooo, opop opop, rtrttrt rtrtrtrt
если я попробую @ решение Джима
Исключение при синтаксическом анализе происходит для мета-тегов, так как они имеют специальные символы