У меня есть строка HTML, и я хотел бы сделать некоторое форматирование текста на ее чистом текстовом содержимом. Я имею в виду, я хотел бы извлечь что-нибудь, что является текстом и не включено в фигурные скобки. Но ... Я планировал использовать DOMDocument, но я не знаю ни тегов, которые я ищу, ни их идентификатора.
Например, я могу иметь эту строку
<p><i>some tex<span class="aclass">t</span> in the document.</i>Whoooa <img src="anImage.png" /></p>
И я хотел бы отформатировать строку «некоторый текст в документе. Например, поставить пробел после точки и удалить конечный пробел.
Как бы я это сделал?