Вы можете сделать это с помощью регулярного выражения.
$regex = '/\<.\>/';
было бы очень простым началом удалить что-либо с <
и >
вокруг него.Но для того, чтобы сделать это, вам нужно будет включить HTML как file_get_contents()
или какую-то другую функцию, которая превратит код в текст.
Добавление:
ЕслиВы также хотите, чтобы отдельные атрибуты извлекались, вам нужно будет написать более сложное регулярное выражение, чтобы вытянуть этот текст.Например:
$regex2 = '/\<.(?<=(title))(\=\").(?=\")/';
Извлекает (я думаю ... я все еще изучаю RegEx) любой текст между <
и title="
, при условии, что у вас не было других соответствующих выражений до заголовка.Опять же, это будет довольно сложный процесс регулярных выражений.