HTML-очиститель для веб-почты - PullRequest
0 голосов
/ 23 февраля 2019

Я работаю над небольшим клиентом веб-почты.Для безопасного внедрения html я хочу использовать HTML Purifier (кстати: это хорошая идея?).

Я проверил его с несколькими электронными письмами и некоторыми проблемами.В одном письме (от Google) есть что-то вроде этого:

<table width="100%" border="0" cellspacing="0" cellpadding="0">
<tbody>
<tr>
<td width="4%">
<td width="92%" style="padding-top:18px; padding-bottom:10px; opacity:0.7">
<table width="100%" border="0" cellspacing="0" cellpadding="0">
<tbody>
<td width="30%">
<img style="display:inline-block;" height="26" src="https://www.gstatic.com/local/guides/email/images/photo-impact/googlelogo_light_clr-f040d5d9.png">
<td>
<td width="70%" style="text-align:right">
</td>
</tbody>
</table>

Преобразуется в:

<table width="100%" border="0" cellspacing="0" cellpadding="0">
<tr>
<td width="4%">
</td><td width="92%" style="padding-top:18px;padding-bottom:10px;opacity:.7;">
</td><td width="30%">
<img style="display:inline-block;" height="26" src="https://www.gstatic.com/local/guides/email/images/photo-impact/googlelogo_light_clr-f040d5d9.png" alt="googlelogo_light_clr-f040d5d9.png">
</td><td>
</td><td width="70%" style="text-align:right;">
</td>
</tr></table>

Я не знаю, почему он удаляет второй тег <table> (также он закрываетсянеправильно <td> и удаляет <tbody>).Можно ли изменить HTML-очиститель, чтобы он работал в таких ситуациях?

...