У меня проблемы с получением этих данных:
<tr>
<td><span class="bodytext"><b>Contact:</b><b></b></span><span style='font-size:10.0pt;font-family:Verdana;
mso-bidi-font-family:Arial'><b> </b>
<span class="bodytext">John Doe</span>
</span></td>
</tr>
<tr>
<td><span class="bodytext">PO Box 2112</span></td>
</tr>
<tr>
<td><span class="bodytext"></span></td>
</tr>
<!--*********************************************************
-->
<tr>
<td><span class="bodytext"></span></td>
</tr>
<tr>
<td><span class="bodytext">JOHAN</span> NSW 9700</td>
</tr>
<tr>
<td><strong>Phone:</strong>
02 9999 9999
</td>
</tr>
По сути, я хочу получить все после "Контакт:" и до "Телефон:" минус HTML; однако эти два обозначения могут существовать не всегда, поэтому мне нужно по-настоящему захватить все, что находится между двумя двоеточиями (:), а не в теге HTML.
Число <span class="bodytext">***data***</span>
может на самом деле варьироваться, поэтому мне нужен какой-то цикл для их сопоставления.
Я предпочитаю использовать регулярные выражения, поскольку я мог бы , вероятно, делать это, используя циклы и совпадения строк.
Кроме того, я хотел бы знать синтаксис для несоответствующих групп в регулярном выражении PHP.
Любая помощь будет принята с благодарностью!