Я думаю, что вы часто можете добраться до вступительного текста, взяв полную страницу, вычистив все таблицы, а затем ища первую последовательность блоков
...
после маркера.Этот последний бит будет следующим регулярным выражением:
/<!-- bodytext -->.*?(<p>.*?<\/p>\s*)+/
С опцией .S, чтобы сделать.соответствовать новым строкам ...