Как я могу разобрать живой HTML с веб-сайта и извлечь конкретную информацию и сохранить ее в базе данных с Visual Basic - PullRequest
1 голос
/ 31 декабря 2011

Информация, которую мне нужно извлечь, отформатирована:

<TD><A HREF="http://xxxxx.com/xxxxxx/index.html"><IMG SRC="../xxxxx/thumbnails/xxxxx.jpg">    </A></TD>
<TD>=== <B><A HREF="http://xxxxxxxxx.com/xxxxxxxx/index.html">LINE 0</A></B> ===<BR>
<FONT SIZE="2" COLOR="#400080">
Line 1<BR>
Line 2<BR>
Line 3
</FONT>
</TD>

как извлечь информацию между TD === и / a и строкой 1,2 и 3 и сохранить ее в базе данных с живого веб-сайта

Ответы [ 2 ]

2 голосов
/ 31 декабря 2011

Похоже, вы ищете информацию о том, как очистить сайт.Есть много инструментов, которые могут помочь вам в этом, возможно, вы могли бы начать здесь: просмотр веб-страниц с использованием Visual Basic (blogs.msdn.com)

0 голосов
/ 31 декабря 2011

Если вы хотите использовать PHP, вот встроенная функция PHP.

Вы можете использовать следующую функцию, и она даст вам строку между ===

<?php
    preg_match_all("/===(.*)===/", $source, $matches);
?>

$ source это ваш html, а $ match вернет вам массив возможных строк.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...