Гораздо проще извлечь информацию из XML-версии сайта.
Если вы сделаете запрос к URL-адресу, подобному этому (только с допустимым именем символа), вы получите XML-документ, который можно использовать для синтаксического анализа XML, чтобы легко извлечь данные.
http://eu.wowarmory.com/character-sheet.xml?r=Nordrassil&cn=Someone
URL-адреса совпадают с теми, которые вы видите в своем веб-браузере.
Обратите внимание, что вы ДОЛЖНЫ установить в поле User Agent запроса значение для поддерживаемого браузера, который поддерживает версию файла XML, или вместо этого вы получите HTML обратно. Я использую «Mozilla / 5.0 Firefox / 2.0.0.1» в качестве пользовательского агента в моей программе, и он отлично работает.
О, также не делайте более нескольких запросов в секунду, или в среднем более одного запроса каждые 3 или 4 секунды, или сайт блокирует ваш IP на несколько часов ...