Я пытался проанализировать сгенерированную php веб-страницу (не сайт) в течение некоторого времени.Я попытался разобрать, используя xpath через HTMLAgility в C #, а также PHP.Сначала я подумал, что неправильно анализирую из-за неверных значений.
Позже я обнаружил, что на самом деле я его правильно анализирую.Но на этой странице есть скрипт, который меняет значение при загрузке.как, я не знаю.
Я новичок в разборе, поэтому вот что происходит со мной:
Я загружаю исходный код контента,Часть, которую я хочу проанализировать, выглядит примерно так:
<b id="solved_b">0</b>
При загрузке страницы скрипт в исходном коде изменяет значение на значение, отличное от 0.
Когда я анализирую с использованием xpath, вместо измененного значения скрипта анализируется исходное значение, то есть 0.
Итак, как мне проанализировать измененноезначение вместо исходного?
страница, которую я пытаюсь проанализировать: http://felix -halim.net / uva / hunting.php? id = 59756
Вот фрагмент кода в HTMLAgility:
using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using HtmlAgilityPack;
namespace ParseFelix {
class WebParser {
string webUrl;
public WebParser(string url) {
webUrl = "http://felix-halim.net/uva/hunting.php?id=59756";
HtmlWeb htmlWeb = new HtmlWeb();
HtmlDocument htmldoc = htmlWeb.Load(webUrl);
var username = htmldoc.DocumentNode.SelectSingleNode("/html/body/div/h2/i");
var submittedStats = htmldoc.DocumentNode.SelectSingleNode(".//*[@id=\"submissions_b\"]");
string content = htmldoc.DocumentNode.InnerHtml;
//System.IO.File.WriteAllText("D:\\exp\\felix\\parsed.txt", content);
var acceptedStats = htmldoc.DocumentNode.SelectSingleNode(".//*[@id=\"solved_b\"]");
Console.WriteLine("Username is {0}, you submitted {1} solutions, and {2} were accepted", username.InnerText, submittedStats.InnerText, acceptedStats.InnerText);
}
}
}