Использование XPath для webscrape.
Структура:
<table>
<tbody>
<tr>
<th>
<td>
но один из этих тр содержит только один или один тд.
<table>
<tbody>
<tr>
<th>
Так что я просто хочу очистить, если TR
содержит два тега внутри. Я даю путь
$route = $path->query("//table[count(tr) > 1]//tr/th");
или
$route = $path->query("//table[count(tr) > 1]//tr/td");
Но это не работает.
Я даю ссылки на порядковый стол здесь. Последние два TR первого стола имеют только один TD. Это вызывает проблему. И 2-я или 3-я таблица имеет ту же проблему.
https://www.daiwahouse.co.jp/mansion/kanto/tokyo/y35/gaiyo.html
$route = $path->query("//tr[count(*) >= 2]/th");
foreach ($route as $th){
$property[] = trim($th->nodeValue);
}
$route = $path->query("//tr[count(*) >= 2]/td");
foreach ($route as $td){
$value[] = trim($td->nodeValue);
}
Я пытаюсь выбрать TH и TD одновременно. НО, если TR содержит один TD, то это порождает проблему. Потому что в счетах и TD и TH не совпадают, я соскребаю больше TD, чем TH