Исходя из вашего примера страницы (metacritic.com/film/highscores.shtml), я бы сказал, что вам нужно использовать:
//TABLE[@CLASS="index"]
(or /descendant::TABLE[@CLASS="index"])
Это потому, что таблица TABLE with CLASS написана в верхнем регистре на странице примера (XML и XPath чувствительны к регистру).
Это будет работать, если вы нацеливаетесь на определенную страницу, но, вероятно, станет проблемой, если разные страницы используют разные регистры для одинаковых HTML-тегов.
Тогда вам понадобится мерзость, подобная
//TABLE[@CLASS="index" or @class="index" or @Class="index" or ...]
|//table[@CLASS="index" or @class="index" or ...]
|...
Так что вам, вероятно, придется продолжать использовать Tidy, прежде чем извлекать информацию, или переключиться на инструмент, специализирующийся на очистке HTML (вместо XPath)