Похоже, ваш запрос xpath неверен. На основе URL-адреса, приведенного в примере кода, элемент формы должен быть удален из пути поиска.
Вот запрос xpath, который будет менее подвержен разрыву при изменении макета страницы.
//table[@id='proxylist-table']/tbody/tr/td[2]
Что касается номера порта. Автор этой страницы, должно быть, хотел, чтобы эта часть данных по какой-то причине не была очищена. Лучше всего сделать OCR.
Однако, одну вещь, которую вы можете сделать, это посмотреть на размер возвращаемого изображения, чтобы угадать номер порта. Например, я заметил, что все изображения, отображающие порт 80, имеют длину содержимого 406 или 411. Порт 8080 имеет размер 402 или 409. Изображения имеют два разных размера, чтобы сливаться с цветом строки. Если URL-адрес заканчивается на 1, у него будет белый фон, если он заканчивается на 0, он будет иметь светло-серый фон и всегда будет на несколько байтов больше. У этого подхода есть очевидные недостатки, но он может работать.