Я не знаю, есть ли у вас предпочтения для определенных языков, но в Python также есть пакет для определения языка, называемый langdetect
Он основан на автоматическом определении языка Googles ипо умолчанию поддерживает 55 языков.
Вы можете установить его с помощью
pip install langdetect
, а затем, например, запустить
from langdetect import detect
detect("War doesn't show who's right, just who's left.")
detect("Ein, zwei, drei, vier")
Вернет 'en' и 'de'соответственно.
Это все равно потребует от вас доступа к тексту сайта, например, через что-то вроде пакета запросов