Как сканировать страницу на другом (человеческом) языке, предоставляемом этой страницей? - PullRequest
0 голосов
/ 03 февраля 2020

Извините, если название или текст не ясны, и приветствую каждый комментарий, предложение и / или издание.

Я самообучаюсь Python Сканирование в Интернете. Это страница, которую я хочу сканировать:

Страница результатов поиска от Amazon Japan

Я живу в Японии, мой системный язык - японский, и это Amazon Japan - так что, конечно, страница на японском языке.

Однако Amazon Japan предлагает возможность перевести сайт на английский язык sh:

Нажмите верхнюю левую кнопку меню, прокрутите вниз, есть настройка со значком флага страны, чтобы установить свой регион и над ним находится языковая настройка со значком глобуса, которая в настоящее время должна выглядеть как 日本語. Нажмите на него, и вы можете изменить весь сайт на Engli sh.

Это перенаправит вас на домашнюю страницу. В моем случае, пожалуйста, скопируйте и выполните поиск ネ ピ ア マ ス ク. Теперь вы видите, что это почти везде Энгли sh. Затем я пишу несколько строк кода в Python:

import urllib.request
import os

# URL of the page to be crawled. Copy-pasted from the browser
url = 'https://www.amazon.co.jp/s?k=%E3%83%8D%E3%83%94%E3%82%A2+%E3%83%9E%E3%82%B9%E3%82%AF&ref=nb_sb_noss'

# Create a new file in current directory, and write to it later
fpath = os.getcwd() + '/result.txt'
file = open(fpath, 'wb')

# Write the source code to the output file
response = urllib.request.urlopen(url)
file.write(response.read())

file.close()

. Здесь возникает проблема. Исходный код в выходном файле (открытый с помощью Atom) по-прежнему на японском языке. Он не содержит ни строки «Napier, Nose serebumasuku Normal Size 5 Pieces × 10 Set», ни одного вхождения «Napier», которое я вижу повсюду на странице, на которой я уже установил язык Engli sh ,

И если я проверяю исходный код с помощью Chrome, почти все в Engli sh - точно так же, как я вижу в режиме естественного просмотра. Почему?

Я уверен, что скопировал и вставил URL после изменения языка с японского на английский sh. Как получить исходный код Engli sh версии Amazon Japan?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...