Поскольку вы указали, что с Python3 у вас все в порядке, я бы предложил следующие шаги:
Скачать Anaconda
Скачать Anaconda Python для вашей ОС
По более широкому мнению, Anaconda имеет лучшую встроенную поддержку науки данных и поиска данных Вы будете загружать Python 3.7, который предоставляет вам все функциональные возможности (пара изменений) Python 2.7, без головной боли. Что важно для вашего случая, так это то, что python 2.7 является проблемой при работе с utf-8 Это исправит многие из этих проблем:
Установите свои библиотеки
После установки Anaconda (и после того, как вы настроили conda.exe в системную переменную PATH , что занимает 2 минуты , если вы отказались от нее во время установки), вам нужно будет установить ваши пакеты. Судя по вашему сценарию, это будет выглядеть примерно так:
conda install mechanize,bs4,requests,lxml -y
Будьте терпеливы - это может занять 2-10 минут для conda, чтобы "решить вашу среду" перед установкой чего-либо.
Анализ ваших данных с помощью Pandas
Здесь вы можете попробовать 2 варианта, и они зависят от того, насколько вам повезло с форматированием HTML, который вы просматриваете
import pandas as pd # This can go at the top with the other imports.
Использование pandas.read_html ()
response = browser.open(internal_url)
html = response.read().decode('utf-8').encode('utf-8')
df = pd.read_html(html)
print(df) # This should give you a preview of *fingers-crossed* each piece of data in it's own cell.
pd.to_csv(df,"naturalgasintel.csv")
Использование pandas.read_data ()
response = browser.open(internal_url)
soup = BeautifulSoup(str(innerHTML.encode('utf-8').strip()), 'lxml')
# If your data is embedded within a nested table, you may need to run soup.find() here
df = pd.DataFrame.from_records(soup)
print(df) # This should give you a preview of *fingers-crossed* each piece of data in it's own cell.
pd.to_csv(df,"naturalgasintel.csv")
Надеюсь, это поможет! Pandas - это фантастическая библиотека для интуитивного анализа ваших данных.