Я пытаюсь удалить таблицу со страницы Википедии Ссылка .
Я получаю сообщение об ошибке при создании фрейма данных, потому что при выводе каждого столбца я получаю тег / n, чтобы сохранить в csv
Пример: выход строки 1 равен
', Navi Peth \ n, Briti sh администрация \ n, 1818 + \ n, Navi (маратхи: новый) \ n'
Я не понимаю, почему я получаю это \ n и как его удалить. Я думаю, что в результате этого \ n я получаю ошибку при создании фрейма данных:
Ошибка токенизации данных. C ошибка: Ожидается 1 поле в строке 2, видел 2
мой код:
import requests
from bs4 import BeautifulSoup
import pandas as pd
page1 = requests.get('https://en.wikipedia.org/wiki/Peths_in_Pune').text
soup1 = BeautifulSoup(page1, 'lxml')
table = soup1.find('table',{'class':'wikitable sortable'})
#table
table1=""
for tr in table.find_all('tr'):
row1=""
for tds in tr.find_all('td'):
row1=row1+","+tds.text
table1=table1+row1[1:]
row1
', Нави Пет \ n, Брити sh администрация \ n, 1818 + \ n, Navi (маратхи: новый) \ n '
далее:
file=open("data1.csv","wb")
file.write(bytes(table1,encoding="ascii"))
df = pd.read_csv('data1.csv', header=None)
df
Ошибка токенизации данных. C ошибка: Ожидается 1 поле в строке 2, пила 2
PS: я хочу получить первый столбец из вики-таблицы