Python - Как разбить текст на абзацы? - PullRequest
0 голосов
/ 19 июня 2020

Я хотел бы разбить текст на абзацы, когда я его очищаю. Мои коды ниже извлекают тексты без разделения на абзацы. Есть ли кто-нибудь, кто знает, как это сделать?

Вот мои коды.

#extract articles from url
import urllib.request, urllib.error
import requests as req
from bs4 import BeautifulSoup
import csv

num=0
atc={}
for i in range(len(url)):
    res = req.get(url[i]).content
    soup = BeautifulSoup(res, "html.parser")
    elems = soup.find(class_='meteredContent css-1r7ky0e').get_text()
    str=""
    str+=elems
    atc[i]=str

#Dataframeにしてcsv
import csv
import pandas as pd

st=pd.DataFrame(atc,index=['text',])


st.T.to_csv("articles.csv",encoding='utf_8_sig')

Вот текстовые данные, которые я получил из своих кодов. enter image description here

Должны быть абзацы. enter image description here

...