HTML в текст, такой как BeautifulSoup Python - PullRequest
0 голосов
/ 06 июня 2019

У меня есть программа на Python, которая выдает следующие данные:

from bs4 import BeautifulSoup

html = `<h1>This is heading</h1> <p>this is parah <strong>strong</strong> that\'s how it works</p>`

parsed_html = BeautifulSoup(html, 'html.parser')
all_lines = parsed_html.findAll(text=True)
print(all_lines)

# ['This is heading', ' ', 'this is parah ', 'strong', " that's how it works"]

Я пытаюсь добиться того же в golang, но не могу получить требуемый результат.пока что попробовал:

import (
    "fmt"
    "strings"
    "github.com/PuerkitoBio/goquery"
)

func parseHTML(body string) string {

    p := strings.NewReader(body)
    doc, _ := goquery.NewDocumentFromReader(p)

    fmt.Println(doc.Text()) 

    // output: This is heading this is parah strong thats how it works

}

1 Ответ

0 голосов
/ 16 июля 2019

Выглядит просто, если вы можете реализовать функцию самостоятельно.

Просто удалите все теги "..." и продолжайте добавлять "..."

Это даст вам то же самое, что и вывод Python.

...