Удалите пустые строки при очистке с помощью Go -Colly - PullRequest
0 голосов
/ 26 февраля 2020

Я начинаю с Go и скребу с Колли. Может кто-нибудь помочь мне с удалением пустых строк из вывода? Это мой код:

package main

import (
    "fmt"

    "github.com/gocolly/colly"
)

func main() {
    c := colly.NewCollector()
    c.OnHTML("table > tbody", func(e *colly.HTMLElement) {
        fmt.Println(e.Text)
    })
    c.Visit("https://www.olx.pl/elektronika/gdynia/")
}

Я пробовал это: golang regexp удалить все пустые строки и это: Golang idiomati c способ удалить пустая строка из многострочной строки , возможно, неправильно или, возможно, я что-то упускаю.

Ответы [ 2 ]

0 голосов
/ 06 апреля 2020

Я думаю, вы можете попробовать стандартизировать пространство.

func StandardizeSpaces(s string) string {
    return strings.Join(strings.Fields(s), " ")
}

func main() {
    c := colly.NewCollector()
    c.OnHTML("table > tbody", func(e *colly.HTMLElement) {
        fmt.Println(StandardizeSpaces(e.Text))
    })
    c.Visit("https://www.olx.pl/elektronika/gdynia/")
}
0 голосов
/ 27 февраля 2020

Ну, кажется, что пустые строки не были действительно пустыми, скребок просто не печатал элементы, которые есть в DOM, поэтому я видел так много промежутков между очищенным текстом. Проблема была решена путем сообщения скребку указателей c дочерних элементов, которые я хотел очистить.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...