Я использую Колли для очистки сайта.в обратном вызове OnHTML:
package main
import (
"fmt"
"github.com/gocolly/colly"
)
func main() {
// Instantiate default collector
c := colly.NewCollector()
// On every a element which has href attribute call callback
c.OnHTML("h3", func(e *colly.HTMLElement) {
link := e.Text
// Print link
fmt.Printf("Link found: %q -> %s\n", e.Text, link)
// Visit link found on page
// Only those links are visited which are in AllowedDomains
c.Visit(e.Request.AbsoluteURL(link))
})
// Before making a request print "Visiting ..."
c.OnRequest(func(r *colly.Request) {
fmt.Println("Visiting", r.URL.String())
})
// Start scraping on https://hackerspaces.org
c.Visit("https://bbs.archusers.ir/")
}
например, я хочу получить все с идентификатором «id Name» или получить все с «именем класса».Как я могу это сделать?!