Я пишу что-то для извлечения данных о продуктах из Amazon, но я не уверен, как нормализовать пробелы в HTML.
fn parse_html(html: std::string::String) {
let fragment = Html::parse_fragment(&html);
let product_title = Selector::parse(".s-line-clamp-2").unwrap();
for title in fragment.select(&product_title) {
let title_txt = title.text().collect::<Vec<_>>();
println!("{:?}", title_txt);
}
}
Это работает, но данные, которые я получаю, выглядят так ["\n \n \n \n\n\n\n\n", "\n \n \n \n ", "Men\'s Sneakers", "\n \n \n \n \n", "\n\n \n"]
Я хочу только этого: ["Men\'s Sneakers"]