Я только начал изучать Ruby. Очень классный язык, он мне очень нравится.
Я использую очень удобный HTML-парсер Hpricot.
Мне нужно получить весь текст со страницы, кроме тегов HTML.
Пример:
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html>
<head>
<title>Data Protection Checks</title>
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
</head>
<body>
<div>
This is what I want to grab.
</div>
<p>
I also want to grab this text
</p>
</body>
</html>
В основном я хочу получить только текст, поэтому я получаю строку вроде:
«Это то, что я хочу захватить. Я также хочу захватить этот текст»
Каков наилучший способ сделать это?
Приветствия
Eef