Как просмотреть HTML на терминале, используя Nokogiri на Ruby? - PullRequest
0 голосов
/ 11 апреля 2019

Я пытаюсь проанализировать HTML-страницу википедии, используя Nokogiri на Ruby (2.5.1) в Ubuntu, вот мой код и ответ моего терминала:

Есть идеи, откуда возникла проблема? Я пробовал установить пакет только перед этим, но ничего не работает. Заранее благодарен за любую помощь!

require 'open-uri'
require 'nokogiri'

page = Nokogiri::HTML(open('https://en.wikipedia.org'))   
puts page   # => Nokogiri::HTML::Document```



```asus@asus-X75VD:~/THP/jour8/lib$ ruby test8.rb 
Nokogiri::HTML::Document```


1 Ответ

0 голосов
/ 21 июля 2019

Как вы знаете, у Nokogiri есть эквивалент командной строки, который позволяет вам извлекать страницу и играть с ней в IRB, поэтому вам не придется возиться с написанием кода, пока вы не будете готовы. Если вы введете:

nokogiri https://en.wikipedia.org

в терминале вы попадете в IRB и сможете сделать что-то вроде:

irb(main):002:0> @doc.to_s[0..10]
=> "<!DOCTYPE h"

или

irb(main):005:0> @doc.to_s.size
=> 76139

Вы можете просмотреть страницу, записать ее на диск, все обычные вещи.

...