Есть ли утилита командной строки Linux для получения случайных данных для работы из Интернета? - PullRequest
0 голосов
/ 03 августа 2020

Я Linux новичок ie, и мне часто приходится работать с кучей случайных данных. Например: я хотел бы поработать над образцом текстового файла, чтобы опробовать некоторые регулярные выражения или прочитать некоторые данные в gnuplot из образцов данных в файле csv или что-то в этом роде.

Обычно я делаю это путем копирования и вставки отрывки из inte rnet, но мне было интересно, существует ли какая-то комбинация команд, которая позволила бы мне сделать это, не покидая терминал. Я думал об использовании чего-то вроде команды curl, но точно не знаю, как это работает ...

Насколько мне известно, есть веб-сайты, на которых размещается контент. Я просто хочу получить к ним доступ и сохранить их на своем компьютере.

В заключение и в качестве конкретного примера, как мне скопировать и вставить случайный отрывок из inte rnet с веб-сайта и сохранить его в файл в моей системе, используя только командную строку? Может быть, ты сможешь указать мне правильное направление. Спасибо.

Ответы [ 2 ]

2 голосов
/ 04 августа 2020

Вы можете перенаправить вывод команды curl в файл, например,

curl https://run.mocky.io/v3/5f03b1ef-783f-439d-b8c5-bc5ad906cb14 > data-output

Обратите внимание, что я высмеивал данные в Mocky , что приятно сайт для быстрой имитации API.

1 голос
/ 06 августа 2020

Обычно я использую «Project Gutenberg» , который содержит 60 000+ свободно загружаемых книг онлайн .

Итак, если мне нужен полный текст » Питер Пэн и Венди " Дж. М. Барра ie, я бы сделал:

curl "http://www.gutenberg.org/files/16/16-0.txt" > PeterPan.txt

Если вы посмотрите страницу этой книги, вы увидите, как получить его как HTML, обычный текст, ePUB или UTF-8.

...