Можно ли загрузить содержимое веб-сайта - набор HTML-страниц - прямо в память без записи на диск?
У меня есть кластер машин с 24G установленной на каждом, но я ограничен дисковой квотой до нескольких сотен МБ. Я думал о перенаправлении вывода wget
в какую-то структуру в памяти без сохранения содержимого на диске. Другой вариант - создать мою собственную версию wget
, но, возможно, есть простой способ сделать это с трубами
Также, как лучше всего запустить эту загрузку параллельно (кластер имеет> 20 узлов). В этом случае нельзя использовать файловую систему.