grab-site

grab-site

抓取站点是用于将网站归档到WARC文件的爬网程序。它包括一个用于监视多个爬网的仪表板,并支持在爬网期间更改URL忽略模式。
抓取站点是用于将网站归档到WARC文件的爬网程序。它包括一个用于监视多个爬网的仪表板,并支持在爬网期间更改URL忽略模式。
grab-site

Linux版grab-site的替代品

Wget

Wget

GNU Wget是一个免费软件包,可使用HTTP(S)和FTP(最广泛使用的Internet协议)检索文件。
HTTrack

HTTrack

网站复制服务,可下载整个网站并在本地递归地构建它们。
ScrapBook X

ScrapBook X

ScrapBook X是基于ScrapBook Plus的Firefox插件,还集成了最新版本ScrapBook中的一些功能。
WebScrapBook

WebScrapBook

浏览器扩展程序,可高度自定义地忠实捕获网页。
wpull

wpull

Wpull是与wget兼容的Web下载器和搜寻器,具有WARC和Python / Lua脚本支持
Fossilo

Fossilo

Fossilo.com持续将完整的网站存档为pdf和其他多种格式,以便将来轻松打开和查看而无需任何依赖。您可以浏览平台内的档案,也可以将其作为独立的软件包下载。