ArchiveBox

ArchiveBox

🗃开源自托管Web存档。记录浏览器的历史记录/书签/口袋式/ Pinboard /等,保存HTML,JS,PDF,媒体等。
  • 免费应用
由于现代网站非常复杂,并且通常依赖于动态内容,因此ArchiveBox以几种不同的格式对网站进行存档,而Archive.org和Archive.com等公共存档服务无法保存这些格式。ArchiveBox会从标准输入,远程URL或文件中导入URL列表,然后使用wget将页面添加到本地归档文件夹中,以创建可浏览的html克隆,使用youtube-dl提取媒体,并使用完整的Chrome浏览器(无PDF)实例,屏幕截图和DOM转储,等等。使用多种方法和以市场为主导的浏览器执行JS,可以确保我们甚至可以使用至少几种高质量的长期数据格式来保存最复杂,挑剔的网站。###可以导入以下链接:-Pocket,Pinboard,Instapaper-RSS,XML,JSON或纯文本列表-浏览器历史记录或书签(Chrome,Firefox,Safari,IE,Opera等)-Shaarli,Delicious,Reddit已保存的帖子,Wallabag,Unmark.it以及其中包含链接的任何其他文本!###可以为每个网站保存以下内容:-网站的favicon.ico图标-网站的example.com/page-name.html wget克隆,如果不存在,则附加.html-输出。pdf`使用无头镀铬的网站的印刷PDF-`screenshot.png` 1440x900使用无头镀铬的网站的屏幕快照-`output.html`使用无头镀铬渲染后的DOM HTML HTML转储-`archive.org.txt`的链接保存在archive.org上的网站-`warc /`,用于html + gzip压缩warc文件.gz-使用youtube-dl找到的“媒体/”任何mp4,mp3,字幕和元数据-github,bitbucket或gitlab链接的任何存储库的“ git /”克隆-“ index.html”和“ index.json”包含元数据和详细信息的HTML和JSON索引文件归档是附加的,因此您可以安排`。/ archive`使其定期运行并将新链接拉入索引。所有保存的内容都是静态的,并使用JSON文件建立索引,因此它可以永久保存并且易于解析,并且不需要始终运行的后端。
archivebox

分类目录

具有任何许可的所有平台的ArchiveBox替代品

Pocket

Pocket

保存网页以供日后阅读,并消除那些仅是一次性兴趣的站点造成的书签混乱。
Wget

Wget

GNU Wget是一个免费软件包,可使用HTTP(S)和FTP(最广泛使用的Internet协议)检索文件。
HTTrack

HTTrack

网站复制服务,可下载整个网站并在本地递归地构建它们。
Wayback Machine

Wayback Machine

浏览从1996年到几个月前存档的1500亿个网页。
wallabag

wallabag

wallabag是一个开源的可托管应用程序,用于保存网页。##舒适的阅读
Pinboard

Pinboard

Pinboard是您在网上找到并不想忘记的东西的个人档案。
  • 付费应用
  • Web
Evernote Web Clipper

Evernote Web Clipper

只需单击一下,即可将在线上看到的所有内容(包括文本,链接和图像)保存到Evernote帐户中。
Archive.is

Archive.is

Archive.is允许您“拍摄照片”网页,即使原始页面发生更改或删除,该页面也始终可用。
  • 免费应用
  • Web
Internet Archive

Internet Archive

互联网档案馆是一个非营利性的数字图书馆,可免费普遍访问书籍,电影和音乐以及1500亿个存档的网页。
  • 免费应用
  • Web
Stash.ai

Stash.ai

Stash是一个由人工智能支持的智能跨设备书签应用程序。保存文章,视频和其他内容。它们会自动为您分类。
SiteSucker

SiteSucker

macOS应用程序,可从Internet自动下载网站。它通过将站点的网页,图像,PDF,样式表和其他文件异步复制到本地硬盘驱动器,从而复制站点的目录结构来实现此目的。
PageArchiver

PageArchiver

PageArchiver(以前称为“ SingleFile剪贴簿”)是一个Chrome扩展程序,可帮助您存档网页以供离线阅读。主要功能包括:
Reminiscence

Reminiscence

自托管书签和存档管理器。通过网络界面添加书签链接并编辑其元数据(例如标题,标签,摘要)。
Fossilo

Fossilo

Fossilo.com持续将完整的网站存档为pdf和其他多种格式,以便将来轻松打开和查看而无需任何依赖。您可以浏览平台内的档案,也可以将其作为独立的软件包下载。
WebCull

WebCull

WebCull是一个链接组织器,旨在帮助您在使用Web时提高生产力和组织性。
  • 免费应用
  • Web