Архивация веб-сайта

Немного об архивации

Обзорная статья на Хабре: Архивирование веб-сайтов

Формат WARC: Archive Team | The WARC Ecosystem

Archive Team

Группа волонтёров, занимающихся архивацией интернета.

О проекте: Archive Team | Who we are

Софт: Archive Team | Software


Веб-сервисы

Wayback Machine

Проект: Internet Archive

Сервис: Internet Archive Wayback Machine

Archive.today

Ссылка: Archive.today


Утилиты

Wget

Свободная консольная программа для загрузки файлов по сети. Популярный инструмент в ОС Linux. Может использоваться для архивации с ключом -r (рекурсивное скачивание).

Ссылка: Wget

HTTrack

Свободный кроссплатформенный офлайн-браузер. Позволяет загружать веб-сайты из Интернета на локальный компьютер.

Немного о архивировании сайтов с помощью HTTrack

Ссылка: HTTrack

pywb

Core Python Web Archiving Toolkit for replay and recording of web archives

Используется в Wayback Machine

Ссылка: pywb

crawl

Утилита с исходным кодом на языке Go

https://git.autistici.org/ale/crawl/

Teleport Pro

Платный закрытый софт для Windows

Ссылка: Teleport_Pro