Архивация веб-сайта
Немного об архивации
Обзорная статья на Хабре: Архивирование веб-сайтов
Формат WARC: Archive Team | The WARC Ecosystem
Archive Team
Группа волонтёров, занимающихся архивацией интернета.
О проекте: Archive Team | Who we are
Софт: Archive Team | Software
Веб-сервисы
Wayback Machine
Проект: Internet Archive
Сервис: Internet Archive Wayback Machine
Archive.today
Ссылка: Archive.today
Утилиты
Wget
Свободная консольная программа для загрузки файлов по сети. Популярный инструмент в ОС Linux.
Может использоваться для архивации с ключом -r
(рекурсивное скачивание).
Ссылка: Wget
HTTrack
Свободный кроссплатформенный офлайн-браузер. Позволяет загружать веб-сайты из Интернета на локальный компьютер.
Немного о архивировании сайтов с помощью HTTrack
Ссылка: HTTrack
pywb
Core Python Web Archiving Toolkit for replay and recording of web archives
Используется в Wayback Machine
Ссылка: pywb
crawl
Утилита с исходным кодом на языке Go
https://git.autistici.org/ale/crawl/
Teleport Pro
Платный закрытый софт для Windows
Ссылка: Teleport_Pro