Полное руководство по скачиванию сайтов для работы без интернета

Иван Корнев·26.04.2026·5 мин

Чтобы скачать сайт целиком для офлайн-просмотра, проще всего использовать бесплатную утилиту HTTrack (для Windows/Linux) или команду wget (для macOS/Linux/Windows). Эти инструменты копируют HTML, изображения, CSS и скрипты, сохраняя структуру ссылок так, чтобы страницы открывались локально без подключения к сети. Для современных сложных сайтов с динамической подгрузкой контента (JavaScript) лучше подойдут специализированные программы вроде Cyotek Web Copy Offline или сервисы архивации.

Почему стандартное «Сохранить как» не работает

Встроенная функция браузера «Сохранить страницу как» (Ctrl+S) сохраняет только один открытый файл. Она не скачивает связанные страницы, на которые ведут ссылки, и часто ломает верстку, так как пути к картинкам и стилям остаются абсолютными (ведут в интернет).

Для полноценного офлайн-доступа нужен инструмент, который:

  1. Рекурсивно проходит по всем внутренним ссылкам.
  2. Скачивает медиафайлы (картинки, видео, документы).
  3. Переписывает ссылки в коде, заменяя адреса вида https://site.com/page на локальные пути ./page.html.

Способ 1: HTTrack — классика для новичков

HTTrack Website Copier — это самое популярное бесплатное решение с графическим интерфейсом. Оно идеально подходит, если вы не хотите работать с командной строкой.

Как пользоваться:

  1. Скачайте и установите HTTrack с официального сайта.
  2. Запустите программу и нажмите «Далее».
  3. Введите имя проекта и папку для сохранения.
  4. В поле «Веб-адрес» вставьте URL сайта, который нужно скопировать.
  5. Нажмите «Готово». Программа начнет сканирование и загрузку.

В настройках («Параметры») можно выбрать режим загрузки. Для полного зеркала выберите «Зеркало сайта». Если нужно сохранить только определенные разделы, используйте фильтры включения/исключения в том же меню.

Плюсы:

  • Бесплатно и открыто.
  • Понятный интерфейс.
  • Возможность возобновления прерванной загрузки.

Минусы:

  • Слабо справляется с сайтами, построенными на тяжелых JavaScript-фреймворках (React, Vue), так как не исполняет JS-код.
  • Интерфейс выглядит устаревшим.

Способ 2: Wget — мощный инструмент для продвинутых пользователей

Wget — это консольная утилита, доступная по умолчанию в Linux и macOS, а также устанавливаемая в Windows. Она дает полный контроль над процессом загрузки.

Базовая команда для клонирования сайта

Откройте терминал (или командную строку) и введите:

wget --mirror --convert-links --adjust-extension --page-requisites --no-parent https://example.com

Разбор ключей:

  • --mirror (-m): включает рекурсивную загрузку и бесконечную глубину.
  • --convert-links (-k): после загрузки преобразует ссылки для локального просмотра.
  • --adjust-extension (-E): добавляет расширение .html к файлам, если оно отсутствует.
  • --page-requisites (-p): скачивает все элементы, необходимые для отображения страницы (CSS, картинки).
  • --no-parent (-np): не поднимается выше начального каталога (не скачивает весь домен, если вы начали с подраздела).

Будьте осторожны с глубиной загрузки. Без ограничения уровня вложенности (-l) вы можете случайно скачать весь интернет или очень крупный портал, что займет гигабайты места и время. Добавьте -l 3 или -l 5, чтобы ограничить глубину.

Ограничение нагрузки на сервер

Чтобы ваш запрос не выглядел как DDoS-атака и сайт не заблокировал ваш IP, добавьте задержку между запросами:

wget --wait=2 --random-wait --mirror ...

Способ 3: Альтернативы для сложных случаев

Если HTTrack и wget не справились (сайт пустой или без стилей), скорее всего, контент генерируется динамически через JavaScript.

Cyotek Web Copy Offline (Windows)

Более современная альтернатива HTTrack.

  • Лучше обрабатывает сложные структуры ссылок.
  • Имеет удобный мастер настройки правил фильтрации.
  • Позволяет предварительно просканировать сайт, чтобы увидеть, что именно будет скачано, перед началом загрузки.

SiteSucker (macOS / iOS)

Популярное приложение для экосистемы Apple.

  • Простой интерфейс: просто вставьте ссылку.
  • Хорошо интегрируется с системой.
  • Платное (в Mac App Store), но есть старые бесплатные версии.

SingleFile (Расширение для браузера)

Если вам нужна не вся структура сайта, а только несколько конкретных статей или страниц в идеальном виде.

  • Это расширение для Chrome/Firefox.
  • Сохраняет страницу в один HTML-файл, вшивая внутрь все картинки, шрифты и стили (в формате base64).
  • Идеально для архивации отдельных лонгридов, но не подходит для скачивания всего сайта целиком.

Сравнение инструментов

ИнструментПлатформаСложностьРабота с JSЛучшее применение
HTTrackWin, LinuxНизкаяПлохаяКлассические статические сайты, блоги
WgetВсеВысокаяНетСерверная архивация, скрипты, точечная настройка
CyotekWindowsСредняяСредняяКорпоративные сайты со сложной навигацией
SiteSuckermacOSНизкаяСредняяПользователи Apple, быстрое сохранение
SingleFileБраузерНизкаяОтличнаяСохранение 1–10 конкретных страниц

Частые ошибки при скачивании

  1. Битые картинки и стили.

    • Причина: Ссылки на ресурсы абсолютные или защищены от хотлинка (hotlink protection).
    • Решение: В HTTrack проверьте настройки «Ссылки» и убедитесь, что стоит галочка «Преобразовать ссылки». В wget используйте ключ -k.
  2. Бесконечная загрузка.

    • Причина: На сайте есть календари, бесконечная прокрутка или циклические ссылки.
    • Решение: Всегда ограничивайте глубину (-l 5) и размер файла. Исключите из загрузки параметры запросов (например, ?page=2, ?sort=asc), используя маски исключений.
  3. Пустые страницы вместо контента.

    • Причина: Сайт использует SPA (Single Page Application) на React/Angular. Wget и HTTrack видят только пустой шаблон.
    • Решение: Используйте браузерные расширения типа SingleFile для ручного сохранения или специализированные сервисы рендеринга (например, Puppeteer-скрипты, если вы разработчик).

FAQ

Можно ли скачать видео с сайта этими инструментами? Wget и HTTrack скачают видеофайлы, если они представлены прямыми ссылками (.mp4, .avi). Если видео стримится через HLS (.m3u8) или защищено DRM, эти инструменты не помогут. Потребуется специализированный софт вроде youtube-dl (yt-dlp).

Законно ли скачивать чужие сайты? Скачивание для личного офлайн-просмотра обычно попадает под понятие добросовестного использования. Однако публикация скачанного сайта, использование его контента в коммерческих целях или создание фишинговых копий незаконны и нарушают авторские права.

Почему сайт открывается локально, но поиск не работает? Локальный поиск по сайту требует серверной части (PHP, Python, базы данных). При статическом копировании серверный код не сохраняется. Поиск работать не будет, если только сайт не использует чисто клиентский JS-поиск, который был корректно скачан.

Как обновить скачанный сайт? В HTTrack есть режим «Обновить существующий проект». Программа сравнит даты файлов на сервере и локально и докачает только изменения. В wget это сложнее: нужно использовать ключ -N (timestamping), но он не всегда корректно работает с переписыванием ссылок.