Выгрузка сайтов через web2.zip и их доработка
1. Перечень сайтов
Выгрузить каждый ресурс из списка «Приложение 1» (см. файл/таблицу) — один сайт = одна отдельная папка.
2. Инструмент выгрузки
Использовать онлайн-сервис https://web2.zip/. Настройки:
• «Recursive» depth — maximum;
• «Assets» — inline;
• «Minify» отключить (чтобы код читался).
На выходе получаем zip-архив с локальными HTML/CSS/JS/изображениями.
3. Очистка кода
3.1. Удалить ВСЕ внешние ссылки и скрипты, а именно:
a) теги , <link>, <script>, <iframe>, <img>, если атрибут href/src ведёт на любой домен, отличный от исходного сайта;
b) отдельные блоки стейт-менеджеров и аналитики (Google Analytics, GTM, Yandex Metrica, Hotjar, Facebook Pixel и т. д.);
c) CDN-библиотеки (jQuery, Bootstrap, Font Awesome и пр.);
d) встроенные виджеты (чат-боты, карты, формы третьих сторон).
3.2. Все найденные внешние ресурсы заменить на локальные копии/заглушки #, если их необходимо сохранить для корректного отображения (шрифты, иконки).
3.3. Проверить, чтобы после правок сайт открывался локально без ошибок в консоли.
3.4. Принудительно скрыть сайт от индексации Google и Яндекса:
• добавить в <head> тег <meta name="robots" content="noindex,nofollow">;
• создать robots.txt с содержимым:
User-agent: *
Disallow: /
Доработка и настройка сайта