Noindex и nofollow — два разных сигнала для поисковых ботов, и их часто путают. Noindex говорит «не показывай эту страницу в результатах поиска». Nofollow говорит «не передавай ссылочный вес и не доверяй переходу по этой ссылке». Оба сигнала ничего не делают с самим контентом — он по-прежнему доступен пользователям и обычно сканируется ботом.
Где живёт noindex
Сигнал noindex задаётся одним из двух способов.
Через meta-тег в HTML-странице:
<meta name="robots" content="noindex">
Через HTTP-заголовок:
X-Robots-Tag: noindex
Заголовок удобен для нестандартных ресурсов: PDF, изображений, любых файлов, в которые нельзя вставить meta. Также через X-Robots-Tag можно адресовать конкретного бота, например только Googlebot или только Bingbot.
Важная деталь: noindex работает только если бот может прочитать страницу. Если она закрыта в robots.txt, бот туда не зайдёт и meta noindex не увидит. Поэтому для удаления страниц из выдачи их обычно не закрывают в robots, а оставляют открытыми и помечают noindex.
Где живёт nofollow
Атрибут rel="nofollow" ставится у ссылки:
<a href="https://example.com" rel="nofollow">пример</a>
Это сигнал «я не ручаюсь за этот источник, не передавай ему вес». Изначально nofollow придумали как защиту от спама в комментариях. С 2019 года Google рассматривает nofollow как подсказку, а не директиву: иногда он всё-таки учитывает такие ссылки, если считает их полезными.
Кроме nofollow появились более точные подвиды:
rel="nofollow"— рекламная или партнёрская ссылка. Используется для всех платных размещений и аффилиат-переходов.rel="ugc"— пользовательский контент. Комментарии, форумные посты, отзывы.rel="nofollow"— оставшийся общий случай, когда ничего из выше не подходит.
Эти атрибуты можно комбинировать: rel="nofollow" — самая частая комбинация для аффилиат-переходов.
Когда применять noindex
- Технические страницы — корзина, форма оформления заказа, страница «спасибо за заявку», пустые страницы фильтров.
- Дубли страниц без выраженного canonical. Если страница нужна пользователю, но в индексе ей делать нечего.
- Страницы с тонким контентом, которые вы пока не готовы переписать или удалить.
- Архивные посты и страницы пагинации, у которых нет уникального ценного контента.
- Тестовые и стейджинг-домены — закрывайте все сразу через X-Robots-Tag на уровне сервера.
Не нужно ставить noindex на основные категории, главную страницу, важные посты. Это очевидно, но регулярно встречается на сайтах после редизайна, когда забывают убрать staging-настройки.
Когда применять nofollow / sponsored / ugc
- Партнёрские ссылки —
rel="nofollow". Это требование Google и большинства партнёрских программ. - Реклама внутри контента — то же самое.
- Комментарии и пользовательский UGC —
rel="ugc nofollow". - Логин-формы и админка — обычно это нет смысла маркировать, такие страницы либо закрыты от ботов, либо не имеют исходящих ссылок.
Не нужно вешать nofollow на обычные внутренние ссылки. Это ломает распределение ссылочного веса внутри сайта и не даёт никакой пользы.
Что noindex не делает
Несколько распространённых заблуждений.
- Noindex не равен «удалить из Google». Это сигнал, и Google обработает его при следующем обходе. Если страница давно лежит в индексе, удаление произойдёт через несколько обходов.
- Noindex не освобождает crawl budget. Бот всё равно ходит на такие страницы, чтобы прочитать meta. Если хотите экономить crawl budget, разговор уже про robots.txt и архитектуру.
- Noindex без canonical — нормально. Не нужно ставить оба сигнала вместе на одну страницу. Это создаёт конфликт: «не индексируй, но если индексируешь — указывай вот этот URL».
- Noindex + nofollow в одной meta — устаревшая практика. Раньше так пытались убрать страницу из индекса и не передавать ей вес. Сейчас это считается избыточным.
Как проверить что noindex работает
В Google Search Console: инструмент URL Inspection. Если страница в noindex, отчёт скажет «Excluded by noindex tag». В Яндекс.Вебмастере соответствующий статус — «Исключена тегом noindex».
Полезно периодически проходить по основным разделам сайта и проверять, не появился ли noindex там, где его быть не должно. Это типичная ошибка после миграций и редизайнов.
Связанные термины
- robots.txt — управление обходом сайта, не индексацией.
- canonical URL — указание основного адреса при дубликатах.
- X-Robots-Tag — HTTP-заголовок с тем же набором сигналов, что и meta robots.
- Crawl budget — лимит на количество обходов; meta noindex его не экономит.
