Co to jest noarchive?

by Agata
0 comments

Co to jest noarchive?

noarchive to dyrektywa meta-robotów (lub nagłówka HTTP X-Robots-Tag), która instruuje wyszukiwarki, aby nie wyświetlały linku do wersji zbuforowanej/kopia cache danej strony. Nie blokuje indeksowania strony ani wyświetlania jej fragmentu opisu (snippetu) w wynikach – dotyczy wyłącznie publicznej kopii cache w wyszukiwarce.

Jak działa noarchive w praktyce?

Gdy robot wyszukiwarki odwiedza stronę:

  • odczytuje dyrektywy z tagu <meta name="robots"> (lub agent‑specyficzne, np. name="googlebot");
  • alternatywnie – z nagłówka HTTP X-Robots-Tag (przydatne dla plików jak PDF, DOCX);
  • jeśli wykryje noarchive, nie pokaże użytkownikom linku do kopii strony przechowywanej przez wyszukiwarkę.

Ważne rozróżnienia:

  • Indeksowanie: noarchive nie blokuje indeksowania (do tego służy noindex) i nie zmienia zachowania linków (to nofollow).
  • Snippet: opis w wynikach nadal może się pojawiać; jego wyłączenie wymaga nosnippet lub ograniczenia max-snippet.
  • Cache przeglądarki/CDN: noarchive nie ma związku z nagłówkami HTTP Cache-Control/no-cache. Dotyczy wyłącznie kopii przechowywanych przez wyszukiwarki.

Uwaga rynkowa: Google w 2024 r. usunął link „Kopia” i operator cache: z wyników, więc efekt noarchive w Google jest dziś marginalny wizualnie. Dyrektywa pozostaje jednak stosowana przez inne wyszukiwarki (np. Bing).

Kiedy warto użyć noarchive?

  • Treści wrażliwe lub szybko dezaktualizujące się (np. ceny, regulaminy, oferty pracy), aby uniknąć oglądania starych wersji przez użytkowników.
  • Modele subskrypcyjne/paywalle – ograniczenie łatwego podglądu fragmentów spoza aktualnych zasad dostępu.
  • Wymogi prawne i zgodność – gdy publikacja archiwalnej kopii może wprowadzać w błąd lub naruszać polityki.
  • Kontrola brandu – by nie pojawiały się nieaktualne treści w „kopii” wyszukiwarki.
Polecane -  Co to jest Google Analytics 4 (GA4)?

Czy noarchive wpływa na SEO?

  • Brak wpływu na ranking: samo zastosowanie noarchive nie jest czynnikiem rankingowym.
  • Brak wpływu na crawling: roboty dalej odwiedzają stronę (o ile nie blokuje tego robots.txt) i mogą ją indeksować.
  • Potencjalne minusy: tracisz „awaryjną” ścieżkę dla użytkowników i zespołu SEO do podglądu ostatniej wersji z cache wyszukiwarki (istotne głównie poza Google).
  • Komponowanie dyrektyw: noarchive można łączyć z innymi (np. noindex, nofollow, noarchive), ale stosuj je tylko zgodnie z intencją – nadmiarowe restrykcje często szkodzą widoczności.

Jak wdrożyć noarchive? (przykłady)

  • W całej stronie (HTML):
  • <meta name="robots" content="noarchive">
  • Tylko dla Googlebota:
  • <meta name="googlebot" content="noarchive">
  • Jako nagłówek HTTP (np. dla PDF):
  • Apache (.htaccess):
    • Header set X-Robots-Tag "noarchive"
    • Dla wybranych plików:
      <FilesMatch "\.(pdf|docx)$"> Header set X-Robots-Tag "noarchive" </FilesMatch>
  • Nginx (server/location):
    • add_header X-Robots-Tag "noarchive" always;

Dobre praktyki

  • Stosuj punktowo, gdy rzeczywiście nie chcesz „kopii” w wyszukiwarce.
  • Dla dokumentów binarnych używaj X-Robots-Tag – nie zawsze masz wpływ na ich HTML.
  • Weryfikuj działanie w narzędziach webmasterów (np. inspekcja URL) i po recrawlu – efekt zwykle nie jest natychmiastowy.
  • Nie myl z noindex (usuwa z indeksu) ani z nagłówkami cache HTTP (dotyczą pamięci podręcznej przeglądarek/CDN).
  • Jeśli celem jest ukrycie opisu w wynikach, użyj nosnippet zamiast noarchive.

Najczęstsze pytania

  • Czy noarchive usuwa już istniejącą kopię? – Zwykle przestanie być pokazywana po ponownym zindeksowaniu; natychmiastowe usunięcie nie jest gwarantowane.
  • Czy zablokuje archiwa typu Wayback Machine? – Nie. To niezależne serwisy; noarchive dotyczy polityk wyszukiwarek wspierających dyrektywę.
  • Czy zaszkodzi SEO? – Sam w sobie nie. Nadmierne użycie niepotrzebnych dyrektyw może jednak utrudniać zarządzanie widocznością.

noarchive to precyzyjne narzędzie kontroli prezentacji treści w wynikach wyszukiwania: nie ogranicza indeksacji ani fragmentów opisu, a jedynie wyłącza publiczną „kopię” strony w wyszukiwarce. Wdrażaj je świadomie tam, gdzie ryzyko dezaktualizacji lub kwestie wizerunkowe przeważają nad korzyścią z dostępnej kopii cache.

You may also like

Get New Updates nto Take Care Your Pet

Witaj na mojej stronie - jestem Agata i zapraszam do zapoznania się z ciekawostkami.. a więcej o mnie przeczytasz

@2024 – All Right Reserved.