Il meta tag robots viene utilizzato per bloccare o rimuovere delle pagine di un sito internet.
Il meta tag robots va collocato all'interno delle singole pagine web e va inserito all'interno dei tag <head></head>.
Esempio:
<html>
<head>
<title>Titolo</title>
<meta name="robots" content="index, follow">
</head>
<body>
Contenuto della pagina.
</body>
</html>
All'interno del campo CONTENT è possibile inserire varie diciture:
Index: comunica agli spider che la pagina può essere indicizzata
Noindex: comunica agli spider che la pagina non deve essere indicizzata
Follow: comunica agli spider che possono essere seguiti i link presenti nella pagina
Nofollow: comunica agli spider che non devono essere seguiti i link presenti nella pagina
Si avranno quini 4 possibili combinazioni:
<meta name="robots" content="index, follow">
gli spider indicizzeranno la pagina e seguiranno i link presenti in essa
<meta name="robots" content="index, nofollow">
gli spider indicizzeranno la pagina ma non seguiranno i link presenti in essa
<meta name="robots" content="noindex, follow">
gli spider non indicizzeranno la pagina ma seguiranno i link presenti in essa
<meta name="robots" content="noindex, nofollow">
gli spider non indicizzeranno la pagina e non seguiranno i link presenti in essa
All: Esiste poi la possibilità di rivolgersi a tutti gli spider comunicando di indicizzare la pagina e seguire i link anche attraverso il content="all":
<meta name="robots" content="all">
gli spider indicizzeranno la pagina ma non seguiranno i link presenti in essa
Se non si inserisce nessun meta robots, per gli spider è come se avessimo inserito la dicitura index, follow.
None: il comando none equivale a noindex, nofollow
<meta name="robots" content="none">
gli spider non indicizzeranno la pagina e non seguiranno i link presenti in essa
NoImageIndex: per consentire l'indicizzazione dei contenuti della pagina ma non delle immagini presenti in essa.
<meta name="robots" content="noimageindex">
NoODP: serve per bloccare l'utilizzo della descrizione alternativa di DMOZ nei risultati di una ricerca
<meta name="robots" content="noodp">
Noarchive: serve per bloccare la visualizzazione della copia cache della pagina
<meta name="robots" content="noarchive">
NoSnippet: serve per impedire la visualizzazione dello snippet nei risultati di ricerca dei vari motori.
<meta name="robots" content="nosnippet">
Snippet = le due righe di descrizione presenti tra il titolo e l'url nella pagina del motore che mostra i risultati di una ricerca.