Meta Robots, Meta Tag Robots

Il Meta Tag Robots

Il meta tag robots viene utilizzato per bloccare o rimuovere delle pagine di un sito internet. Il meta tag robots va collocato all'interno delle singole pagine web e va inserito all'interno dei tag <head></head>.

Esempio:
<html>
<head>
<title>Titolo</title>
<meta name="robots" content="index, follow">
</head>
<body>
Contenuto della pagina.
</body>
</html>

All'interno del campo CONTENT è possibile inserire varie diciture:


Index: comunica agli spider che la pagina può essere indicizzata

Noindex: comunica agli spider che la pagina non deve essere indicizzata

Follow: comunica agli spider che possono essere seguiti i link presenti nella pagina

Nofollow: comunica agli spider che non devono essere seguiti i link presenti nella pagina

Si avranno quini 4 possibili combinazioni:

<meta name="robots" content="index, follow">
gli spider indicizzeranno la pagina e seguiranno i link presenti in essa

<meta name="robots" content="index, nofollow">
gli spider indicizzeranno la pagina ma non seguiranno i link presenti in essa

<meta name="robots" content="noindex, follow">
gli spider non indicizzeranno la pagina ma seguiranno i link presenti in essa

<meta name="robots" content="noindex, nofollow">
gli spider non indicizzeranno la pagina e non seguiranno i link presenti in essa


All: Esiste poi la possibilità di rivolgersi a tutti gli spider comunicando di indicizzare la pagina e seguire i link anche attraverso il content="all":
<meta name="robots" content="all">
gli spider indicizzeranno la pagina ma non seguiranno i link presenti in essa

Se non si inserisce nessun meta robots, per gli spider è come se avessimo inserito la dicitura index, follow.


None: il comando none equivale a noindex, nofollow
<meta name="robots" content="none">
gli spider non indicizzeranno la pagina e non seguiranno i link presenti in essa


NoImageIndex: per consentire l'indicizzazione dei contenuti della pagina ma non delle immagini presenti in essa.
<meta name="robots" content="noimageindex">


NoODP: serve per bloccare l'utilizzo della descrizione alternativa di DMOZ nei risultati di una ricerca
<meta name="robots" content="noodp">


Noarchive: serve per bloccare la visualizzazione della copia cache della pagina
<meta name="robots" content="noarchive">


NoSnippet: serve per impedire la visualizzazione dello snippet nei risultati di ricerca dei vari motori.
<meta name="robots" content="nosnippet">

Snippet = le due righe di descrizione presenti tra il titolo e l'url nella pagina del motore che mostra i risultati di una ricerca.