Controla cómo Google indexa tu contenido con etiquetas meta

Hay muchos motores de búsqueda por ahí, pero la mayoría de las veces, a los propietarios de sitios les importa que su sitio sea indexado en el todopoderoso Google. Una forma de obtener mejores resultados en el motor de búsqueda es usar etiquetas meta robot.

los meta etiqueta de robot es una etiqueta meta de consenso entre los motores de búsqueda como Google, Yahoo y Bing. El uso de la etiqueta meta es permitir que los desarrolladores web tengan control de accesibilidad para las páginas web, contra los rastreadores de los motores de búsqueda. Por ejemplo, algo como noindex evitará que todos los robots de los motores de búsqueda incluyan su página web en su índice.

El propio robot de Google se llama Googlebot. En esta publicación veremos cómo abordamos Googlebot exclusivamente a través de etiquetas meta.

Direccionamiento a Googlebot

Para dirigirse a Googlebot, especifique el meta nombre como googlebot en lugar de solo robots. Este ejemplo evitará que Googlebot incluya su página web en su índice, pero aún así permitirá que los robots de Bing y Yahoo rastreen la página. Por lo tanto, sus páginas web pueden aparecer en los resultados de búsqueda de Bing y Yahoo.

Google tiene varios robots especiales que se arrastran a través de diferentes tipos de contenido como Imagen, Noticias, Video, Anuncios y Móvil. Google te permite bloquear estos robots individualmente. Si no desea que su sitio web aparezca en los resultados de búsqueda de Google Mobile, por ejemplo, puede especificar la etiqueta meta robot de esta manera:

La lista completa de tipos de bot de Google se puede encontrar en la página Rastreadores de sitios web de Google.

Prevenir la indexación de imágenes

Es realmente irritante cuando encuentra su imagen con derechos de autor utilizada por otra persona sin su permiso previo. Si desea minimizar que esto suceda, puede evitar que Google ponga sus imágenes en su índice..

Especifique la etiqueta meta robot con el valor de noimageindex. Esto evitará que el robot indexe todas las imágenes en la página y sus imágenes no aparecerán en los resultados de la Búsqueda de imágenes de Google, que es donde la gente generalmente busca imágenes..

Alternativamente, puede establecer el nombre meta como googlebot-image para evitar específicamente que los robots de Google rastreen su sitio en busca de imágenes.

Prevenir la traducción

Google Chrome ofrece la traducción de un sitio en un idioma extranjero al idioma favorito o local del visitante, con la ayuda de Google Translate. Si bien la traducción de Google Translate está mejorando, está lejos de ser perfecta para algunos idiomas. La salida de la traducción a veces puede ser muy peculiar..

Si no desea que Google traduzca sus páginas web, configure el meta de googlebot con el valor de no traducir, al igual que.

Si desea evitar que se traduzca una sección determinada de la página, puede agregar el no traducir clase dentro del elemento envolviendo el contenido:

Google ignorará esto

completamente.

Evitar la indexación después de un tiempo especificado

También puede evitar que Google indexe sus páginas web después de cierto período de tiempo. Esto será particularmente útil para páginas web que solo son relevantes dentro de un período de tiempo, como una página de registro de eventos, por ejemplo..

En este caso, es probable que desee decirle al robot que no rastree e indexe esta página después de que el evento haya finalizado, evitando así que aparezca en los resultados de búsqueda de Google..

Para hacer esto, especifique la etiqueta meta con el valor de no disponible_después luego seguido por la información de tiempo. El formato de hora debe cumplir con el formato RFC-850, por ejemplo: jueves 26-sep-14 10:00:00 UTC

Dando el ejemplo anterior, el robot de Google no rastreará la página después del 29 de septiembre de 2008. La página eventualmente desaparecerá del índice, pero aún puede conservar la página para archivar en su sitio web.