¿Cómo trata HTTP 418 Google y otros, ya que no es un error "real"?


8

Me preguntaba si sabes cómo Google y otros motores de búsqueda tratan un sitio web con un código de estado HTTP 418 I'm a teapot.

De acuerdo con este artículo de Wikipedia , se puede usar como un código de error del cliente (4xx). Me gustaría usar este código de error para un sitio web de huevo de pascua, que, sin embargo, debería ser encontrado por los motores de búsqueda.

De acuerdo con esta publicación de blog de 4 años , Google ignorará el estado 418. ¿Tiene alguna información más reciente sobre este tema? ¿Cómo reaccionan los otros motores de búsqueda en el estado 418 (principalmente porque es un código 4xx)?

Respuestas:


9

Si utiliza la herramienta "Explorar como Google" en Google Search Console en una página que devuelve el estado "418 I'm a Teapot", simplemente informa un "Error" y no se puede solicitar la indexación para esta página.

En la captura de pantalla a continuación, los "Error" encerrados en un círculo son el resultado de solicitar una página que devuelve un estado 418. No hay más información disponible en esta etapa.

Captura de pantalla de Fetch as Google tool mostrando errores para 418 páginas

Según mi registro de acceso, tanto Googlebot como Search Console han visitado esta página, pero aún no ha aparecido en el índice.

Solo para aclarar, esta es una página nueva, no indexada previamente. Está vinculado desde una página que está indexada, que también se ha vuelto a enviar (junto con "páginas vinculadas") para la indexación, como se ve en la captura de pantalla anterior. También he enviado un mapa del sitio XML que contiene esta página (aunque todavía no se ha informado el recuento "indexado" - VEA LA ACTUALIZACIÓN A CONTINUACIÓN ). Para ser honesto, no tengo muchas esperanzas: me sorprendería si se indexara. No sólo porque es un código 4xx, sino porque es no un código de éxito 2xx.

Por lo general, puede hacer una prueba de "Explorar como Google" y luego solicitar que se indexe la página. Esto suele ser muy rápido ("instantáneo") para una sola página, pero esta opción no está disponible en la página anterior.

De acuerdo con esta publicación de blog de 4 años, Google ignorará el estado 418.

Por "ignorado", significan que se trata como un estado 200 OK. (¿Qué no es realmente lo mismo que ser "ignorado" en mi libro, a menos que se haya ignorado literalmente y Google no haya hecho "nada"?) El "problema" con esa publicación de blog es que están probando una página ya indexada. Devolver un estado 4xx no necesariamente hará que la página caiga del índice de todos modos, al menos no por un tiempo considerable (dependiendo de la frecuencia de rastreo), aunque según los informes esperaron "unas pocas semanas". Tampoco mencionan los errores de rastreo informados en las Herramientas para webmasters de Google (desde que se cambiaron a Google Search Console).

no es un error "real"

¿O es eso? Puede haber sido implementado como una "broma" al principio, sin embargo, posiblemente indica un "estado de error". Creo que sería más contradictorio que un código 4xx no sea ​​tratado como un "estado de error". Y sigue siendo "actual". El RFC 2324 original de 1998 que definió este código de estado incluso se actualizó en 2014 con RFC 7168 .

La mayoría de las herramientas verán el estado 418 como un error. O solo ver 200 como éxito. "Apache log viewer" y "Screaming Frog SEO Spider" ciertamente ven el código 418 como un error.

Según los informes, algunos servidores web implementan el código de estado 418:

Stack Exchange incluso utiliza este código de estado HTTP cuando detecta violaciones de CSRF:

ACTUALIZACIÓN 2017-03-31 (más de 2 semanas después): Google no indexa la página que devuelve un código de estado HTTP 418. El informe del mapa del sitio XML en GSC ahora muestra que solo una de las dos URL enviadas en el mapa del sitio está indexada (una URL devuelve un 200 y está indexada, la otra devuelve un 418 y no está indexada).

Por cierto, GSC tardó casi 2 semanas en informar sobre el estado del índice de las URL en el mapa del sitio, pero esto no se relaciona con el momento en que las páginas se indexaron. Por ejemplo, una página ya estaba indexada en el momento en que se envió el mapa del sitio, sin embargo, al mirar el informe del mapa del sitio solo parece que la página solo se indexó 13 días después de que se envió el mapa del sitio.

La URL que devuelve un 418 ahora se informa como un "Error de rastreo" en Rastrear> Errores de rastreo y el 418 se indica como el código de respuesta. Según el informe, esto fue "detectado" el 16/03/2017 (al día siguiente después de enviar la solicitud de índice anterior), sin embargo, fue en algún momento antes de que esto se informara en GSC.


1
¿Quién podría mejorar esto? Ninguno. ¡¡Salud!!
closetnoc

3
Además del estado 200, Google sabe cómo lidiar con los códigos de redireccionamiento (301, 302, 303, 307, 308). Aparte de esos códigos específicos, me imagino que Google trata casi todo lo demás como un "error".
Stephen Ostermiller

1
Actualización: la página que devuelve un 418 no está indexada y Google ahora lo informa explícitamente como un error de rastreo. He actualizado mi respuesta.
MrWhite
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.