Recientemente, noté que tengo una lista creciente de errores Soft 404 en las Herramientas para webmasters de Google. Todos son para páginas de resultados de búsqueda generadas dinámicamente que informan "No se encontraron coincidencias".
Yo no entiendo lo que significa que Google por Soft 404 y por qué se están informando que para estas páginas. Entonces agregué <meta name="robots" content="noindex">
a estas páginas.
Sin embargo, Google aún informa nuevos errores de Soft 404 para páginas que usan la metaetiqueta noindex .
¿Por qué Google informa algún error en una página que les dije que no indexaran?
El problema es que con todos estos errores no deseados, no puedo ver si hay algún problema real que deba corregirse.
Algunos han dicho que estas páginas deberían devolver un código de estado 404. Pero eso solo cambia el problema a la pestaña de errores 404. Además, Google devuelve el código de estado 200 para su página sin resultados .
No quiero bloquear el acceso con robots.txt porque quiero que se sigan los enlaces en estas páginas y quiero que Google vea la metaetiqueta noindex . Además, no hay ningún patrón que pueda usar para bloquearlos.
Google encontró estas URL en primer lugar porque el contenido solía existir, pero desde entonces se ha eliminado. No puedo devolver un código de estado 410, porque mi código PHP no tiene forma de saber la razón por la que no se encontraron resultados.
¿Hay algo que pueda hacer para que sea más fácil ver los problemas reales?