Imágenes codificadas en Base64 y disponibilidad de sus metadatos para Googlebot


9

Si inserto una imagen en una página como un img- srccon URI de datos base64, ¿los metadatos de la imagen (EXIF, IPTC, XMP) siguen disponibles para el robot de imágenes de Google?


1
Probablemente no. Googlebot probablemente necesita una URL que pueda clasificar y referir a los usuarios.
John Conde

1
Olvide los datos EXIF, ni siquiera estoy seguro de que las imágenes de Google indexen una imagen que no tiene su propia URL.
Stephen Ostermiller

@StephenOstermiller: esa es la pregunta: si indexa esas imágenes, entonces también lee EXIF
Evgeniy

@Evgeniy Como señala Stephen, los URI de datos no están separados de su documento que contiene (vea esto para más información). Los motores de búsqueda indexan las URL, por lo que solo el documento que contiene se indexará, y si indexarían los metadatos contenidos en un URI de datos (si de hecho también lo contenía, haciéndolo aún más grande) es un punto mudo. Para confirmar, puede usar un motor de búsqueda de código fuente para buscar un URI de datos y luego ver si esa imagen fue indexada y contenía información EXIF ​​en Google. Sin embargo, eso parece altamente improbable.
Dan

@Evgeniy Tenga en cuenta que la publicación cruzada de la misma pregunta en más de un sitio de Stack Exchange no está permitida.
Dan

Respuestas:


6

Google no indexa las imágenes de URI de datos para la búsqueda de imágenes de Google. John Mueller de Google lo dice aquí y en los comentarios a continuación. Debido a que las imágenes URI de datos no están indexadas en la búsqueda de imágenes de Google, los datos EXIF ​​en ellas son irrelevantes.

Puede verificar que estas imágenes no estén indexadas. Busqué imágenes de Google para "uri de datos" y verifiqué los resultados. Todas las imágenes que vi eran archivos de imagen, no URI de imagen codificada en base64. Se podría pensar que si Google pudiera indexar imágenes de URI de datos, algunas de ellas aparecerían en los resultados de búsqueda para ese término.

Si Google decide indexar imágenes de URI de datos, debería poder obtener los datos EXIF ​​de ellos. Data uri es todo el archivo base64 codificado (sin espacios ni líneas nuevas) con un data:image/png;base64,prefijo. Cualquier metadato en el archivo aún estaría presente en la versión URI de datos codificados en base64.

Utilizo imágenes de datos URI en uno de mis sitios web. Lo hago porque los usuarios generalmente solo ven una página en el sitio para obtener toda la información que necesitan. La inclusión de todos los datos CSS, JS e imágenes en línea en la página mejora drásticamente el rendimiento. Todas las imágenes son pequeñas, por lo que la técnica funciona particularmente bien.

Mi sitio recibe una buena cantidad de tráfico de Internet Explorer 7 y versiones anteriores que no admiten imágenes de URI de datos. Por lo tanto, tengo que servirles condicionalmente. También tengo las imágenes en el servidor y elijo las URL de imagen regulares o el URI de datos basado en el User-Agentencabezado. Trato los bots (incluido Googlebot) igual que IE 7, es decir, sirvo las imágenes como URL HTTP. Hago esto porque incluir datos de imágenes uri aumenta dramáticamente el tamaño de la página. La mayoría de los bots no necesitan descargar las imágenes, por lo que es más eficiente para ellos. También me di cuenta de que las Herramientas para webmasters de Google informaron que Googlebot rastreaba mi sitio mucho más lentamente con imágenes de URI de datos habilitadas para ello. Técnicamente, esto podría considerarse encubrimiento, pero sería una forma de indexar sus imágenes de URI de datos.


2
Su primer ejemplo está indexado en esta URL: photos.topicshow.com/… y el segundo en esto: images5.fanpop.com/image/photos/30600000/… En todos los casos que pude encontrar, hay una URL http para la imagen también.
Stephen Ostermiller

1
La cadena codificada @StephenOstermiller puede contener espacios: goo.gl/RF8r07 . rellenaré una imagen con EXIF, la codificaré, publicaré y miraré, ya sea que aparezca en el índice.
Evgeniy

3
John Mueller (de Google) indica aquí que Google generalmente no indexa imágenes de URI de datos. Muchas herramientas en línea utilizadas para codificarlas también eliminarán los metadatos, por lo que realmente depende de cómo se codifique si se mantiene la información EXIF ​​... pero dado que no están indexados de todos modos, es un punto discutible. Háganos saber sus resultados (asegúrese de no permitir que la URL de la imagen se indexe; Google también utiliza el reconocimiento de imágenes para poder utilizar la información EXIF ​​de las imágenes coincidentes).
dan

1
@dan gracias! ¡Su enlace a la respuesta de John Muellers aclara muchas cosas ahora a la vez! Si G no indexa imágenes, donde no puede obtener un URI, entonces uno no necesita considerar si EXIF ​​se deja adentro o no.
Evgeniy

3
Como se vincula anteriormente, actualmente no los indexamos como imágenes por separado. Eso podría cambiar en el futuro, pero al menos por el momento, desearía usar URL de imagen separadas si desea que esas imágenes se indexen en Búsqueda de imágenes.
John Mueller

2

Si bien Google usa imágenes como URI de datos codificados en base64 en su propio SERP, no indexa esas imágenes en otros sitios web. Gracias a @dan, quien me señaló la discusión de Grupos de Google, donde John Mueller explica este problema . También significa que la pregunta sobre la existencia de datos EXIF ​​en tales imágenes no es relevante.

Esta explicación deja en claro, a qué imágenes es mejor aplicar esta técnica de optimización del rendimiento: imágenes pequeñas, como iconos, favicons y botones, y esas imágenes, que no ofrecen ningún valor adicional para el contenido del sitio.

En el otro sitio, si uno debe incrustar categóricamente una imagen CON valor de contenido adicional como URI de datos codificados en base64, la única mejor práctica para proporcionar metadatos de la imagen es usar el marcado de Schema.org, donde es posible negociar datos EXIF, por ejemplo, con esto tipo de marcado.

Otro tipo de marcado prometedor para negociar datos con aspecto de "propiedad: valor", como es EXIF, tiene en este momento un estado de propuesta. Pero este artículo del blog de Google muestra fragmentos estructurados, que pueden generarse mediante la propuesta de marcado que he vinculado anteriormente.

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.