Últimamente, he visto que scribd hace que sea muy difícil para los usuarios (usuarios gratuitos) navegar a través de un documento alojado en su sitio. No existe la posibilidad de buscar dentro de un documento, y mucho menos poder descargar el mismo.
Al usar JavaScript, cargan páginas a pedido en el navegador, por lo que la función "guardar como" del navegador no ayuda mucho.
Para mi sorpresa, ¡vi que incluso copiar / pegar copias de texto galimatías en el portapapeles! Para verificar qué estaba mal, apagué javascript en el navegador y luego cargué el mismo documento nuevamente. Voila, vi el galimatías. Y así, parece que el javascript de scribd de alguna manera decodifica el texto galimatías y luego lo muestra en el navegador.
Ahora, mi pregunta es, incluso después de que javascript esté habilitado, y el texto se represente correctamente en el navegador, si voy y miro los objetos DOM correspondientes al texto que selecciono, aún veo el texto galimatías.
Entonces, ahora estoy confundido. El texto se muestra bien al usuario, pero los objetos DOM todavía contienen galimatías. Entonces, la pregunta es, ¿qué tipo de ganchos / código javascript está usando el sitio, para poder retener el galimatías en los objetos DOM y aún representar el texto decodificado?
¿Hay alguna manera de acceder al texto decodificado? Mi intención no es aplicar ingeniería inversa al algoritmo para decodificar, sino localizar dónde se almacena el texto decodificado.
El documento de ejemplo es:
¡Vea lo que sucede cuando activa / desactiva Javascript!