¿Largo? Microsoft tardó casi 8 años en hacer que CSS2 simple apenas funcionara en IE7, mientras que el soporte DOM1 en JavaScript todavía está roto en IE8. Esa es la especificación de 1998.
Es por eso que no verá una amplia adopción de HTML5 en multimedia en los próximos 20 años. Es muy complicado, inacabado, el rendimiento apesta. Incluso cosas simples como websockets están desactivadas por razones de seguridad.
Algunas cosas no funcionarán como estándares abiertos. ¿Está haciendo juegos o MM en un entorno que debería funcionar en thin client y soportar una degradación elegante? Eso es una locura.
EDITADO: Sí, primero es la complicación excesiva. Tiene un complemento flash que es el mismo en todos los navegadores y funciona de la misma manera cada vez. Esa es una solución simple y efectiva. Una interfaz, realiza el cambio una vez, vuelve a compilar y viola: tienes un complemento para todos los navegadores en el mercado, utilizando una capa intermedia entre el navegador y el complemento.
Por otro lado, tiene 10 navegadores y desea agregar, por ejemplo. soporte multimedia / película. Eso significa que cada empresa tendrá que implementar un reproductor multimedia desde cero, además de que todos quieren algo diferente. Apple quiere H.264 para que los propietarios de sitios web les paguen regalías por códec para reproducir películas, Google y Mozilla quieren VP8 para que su negocio no se vea afectado por las patentes de Apple, etc.
Por lo tanto, termina implementando cosas que todos quieren (mientras VP8 o H.264 lo harían, para empezar).
Entonces, antes de que puedan superar sus diferencias, Adobe implementará H.264 en flash, use su pila de transmisión y DRM ya disponible y ... está listo. 3-4 meses y tienes una tecnología que funciona con una tasa de adopción del 98%.
Simple, decide una compañía, para que puedan impulsar cambios masivos rápidamente y no tengan que agregar "ideas" de otros 20 miembros del "cuerpo de estandarización". Además de HTML5, está quizás 10-15 años atrás de flash, en multimedia. La brecha solo se hará más grande. En MAX avant reciente, se podía ver el soporte de los controladores de juegos y las aplicaciones de carreras 3D de pantalla completa, que se ejecutan en flash en FPS completo, soporte de aceleración de hardware, etc. Mientras tanto, Mozilla ahora puede reproducir video H.246 sin bloquear el navegador, pero solo reproducirlo. Todavía falta alguna funcionalidad adicional (como pantalla completa, transmisión, avance rápido).
Además, creo que W3C solo está desperdiciando recursos al tratar de hacer de HTML5 una copia de flash a medio cocer. No funcionará ... es como tratar de hacer flash una copia de HTML. No funciona