Mi experiencia: 4 semanas en el mundo de Hadoop. Se metió un poco en Hive, Pig y Hadoop usando la máquina virtual Hadoop de Cloudera. He leído el documento de Google sobre Map-Reduce y GFS ( enlace PDF ).
Entiendo que-
Lenguaje de Pig Pig Latin es un cambio de (se adapta a la forma en que los programadores piensan) SQL como un estilo de programación declarativo y el lenguaje de consulta de Hive se parece mucho a SQL.
El cerdo se sienta encima de Hadoop y, en principio, también puede sentarse encima de Dryad. Podría estar equivocado, pero Hive está estrechamente relacionado con Hadoop.
Los comandos Pig Latin y Hive compilan para asignar y reducir trabajos.
Mi pregunta: ¿Cuál es el objetivo de tener ambos cuando uno (por ejemplo, Pig) podría servir el propósito? ¿Es solo porque Pig es evangelizado por Yahoo! y colmena por Facebook?