Diría que DryadLinq es lo más parecido que tenemos los .NET a Hadoop. Pero depende de para qué quieras usar hadoop. Si está buscando el sistema optimizado de archivos distribuidos de mantenimiento automático (DFS), DryadLINQ no es lo que está buscando. Tiene un análogo al DFS pero tienes que construir manualmente las particiones y distribuir cada partición.
Dicho esto, si es el aspecto de ejecución distribuida de Hadoop lo que está buscando, DryadLINQ es realmente maravilloso (y no, no estoy afiliado a MS). Siempre que tenga una configuración de clúster de HPC de Microsoft, comenzar con DryadLINQ es realmente fácil.
El código que escribe es realmente código LINQ directo, excepto que en lugar de ejecutar el LINQ en el IEnumerable<T>
que tiene que ejecutarlo PartitionedTable<T>
(la estructura de datos distribuida autoconstruida).
Lo que ha sido realmente genial de DryadLINQ es el tiempo de respuesta rápido (probar, probar, ajustar, repetir) al desarrollar algoritmos. Simplemente escriba el código LINQ para hacer sus cálculos y DryadLINQ se encargará de toda la parte de ejecución distribuida. Es el análogo más natural que he encontrado que hace que la escritura de código para el procesamiento distribuido sea igual que la escritura de código para el procesamiento de un solo proceso.