Preguntas etiquetadas con distributed-computing

5
Explicando Apache ZooKeeper
Estoy tratando de entender ZooKeeper, cómo funciona y qué hace. ¿Hay alguna aplicación que sea comparable a ZooKeeper? Si lo sabes, ¿cómo describirías ZooKeeper a un laico? He intentado apache wiki, zookeeper sourceforge ... pero todavía no puedo relacionarme con él. Acabo de leer a través de http://zookeeper.sourceforge.net/index.sf.shtml , entonces …

13
Spark - repartition () vs coalesce ()
De acuerdo con Learning Spark Tenga en cuenta que repartir sus datos es una operación bastante costosa. Spark también tiene una versión optimizada de repartition()llamadas coalesce()que permite evitar el movimiento de datos, pero solo si está disminuyendo el número de particiones RDD. Una diferencia que obtengo es que con repartition()el …




25
Calcular la mediana de mil millones de números
Si tiene mil millones de números y cien computadoras, ¿cuál es la mejor manera de localizar la mediana de estos números? Una solución que tengo es: Divide el conjunto por igual entre las computadoras. Clasifícalos. Encuentra las medianas para cada conjunto. Ordenar los conjuntos en las medianas. Combina dos conjuntos …
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.