Instalé Spark usando la guía AWS EC2 y puedo iniciar bien el programa usando el bin/pyspark
script para llegar al indicador de chispa y también puedo hacer el inicio rápido exitosamente.
Sin embargo, no puedo por mi vida descubrir cómo detener todo el INFO
registro detallado después de cada comando.
He intentado casi todos los escenarios posibles en el código a continuación (comentando, configurando como DESACTIVADO) dentro de mi
archivo en la conf
carpeta desde donde inicio la aplicación, así como en cada nodo y nada está haciendo nada. Todavía recibo el registroINFO
impresión de las declaraciones de después de ejecutar cada declaración.
Estoy muy confundido con cómo se supone que esto funciona.
#Set everything to be logged to the console log4j.rootCategory=INFO, console
log4j.appender.console.layout.ConversionPattern=%d{yy/MM/dd HH:mm:ss} %p %c{1}: %m%n
# Settings to quiet third party logs that are too verbose$exprTyper=INFO$SparkILoopInterpreter=INFO
Aquí está mi classpath completo cuando uso SPARK_PRINT_LAUNCH_COMMAND
Comando Spark: /Library/Java/JavaVirtualMachines/jdk1.8.0_05.jdk/Contents/Home/bin/java -cp: /root/spark-1.0.1-bin-hadoop2/conf: /root/spark-1.0.1 -bin-hadoop2 / conf: /root/spark-1.0.1-bin-hadoop2/lib/spark-assembly-1.0.1-hadoop2.2.0.jar: /root/spark-1.0.1-bin-hadoop2/lib /datanucleus-api-jdo-3.2.1.jar:/root/spark-1.0.1-bin-hadoop2/lib/datanucleus-core-3.2.2.jar:/root/spark-1.0.1-bin-hadoop2 /lib/datanucleus-rdbms-3.2.1.jar -XX: MaxPermSize = 128m -Djava.library.path = -Xms512m -Xmx512m org.apache.spark.deploy.SparkSubmit spark-shell --class org.apache.spark. repl.Main
contenido de
