Uso de lenguajes de programación no convencionales para computación científica [cerrado]


22

Nota: la siguiente publicación puede incluir opiniones controvertidas, así que tenga en cuenta que son solo mis opiniones y no tienen la intención de ofender a nadie.

Estoy programando de alguna forma u otra desde alrededor de 1999. Inicialmente usé R, y luego, alrededor de 2004, cambié principalmente a Python.

Para muchas aplicaciones científicas, por ejemplo, la simulación, que incluye cosas como MCMC, tanto R como Python son demasiado lentos y deben acelerarse. La forma habitual de hacerlo es mediante la extensión con C o C ++. Para R y Python, esto es lo que hice, usando la API de R de C con C ++ y la biblioteca Boost Python con Python.

Sin embargo, por varias razones, esta combinación no es la solución ideal. ¿Qué es importante en la programación, particularmente los algoritmos? Expresividad y velocidad, que por supuesto están relacionadas. Cuanto más expresivo es un idioma, más rápido se puede escribir en él.

1) En lo que respecta a la expresividad, ni R ni Python son realmente ideales para escribir algoritmos científicos en mi opinión. No se asignan de cerca al algoritmo subyacente. Sin embargo, ambos son considerablemente mejores que C ++.

2) Disfruto escribiendo en Python, que es un lenguaje agradable, aunque, como se señaló anteriormente, no es ideal para el trabajo algorítmico. Sin embargo, cuando uno tiene que trabajar con una combinación Python / C ++ debido a problemas de velocidad, esta mezcla se vuelve mucho menos agradable para trabajar. Lo que suele suceder es que primero escribo en Python, y una vez que tengo algo que funciona bien, a menudo descubro que es demasiado lento (por algún valor subjetivo de demasiado lento). Luego me enfrento a la decisión de pasar una cantidad de tiempo irrazonable reescribiéndola en C ++ o tolerar la lentitud. En retrospectiva, a menudo siento que podría haber sido mejor soportar la lentitud, especialmente porque las aceleraciones obtenidas son impredecibles. Además, la interfaz de Boost Python entre los dos es un dolor de cabeza de mantenimiento significativo, y tener código en dos idiomas muy diferentes pegados de esta manera es simplemente una distracción. No se pretende criticar a Boost Python, es una interfaz tan poderosa como uno podría imaginar, y prácticamente funciona la mayor parte del tiempo.

Ahora, en un mundo ideal, con tiempo y recursos ilimitados, ninguno de estos problemas sería un gran problema. Sin embargo, en proyectos científicos en los que he trabajado, he tenido la siguiente experiencia.

Ya sea que tenga o no colaboradores en el proyecto, siempre parezco terminar haciendo la gran mayoría de la informática. En un total de 5 proyectos importantes, solo tuve una participación sustancial de una persona en un proyecto. Esa persona hizo más que jalar su peso; hizo tanto como yo o más. Sin embargo, en todos los demás casos, incluidos los proyectos con múltiples colaboradores, he realizado (prácticamente) todo el trabajo computacional. Si bien puedo decir que no he sido bendecido con los mejores colaboradores (parece ser una mezcla de pereza e incompetencia), no tengo claro si es probable que este estado de cosas cambie en el futuro.

El trabajo científico computacional es un esfuerzo enorme, y si no puedo cambiar el comportamiento de mis colaboradores, puedo cambiar la forma en que trabajo. La mejora más importante sería hacer las cosas más rápido. Lo que me lleva a la consideración principal aquí, que es que cambiar los idiomas a algo menos ortodoxo puede ayudar. Según investigaciones anteriores, los candidatos más probables en orden de probabilidad son Common Lisp y Ocaml. He estado pensando en esto durante años, pero recientemente lo he estado pensando más en serio.

Por lo que puedo decir, pocas personas usan CL u Ocaml para el cálculo científico. Al buscar en este sitio, encontré dos referencias a CL (una era mía) y otra a Ocaml (mía). He tenido un par de contactos alentadores a lo largo de los años con personas aventureras que trabajan en la periferia. En 2008 me encontré con una crítica de libro de "Practical Common Lisp" de Peter Seibel (que yo poseo), de Tamas K. Papp. Esto me llamó la atención, ya que era una de las pocas menciones de computación científica para Lisp que había encontrado en la red. Le escribí a Tamas, quien inmediatamente respondió de manera útil y alentadora. Para citarlo

Mi productividad de programación probablemente se multiplicó por diez con Lisp, pero eso tardó alrededor de un año y todavía estoy aprendiendo (sin embargo, me fue bastante bien después de 2 meses). Entonces, si está trabajando en algo de tiempo crítico, posponga el cambio.

Debería considerar preguntarle a la gente por cll, no soy el único que sabe sobre estas cosas, otros hacen computación científica en Lisp.

También tiene un blog y una página de GitHub .

Otra persona con la que mantuve un breve contacto (en diciembre de 2006) fue Ira Kalet , quien ha usado Common Lisp en el contexto de la oncología de radiación.

Quizás hay otros que hacen computación científica en Lisp, pero no conozco a nadie.

El problema más común que la gente cita con CL es la falta de bibliotecas. Este es un problema grave en la informática de uso general, pero puede no serlo tanto en la informática científica, particularmente desde las implementaciones de algoritmos desde cero. Específicamente, puedo pasar la mayor parte del tiempo con una biblioteca matemática básica, que incluye funciones de distribución de probabilidad, una biblioteca de matriz multidimensional y un conjunto básico de contenedores, por ejemplo, mapa, conjunto, lista, etc., como se encuentra en las bibliotecas estándar de C ++ y Python.

Sé incluso menos sobre Ocaml que sobre CL, pero lo lancé como una alternativa. Supuestamente es muy rápido, tiene una implementación gratuita por parte de investigadores franceses y parece ser el más viable de la familia de lenguajes ML para computación científica.

Para concluir, me pregunto si otros tienen experiencia con esto, y qué pensamientos tienen, si los hay.

EDITAR: Estoy principalmente interesado en la experiencia de primera mano, en el contexto de los problemas que he discutido anteriormente. Por ejemplo, si solía usar Python y C ++ (o R y C ++) y se mudaba a un lenguaje más oscuro, estaría más interesado en escuchar sus experiencias.


2
¡El intercambio de pilas es para hacer preguntas, no para publicar historias de vida! Su pregunta parece ser "¿Hay algún proyecto de computación científica que use Common Lisp u OCaml", ¿verdad?
Khinsen

44
De acuerdo, esto se lee un poco más como una publicación de blog, pero me gusta la premisa. ¿Hay alguna posibilidad de que intentes reducir esto a 2-3 párrafos?
Aron Ahmadia

1
También de acuerdo. Los comentarios y la experiencia personal son buenos cuando respaldan la pregunta principal; demasiados detalles pueden saturar los puntos principales. Si puede condensar su pregunta, creo que sería más fácil de leer y obtendría respuestas más específicas y de mayor calidad.
Geoff Oxberry

1
@FaheemMitha: En el "mundo ideal" que mencionas a mitad de camino, todo sería un montaje optimizado a mano ... ¡Suena pésimo para mí!
meawoppl

3
@FaheemMitha: Lo mejor que creo que podrías hacer para mejorar tu pregunta es aclarar la pregunta que estás haciendo. Parece que estás contando una historia sobre tus experiencias (lo cual está bien), y luego, al final, entierras la pregunta como una declaración al final de tu historia. ("Para concluir, me pregunto ...") Lo mejor que puede hacer es hacer que esa parte sea una pregunta, para que las personas que lean su pregunta puedan identificar fácilmente lo que pregunta. Tuve que regresar un par de veces para resolverlo.
Geoff Oxberry

Respuestas:


18

Desarrollamos a Julia por exactamente las razones planteadas. Simplemente no había un buen lenguaje informático científico de alto nivel que también ofreciera un rendimiento lo suficientemente bueno, que no tuviera que seguir reescribiendo partes de su código en C / Fortran. El diseño de julia tiene una influencia bastante clara, por lo que puede ser de su agrado, mientras que sus colaboradores pueden tratarlo como un matlab o R si no les importan las partes funcionales. La desventaja es que el lenguaje es nuevo y aún no tiene todas las bibliotecas que se necesitarían para el uso diario.

Mark, me encantaría agregar a Julia a su punto de referencia para ver cómo nos va. Vaya a nuestra lista de correo y díganos qué le gustaría ver en julia para que le sea más útil.


Eso se ve hermoso! Definitivamente voy a comprobar esto por mi propio trabajo. Actualmente uso Python para todo mi trabajo en materia condensada teórica, solo porque el tiempo ganado al tener un código C ++ rápido es negado por el tiempo dedicado a escribir en C ++ en primer lugar :)
Lagerbaer

9

La velocidad, el tamaño y la confiabilidad de los lenguajes de programación hacen un muy buen trabajo al concluir muchas preocupaciones diferentes expresadas en su "pregunta". ¡Compara la velocidad y el tamaño de la base de código de un conjunto de implementaciones de los mismos puntos de referencia en 33 idiomas!

Me he convertido en un amante de Python principalmente porque es mucho más común tener un exceso de tiempo de computación que un exceso de tiempo para programar. Estoy más que dispuesto a malgastar los ciclos de CPU que a sacrificar un poco de tiempo que podría dedicarse a algo más interesante.

Además, +1 en Julia. Creo que puedo cambiar a él cuando se vuelva un poco más estable y ampliamente compatible, es decir, cuando los módulos estándar se envuelvan para el trabajo que me gusta hacer.


4

Para aplicaciones científicas de OCaml, ver por ejemplo

Para Lisp en ciencia, ver por ejemplo

Estoy seguro de que hay muchas más referencias. Sin embargo, no puedo citar ningún proyecto de investigación importante en el que se haya realizado trabajo computacional en OCaml o Lisp. Elegir cualquiera de los dos significa trabajar en un relativo aislamiento.

También te puede interesar Julia , un nuevo lenguaje para la computación científica actualmente en desarrollo, con claras influencias de Lisp.


1
Quizás debería haber dejado más claro que estoy principalmente interesado en la experiencia de primera mano. Editaré mi pregunta para reflejar esto.
Faheem Mitha
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.