Álgebra simbólica por computadora para estadísticas


8

¿Qué funcionalidad debería existir en un CAS específicamente orientado a las estadísticas?

Los sistemas de álgebra simbólica como Mathematica y Maple a menudo se usan para problemas de cálculo, lógica y física, pero rara vez se usan para estadísticas. ¿Por qué es esto?

¿Qué construcciones estadísticas podrían agregarse a un sistema de álgebra simbólica para mejorar su uso en este campo? ¿Cuáles son algunos ejemplos de código específicos que a muchas personas les gustaría poder hacer?

Piense en los siguientes tres usuarios: estadístico de investigación, investigador no estadístico que usa estadísticas en otro campo (como biología), estudiante de estadística.

Trabajaré en el código de estadísticas de SymPy durante los próximos meses y me gustaría solicitar información para la funcionalidad deseada. Las cosas que uso no son necesariamente las que usa la comunidad en general.


Hay un paquete dedicado a las estadísticas, vea el proyecto R para computación estadística ( r-project.org ).
Roman Luštrik 05 de

1
Sí, R es genial para las estadísticas. Sin embargo, tiende a especializarse en cálculos en su mayoría numéricos. Estoy interesado en lo que podemos hacer para ayudar a los investigadores en manipulaciones simbólicas.
MRocklin 05 de

2
No es evidente que ninguno de estos sistemas simbólicos necesite "construcciones estadísticas" añadidas a ellos. Mathematica ha hecho mucho de eso en la versión 8, pero aún no es probable que se convierta en una plataforma popular para estadísticas aplicadas o estudiantes. Una razón es que un buen software de estadísticas soporta el trabajo no matemático mucho mejor que el software matemático: ingreso de datos, administración, transformación, consulta y documentación. El software de estadísticas generalmente también admite una gran galería de métodos de visualización de datos.
Whuber

2
No estoy seguro de por qué crees que CAS rara vez se usa en estadísticas; Yo personalmente uso Mathematica todo el tiempo. Casella & Berger incluso tiene un apéndice dedicado a Mathematica. Pero como estadístico, generalmente paso más tiempo con datos que haciendo matemáticas, como señala @whuber.
JMS

2
También reconozca que muchos (¿la mayoría?) Investigadores académicos y estudiantes tienen acceso gratuito a paquetes maduros como Maple y Mathematica a través de máquinas uni y / o licencias de sitio.
JMS

Respuestas:


9

Soporte para álgebra matricial. La gran mayoría de las estadísticas practicadas es multivariante e involucra matrices, y a menudo la simplificación de los formularios matriciales requiere reglas especiales que no se traducen fácilmente de un caso univariado, por lo que un buen soporte matricial sería realmente útil.


2
Esto es algo en lo que Mathematica ya es bueno.
Whuber

Excelente punto ¿Qué se podría agregar a un sistema que ya expresa bien el álgebra lineal? ¿O es suficiente una expresión sólida de matrices?
MRocklin

1
@ MR En lugar de preguntar qué se podría agregar a estos sistemas, piense por qué está haciendo esto. ¿Para quien? ¿Qué usos quieres apoyar? ¿Cuáles son las razones de peso (si las hay) para agregar procedimientos estadísticos a un sistema simbólico? En otras palabras, comience con una buena especificación funcional.
Whuber
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.