Creo que su pregunta debe coincidir con una respuesta que sea igualmente fluida y de mente abierta como la pregunta misma. Entonces, aquí están mis dos analogías.
Primero, a menos que sea un matemático puro, probablemente le enseñaron probabilidades y estadísticas univariantes primero. Por ejemplo, lo más probable es que su primer ejemplo OLS haya sido probablemente en un modelo como este:
Lo más probable es que haya las estimaciones minimizando realmente la suma de mínimos cuadrados:
Luego, escribe los FOC s para los parámetros y obtiene la solución:
yi=a+bxi+ei
TSS=∑i(yi−a¯−b¯xi)2
∂TTS∂TTS∂a¯=0
Luego, te dicen que hay una manera más fácil de hacer esto con notación vectorial (matriz):
y=Xb+e
y el TTS se convierte en:
TTS=(y−Xb¯)′(y−Xb¯)
Los FOC son:
2X′(y−Xb¯)=0
Y la solución es
b¯=(X′X)−1X′y
Si eres bueno en álgebra lineal, seguirás con el segundo enfoque una vez que lo hayas aprendido, porque en realidad es más fácil que escribir todas las sumas en el primer enfoque, especialmente una vez que entras en las estadísticas multivariadas.
Por lo tanto, mi analogía es que pasar de las matrices a los tensores es similar a pasar de los vectores a las matrices: si conoce los tensores, algunas cosas se verán más fáciles de esta manera.
Segundo, ¿de dónde vienen los tensores? No estoy seguro de toda la historia de esto, pero los aprendí en mecánica teórica. Ciertamente, teníamos un curso sobre tensores, pero no entendía cuál era el trato con todas estas formas elegantes de intercambiar índices en ese curso de matemáticas. Todo comenzó a tener sentido en el contexto del estudio de las fuerzas de tensión.
Entonces, en física también comienzan con un ejemplo simple de presión definida como fuerza por unidad de área, por lo tanto:
Esto significa que puede calcular el vector de fuerza multiplicando la presión (escalar) por la unidad de área (vector normal). Es entonces cuando tenemos solo una superficie plana infinita. En este caso solo hay una fuerza perpendicular. Un globo grande sería un buen ejemplo.F=p⋅dS
FpdS
Sin embargo, si está estudiando la tensión dentro de los materiales, está tratando con todas las direcciones y superficies posibles. En este caso, tiene fuerzas sobre cualquier superficie dada que tira o empuja en todas las direcciones, no solo las perpendiculares. Algunas superficies están desgarradas por fuerzas tangenciales "de lado", etc. Por lo tanto, su ecuación se convierte en:
La fuerza sigue siendo un vector y el área de la superficie todavía está representada por su vector normal , pero es un tensor ahora no es escalar.F=P⋅dS
FdSP
Ok, un escalar y un vector también son tensores :)
Otro lugar donde los tensores se muestran naturalmente es la matriz de covarianza o correlación. Solo piense en esto: ¿cómo transformar una matriz de correlación en otra ? Te das cuenta de que no podemos hacerlo de esta manera:
donde porque necesitamos mantener todos los positivos semi-definidos.C0C1Cθ(i,j)=C0(i,j)+θ(C1(i,j)−C0(i,j)),
θ∈[0,1]Cθ
Entonces, tendríamos que encontrar la ruta manera que , donde es una pequeña perturbación de una matriz. Hay muchos caminos diferentes, y podríamos buscar los más cortos. Así es como entramos en la geometría riemanniana, múltiples y ... tensores.δCθC1=C0+∫θδCθδCθ
ACTUALIZACIÓN: ¿qué es tensor, de todos modos?
@amoeba y otros tuvieron una discusión animada sobre el significado de tensor y si es lo mismo que una matriz. Entonces, pensé que un ejemplo está en orden.
Digamos, vamos a un bazar a comprar comestibles, y hay dos tipos de comerciantes, y . Nos dimos cuenta de que si prestamos dólares para y dólares para continuación nos vende libras de manzanas, y vende US naranjas. Por ejemplo, si pagamos tanto 1 dólar, es decir, , entonces debemos obtener 1 libra de manzanas y 1,5 de naranjas.d1d2x 1 d 1 x 2 d 2 d 1 y 1 = 2 x 1 - x 2 d 2 y 2 = - 0.5 x 1 +x1d1x2d2d1y1=2x1−x2d2y2=−0.5x1+2x2x1=x2=1
Podemos expresar esta relación en forma de matriz :P
2 -1
-0.5 2
Entonces los comerciantes producen esta cantidad de manzanas y naranjas si les pagamos dólares:
xy=Px
Esto funciona exactamente como una matriz por multiplicación vectorial.
Ahora, digamos que en lugar de comprar los productos de estos comerciantes por separado, declaramos que hay dos paquetes de gastos que utilizamos. Pagamos ambos 0.71 dólares, o pagamos 0.71 dólares y exigimos 0.71 dólares de . Como en el caso inicial, vamos a un bazar y gastamos en el paquete uno y en el paquete 2.d1d2z1z2
Entonces, veamos un ejemplo donde gastamos solo en el paquete 1. En este caso, el primer comerciante obtiene dólares, y el segundo comerciante obtiene el mismo . Por lo tanto, debemos obtener las mismas cantidades de productos que en el ejemplo anterior, ¿no?z1=2x1=1x2=1
PP
P
P
d¯1,d¯2diid¯′1,d¯′2, que también es una simple rotación de la primera base 45 grados en sentido antihorario. También es una descomposición de PC de primera base. Por lo tanto, estamos diciendo que cambiar a los paquetes es un simple cambio de coordenadas, y no debería cambiar los cálculos. Tenga en cuenta que esta es una restricción externa que impusimos al modelo. No proviene de las propiedades matemáticas de las matrices.
x=x1d¯1+x2d¯2P=∑ijpijd¯id¯j
y=y1d¯1+y2d¯2yii
y=Pz
z=z1d¯′1+z2d¯′2
y=y1d¯1+y2d¯2P=∑ijp′ijd¯′id¯′j
PAd¯′=Ad¯
x1=x2=1z1=0.71,z2=0