Espero que esta pregunta sea la más adecuada en este sitio ...
En Python, por lo general, el nombre de la clase se define utilizando la letra mayúscula como primer carácter, por ejemplo
class Vehicle:
...
Sin embargo, en el campo del aprendizaje automático, a menudo los datos de entrenamiento y prueba se definen como X
y Y
- no x
y y
. Por ejemplo, ahora estoy leyendo este tutorial sobre Keras , pero usa el X
y Y
como sus variables:
from sklearn import datasets
mnist = datasets.load_digits()
X = mnist.data
Y = mnist.target
¿Por qué se definen como letras mayúsculas? ¿Existe alguna convención (al menos en Python) entre el campo de aprendizaje automático de que es mejor usar la letra mayúscula para definir estas variables?
¿O tal vez las personas distinguen las variables mayúsculas y minúsculas en el aprendizaje automático?
De hecho, el mismo tutorial luego distingue estas variables como las siguientes:
from sklearn.cross_validation import train_test_split
train_X, test_X, train_y, test_y = train_test_split(X, Y, train_size=0.7, random_state=0)