En primer lugar, me di cuenta de que si necesito realizar predicciones binarias, tengo que crear al menos dos clases a través de una codificación en caliente. ¿Es esto correcto? Sin embargo, ¿es la entropía cruzada binaria solo para predicciones con una sola clase? Si tuviera que usar una pérdida de entropía cruzada categórica que normalmente se encuentra en la mayoría de las bibliotecas (como TensorFlow), ¿habría una diferencia significativa?
De hecho, ¿cuáles son las diferencias exactas entre una entropía cruzada categórica y binaria? Nunca he visto una implementación de entropía cruzada binaria en TensorFlow, así que pensé que quizás la categórica funciona igual de bien.