He creado un modelo LSTM para predecir preguntas duplicadas en el conjunto de datos oficial de Quora. Las etiquetas de la prueba son 0 o 1. 1 indica que el par de preguntas está duplicado. Después de construir el modelo usando model.fit
, pruebo el modelo usando model.predict
los datos de prueba. La salida es una matriz de valores similar a la siguiente:
[ 0.00514298]
[ 0.15161049]
[ 0.27588326]
[ 0.00236167]
[ 1.80067325]
[ 0.01048524]
[ 1.43425131]
[ 1.99202418]
[ 0.54853892]
[ 0.02514757]
Solo estoy mostrando los primeros 10 valores en la matriz. No entiendo qué significan estos valores y cuál es la etiqueta predicha para cada par de preguntas.