Sin tener en cuenta las posibles restricciones computacionales, ¿existen aplicaciones generales en las que la lematización sería un paso contraproducente al analizar datos de texto?
Por ejemplo, ¿sería la lematización algo que no se hace cuando se construye un modelo sensible al contexto?
Como referencia, la lematización por dictinory.com es el acto de agrupar las formas flexionadas de (una palabra) para su análisis como un solo elemento.
Por ejemplo, la palabra 'cocinar' es el lema de la palabra 'cocinar'. El acto de lematización es, por ejemplo, reemplazar la palabra cocinar con cocinar después de haber tokenizado sus datos de texto. Además, la palabra 'peor' tiene 'malo' como lema, y como el ejemplo anterior reemplaza la palabra 'peor' por 'malo' es la acción de la lematización.