Comprender y aplicar el análisis de sentimientos

9

Me acababan de asignar un proyecto para realizar análisis de sentimientos para algunas colecciones de documentos. Al buscar en Google, ha surgido una gran cantidad de investigaciones relacionadas con los sentimientos.

Mis preguntas son:

¿Cuáles son los principales métodos / algoritmos para el análisis de sentimientos en el campo del aprendizaje automático y el análisis estadístico?
¿Hay resultados bien establecidos?
¿Existe algún software de código abierto que pueda realizar el análisis de sentimientos?

— user3269
fuente

4

Pruebe SentiStrength, que funciona bien en comparación con algoritmos similares, y los trabajos de investigación asociados. La discusión de otras herramientas y métodos se puede encontrar aquí y aquí .

— Vladtn
fuente

4

Tengo la impresión de que gran parte de lo que se está haciendo aquí es extremadamente heurístico. De hecho, la mayoría de las personas parecen aplicar esto a los <120 caracteres de las declaraciones de Twitter. Probablemente los resultados (aunque no se calculan de esta manera) no son mucho mejores que contar palabras "positivas" y "negativas" con una pequeña información de posición ("A mejor que B" = positivo para A, negativo para B)

Cuando ves empresas comprando un feed completo de Twitter (¿cuántos mbit por segundo?) Y afirmando hacer un análisis de opinión al respecto, esto en serio me hace preguntarme si hay alguna validez estadística aquí. No es de extrañar, por ejemplo, Yahoo falló gravemente al predecir las preelecciones para Carolina del Sur: http://www.technologyreview.com/web/39487/

La gente es manera de orgullo y afilado en sólo estar en absoluto capaz de procesar la cantidad de datos, que parecen totalmente a la negligencia validar correctamente su rendimiento.

Lamento ser tan pesimista sobre el estado del arte.

— HA SALIDO - Anony-Mousse
fuente