Para experimentar, nos gustaría usar el Emoji incorporado en muchos Tweets como datos de verdad / entrenamiento básicos para un simple análisis cuantitativo de opiniones. Los tweets generalmente no están estructurados para que la PNL funcione bien.
De todos modos, hay 722 Emoji en Unicode 6.0, y probablemente se agregarán otros 250 en Unicode 7.0.
¿Existe una base de datos (como, por ejemplo, SentiWordNet) que contenga anotaciones de opinión para ellos?
(Tenga en cuenta que SentiWordNet también permite significados ambiguos . Considere, por ejemplo , gracioso , lo que no solo es positivo: "esto sabe gracioso" probablemente no sea positivo ... lo mismo ocurrirá, ;-)
por ejemplo. Pero no creo que esto sea más difícil para Emoji que para palabras comunes ...)
Además, si tiene experiencia con su uso para el análisis de sentimientos, me interesaría saberlo.