Ampliación de lexicones de opinión específicos de dominio usando representaciones continuas de palabras

Tomás López Solaz, Fermín L. Cruz, Fernando Enríquez

Resumen


En este trabajo abordamos la ampliación de lexicones de opinión específicos de dominio a partir de textos del dominio elegido. El método se basa en la construcción de clasificadores que catalogan las palabras de entrada como positivas, negativas o neutras, y en un criterio estricto de selección de las palabras que pretende garantizar la precisión de las nuevas incorporaciones al lexicón. Se utilizan representaciones continuas de palabras (word embeddings) como espacio de características de los clasificadores. Los resultados confirman que dichas representaciones contienen información relativa a la polaridad de las palabras, obteniéndose una precisión en la selección de los candidatos y en la estimación de su polaridad de alrededor del 94% para los tres dominios analizados, con una cobertura en torno al 50% de las palabras de opinión contenidas en los textos de partida.

Texto completo:

PDF