PROCESAMIENTO DE LENGUAJE NATURAL APLICADO A FAKE-NEWS
Palabras clave:
Fake-News, Procesamiento de Lenguaje Natural, detecciónResumen
Los ciudadanos están consumiendo masivamente información generada por radio, televisión, periódico, redes sociales, blogs y páginas web. En este nuevo contexto, es fundamental determinar cuando la información consumida es verdadera o falsa. La circulación de información falsa es denominada de Fake-News [1], fenómeno de crecimiento exponencial. La grande desimanación de informaciones falsas perjudica las tomadas de decisiones adecuadas en políticas públicas, económicas y sociales en beneficio del ciudadano. Existen diversos tipos de Fake-News [2] y el procesamiento de las mismas es más complejo según el idioma usado para crearlas o editarlas. La Fake-News es un texto que debe pasar por varias etapas antes de estar preparado para aplicar los métodos de aprendizaje automático. Estas etapas son: dividir el texto en oraciones (split), dividir las oraciones en palabras (tokenization), marcación gramatical (POS tagging), derivar una palabra (stemming), agrupar palabras similares (lemmatization), y remoción de las palabras irrelevantes (stopwords). Las etapas anteriores son realizadas utilizando técnicas y algoritmos de Procesamiento de Lenguaje Natural (PLN) automatizando a detección de Fake-News [3].