LOS SENTIMIENTOS HACIA EL TLCAN, ‘DESMENUZADOS’

LOS SENTIMIENTOS HACIA EL TLCAN, ‘DESMENUZADOS’

22 agosto, 2018 0 Por Rene Davila
Identificar tendencias e investigar patrones de datos en tiempo real.

Con la ciencia de datos es factible realizar descubrimientos en la audiencia de Twitter.

Análisis sobre las negociaciones comerciales entre México, EU y Canadá, a partir de la ciencia de datos y tuits.

Fuente: Ibero

Negociación compleja que no termina de cerrarse es la que ocurre entre las naciones participantes en el Tratado de Libre Comercio de América del Norte (TLCAN). Ante la renovación del Congreso de los Estados Unidos, en noviembre de 2018, y el cambio de gobierno en México, en diciembre de este año, la fecha límite para alcanzar un acuerdo ha llegado y tal vez se vislumbre la posibilidad del retiro de la mesa de negociaciones, en lugar de reiniciarlas en nuevas condiciones y con otros personajes.

Frente a este escenario resulta pertinente aplicar algunas técnicas de ciencia de datos para realizar un análisis de sentimientos sobre el TLCAN, a partir del examen de los tuits publicados por usuarios de la red social Twitter, tomando en cuenta que es un medio directo y de gran impacto en el mundo -el cual supera en inmediatez a los medios de comunicación tradicionales-. Lo anterior es evidente cuando los 140 caracteres permitidos por Twitter son utilizados por personajes relevantes como Donald Trump; prácticamente no hay medio de información en el mundo que no siga las cuentas @realDonaldTrump y @POTUS, del presidente de EU, pues sus mensajes impactan política, económica, social y estratégicamente al mundo entero… además de los millones de tuits y retuits que desencadena la reacción inicial.

La ciencia de datos permite explorar la materia prima de información (publicaciones en Twitter) y transformarla en descubrimientos comprensibles para la toma de decisiones. Por ejemplo ¿cuáles son los términos recurrentes que se mencionan en torno al tema del TLCAN?, ¿cómo está el ánimo de los usuarios al respecto? o ¿el balance es positivo o negativo? Difícilmente, podría llevarse a cabo este análisis sin herramientas de estadística computacional y gráficas, generadas por un software apropiado como ‘R’, el cual es un ambiente de uso libre desarrollado de manera colaborativa por usuarios de todo el mundo, actualmente muy popular en grandes compañías para aplicaciones de análisis de datos, modelación estadística y visualización de resultados.

Para fines de este análisis, se han solicitado 100 tuits en inglés que contengan la palabra NAFTA (siglas en inglés del TLCAN). Al ejecutar el programa, éste buscará una mezcla de publicaciones que será la materia prima a depurar. En términos sencillos, se trata de crear una base de información con los tuits de los usuarios respecto a un tema de interés, la cual se limpiará de caracteres innecesarios hasta obtener un vector de palabras denominado corpus, que contiene la semántica de los mensajes; es decir, la interpretación clara y precisa de cada palabra escrita en un tuit.

Por lo tanto, el corpus deberá omitir signos de puntuación, palabras que no contienen información de importancia, como artículos y preposiciones, números, espacios en blanco; entre otros caracteres especiales. Así, la programación en ‘R’ permite obtener un gráfico de palabras recurrentes en la base de datos; en la nube de palabras resultante, el tamaño y color de cada una de ellas indica su frecuencia o importancia en el corpus.

Gracias a la ciencia de datos es factible realizar descubrimientos en la audiencia de Twitter, identificar tendencias e investigar patrones de datos sobre publicaciones en tiempo real; por ejemplo, movimiento de mercados, tendencias emergentes, tópicos relevantes, noticias de última hora, entre otros contextos inciertos, expuso Robert Hernández Martínez, coordinador de la Licenciatura en Actuaría de la Universidad Iberoamericana (Ibero) Ciudad de México.