What do we say to the algorithm? Not Today!
Datificación crítica y narrativas divergentes

Introducción

En el marco del XI encuentro El mundo al revés: humor, ruido y performance, realizado en la UNAM y organizado por el Hemispheric Institute of Performance and Politics, de la Universidad de Nueva York, Signa_Lab impartió el taller: What do we say to the algorithm? Not today. Datificación crítica y narrativas divergentes.

por Signa_Lab

publicado el


Este taller, dirigido a artistas, académicos y activistas de todo el continente americano, tuvo como objetivo generar, recopilar, analizar y visualizar bases de datos como soporte para la creación de narrativas de resistencia política. De-colonizar los datos / Revertir el algoritmo.

Contexto general. ¿Qué es dato y qué es datificación?

La palabra datum viene del participio pasivo dare, que nos dio dar. Verbo de la raíz indoeuropea do (dar) presente en las palabras donar, don y perdón (http://etimologias.dechile.net/?dato).

Hoy en día, cualquier cosa y acción puede devenir dato, es decir, puede capturarse en una base de datos que alimente una serie de puntos (data points) que a su vez pueden ser utilizados para construir perfiles de usuarios de cualquier aplicación, programa y dispositivo con acceso a internet. A la incesante producción y captura de datos para su mercantilización por parte, sobre todo, de empresas y gobiernos, podemos llamarla “datificación de la realidad”.

El dato, sin embargo, no pre-existe, no es algo que “ya esté dado”, sino que es producido y produce. ¿Qué produce? A la vida como “datable”, o sea, como cuantificable, medible. Al capturar, cuantificar sistematizar y categorizar posibilidades que nos serán arrojadas a partir de nuestras compras, búsquedas, lecturas, películas, series de TV, horarios de trabajo y rutas de traslado registradas por dispositivos con acceso a internet, nos referimos entonces a que estas experiencias son ahora “producidas” por algoritmos en decenas de aplicaciones y programas que usamos o por los que atravesamos todos los días (cámaras de video en las calles, entradas a estaciones de tren, identificadores de iris y de huellas dactilares, etc.). De modo que lo que produce esta datificación es un tipo de experiencia social capturable, y en esa medida, intenta no sólo medirla sino, en ocasiones, predecirla.

Predecir cosas en algunos casos no puede ser tan malo, como cuando el algoritmo de Instagram o de Google nos acercan a modelos de zapatos que estamos buscando y que son acordes a nuestras búsquedas previas, pero sí pueden serlo cuando estos mismos algoritmos nos alejan de aquellas personas y contenidos que contienen ideas que son distintas a las nuestras y que van sentando las bases para asumir que mi forma de pensar es la de todos o, peor aún, que quienes piensan mal no tienen motivo alguno para hacerlo, sino molestar o llevar la contra.

El panorama político actual nos da muestra de las implicaciones negativas que puede tener el direccionamiento que los algoritmos le dan a la experiencia social y del agotamiento de la opinión pública en lo que ofertan estas herramienta. La polarización en la discusión política on-offline, la generación de inmunización negativa (convertirse en una amenaza mayor incluso que aquella supuesta amenaza de la que queremos defendernos a nosotros y a los que piensan como nosotros), y la, en algunos espacios, severa falta de configuración e implementación de proceso serios de alfabetización digital, conllevan a una situación de vulnerabilidad tecnosocial (no sólo se trata de “saber usar” un teléfono móvil o de aprender a abrir una cuenta de Twitter para ofender alguien más, sino de aprender a dimensionar la consecuencias e implicaciones del tipo de uso que hacemos de đ herramientas cuando producimos y/o compartimos un tipo de contenido en específico).

Frente a estas condiciones, es preocupante la construcción de un relato en el entramado medios-redes-calles acerca de, digamos, la política internacional. Escenario importantísimo en tanto supone el rumbo de las sociedades actuales y donde, en muchos casos, lejos de tener una discusión pública on y offline y unos medios de comunicación análogos y digitales preocupados por contextualizar en su justa dimensión el papel de actores locales y globales en la toma de decisiones, estos se empeñan en producir relatos carentes de anclajes críticos, centrados en las consecuencias y con poco abordaje de las causas que generan estas problemáticas. Esto a su vez disminuye las posibilidades de construcción de diálogo crítico, condición sin la cual poco podremos hacer para resolver nuestros problemas.

El conjunto de grafos muestra tres ejemplos de polarización en la discusión política actual: la elecciones al congreso estadounidense, la campaña electoral en Brasil y la disputa alrededor de las personas a favor y en contra de Bolsonaro.
*Desplaza el cursor sobre la imagen para ver a detalle.

Datificación crítica y narrativas divergentes

En este contexto, donde el uso dominante de herramientas de análisis e interpretación big data parte de una lógica pragmática, gubernamental y comercial, Signa_Lab propone pensar en un enfoque de análisis de datos que parta del cuestionamiento hacia las consecuencias sociales que dichos saberes técnicos y sus resultados tienen. Es decir, un enfoque capaz de integrar saberes de las ciencias sociales, las humanidades, el activismo y el pensamiento crítico para generar preguntas de indagación. Se trata de hacer de otro modo, echar a andar pero de otro modo, con otra mirada y hacia otro rumbo, la descarga, minería y visualización de bases de datos masivas.

Las narrativas divergentes, por su parte, abarcan narrativas críticas que buscan trabajar en la producción de relatos que visibilicen desigualdades, exclusiones y prejuicios fomentados por el supuesto erróneo de la objetividad o neutralidad de los datos numéricos y de los algoritmos, con la intención de producir un tipo de “dato anclado” a contextos, situaciones, cuerpos y relatos para contravenir los regímenes de visualidad dominantes.


El taller que Signa_Lab ITESO ofreció en el Encuentro del Hemispheric Institute of Performance and Politicis de la Universidad de Nueva York y realizado en la Ciudad de México del 9 al 15 de junio supuso la utilización de herramientas para descargar bases de datos de Facebook, Youtube e Instagram, a partir de coyunturas políticas actuales y de perfiles personales de quienes participaron.

Los ejercicios giraron alrededor de saber cuáles eran los videos que el algoritmo de Google recomienda a los usuarios de YouTube cuando buscan un video en específico, para lo que se hicieron distintas descargas de datos haciendo llamadas a la API desde su funcionalidad de “videos relacionados” con la herramienta Youtube Data Tools de Digital Methods Initiative. Dichos datos permitieron analizar, visualizar y filtrar las rutas dirigidas de recomendación de un video a otro e incluso calcular comunidades de videos que se refieren entre sí, de acuerdo al análisis algorítmico de su estructura topológica.

Arresto de Nassón García

La cobertura mediática, en redes y en las reacciones públicas al arresto del líder de la iglesia evangélica, La luz del mundo, Joaquín García Naasón fue uno de los temas que se tomó en el taller para utilizar algunas herramientas y anclarlas a una situación política determinada.

El video que se utilizó para armar la muestra de recomendaciones del algoritmo de Youtube fue uno de noticieros televisa, subido el día 5 de junio de 2019.

Noticieros Televisa: “Difunden imágenes de Naasón Joaquín García, líder de ‘La Luz del Mundo’, detenido en California Estados Unidos”

Visualización de la red de videos recomendados por el algoritmo de Youtube a partir del video “Detienen a Naasón Joaquín García; difunden imágenes de la detención de Naasón - Las Noticias” en el canal oficial de Noticieros Televisa, publicado el 5 de junio de 2019.

Nodos(videos en Youtube): 97
Aristas(recomendaciones dirigidas de un video a otro): 1910
Comunidades(agrupamientos de recomendación calculados por modularidad): 3

*Desplaza el cursor sobre la imagen para ver a detalle.
Ir a versión interactiva

El grafo muestra los títulos de los videos que el algoritmo de Google arroja a un usuario de YouTube a través de una ventana de “incógnito” en el navegador Google Chrome. El tamaño de los nodos (títulos de videos) está en función del número de recomendaciones que tiene a partir del algoritmo de la red.


La visualización muestra, en la parte superior, los videos de YouTube (representados por cuadros) recomendados por el algoritmo, con mayor número de reproducciones hasta el 12 de junio de 2019. En la parte inferior (representados por gráficas azul y roja), se muestran los títulos de videos recomendados por mayor número de likes y por mayor número de dislikes hasta la misma fecha.

Esto nos permite identificar los temas y medios que YouTube recomienda a un usuario cualquiera cuando reproduce el video en cuestión.

Nube de palabras utilizadas con mayor frecuencia en el contenido de los comentarios al mismo video, “Difunden imágenes de Naasón Joaquín García, líder de ‘La Luz del Mundo’, detenido en California Estados Unidos”, publicado en el canal oficial de Noticieros Televisa en Youtube.

Uniforme neutro

Otro de los temas elegidos por quienes participaron en el taller fue la polémica sobre la propuesta de uniformes neutros en las escuelas de CDMX.

En esta ocasión, no se descargó un video proveniente de un canal de medios tradicionales en Youtube, sino de una cuenta del youtuber El Tribunazo MX, que mostraba explícitamente desde el título una postura contraria a la propuesta de uniformes neutros (“#NoTeMetasConMisHijos No al UNIFORME NEUTRO Ni A la Equidad De Generó|😡”).

El Tribunazo MX: “#NoTeMetasConMisHijos No al UNIFORME NEUTRO Ni A la Equidad De Generó|😡”

Con una metodología similar, se descargó la red de recomendaciones entre videos relacionados. La descarga y posterior visualización reveló la presencia de agrupamientos claros entre videos provenientes de canales de youtubers, con nodos densamente conectados entre sí y muchos de ellos alejados los videos de recomendaciones desde o hacia medios tradicionales. Particularmente destaca un conjunto de videos, que el software Gephi pudo identificar como una comunidad, provenientes de canales abiertamente pronunciados a favor del gobierno de López Obrador, y que, dentro de la red descargada, el algoritmo de recomendación sólo refiere entre sí mismos, con pocos puentes hacia el resto de componentes de la red.

A continuación se presenta la visualización generada, de la cual también se realizó una versión interactiva.

Visualización de la red de videos recomendados por el algoritmo de Youtube a partir del video “#NoTeMetasConMisHijos No al UNIFORME NEUTRO Ni A la Equidad De Generó|😡” en el canal del youtuber El Tribunazo MX, publicado el 4 de junio de 2019.

Nodos (videos en Youtube): 99
Aristas (recomendaciones dirigidas de un video a otro): 1751
Comunidades (agrupamientos de recomendación calculados por modularidad): 7

*Desplaza el cursor sobre la imagen para ver a detalle.
Ir a versión interactiva

Redes discursivas de etiquetas en Instagram

El taller se centró también en la descarga y visualización de redes de etiquetas en Instagram, donde los nodos representan hashtags y las aristas registran relaciones de coincidencia entre dos de ellos en algún post reciente y accesible públicamente. Las descargas se realizaron llamando a la API de Instagram a partir de hashtags específicos desde la herramienta Instagram Scraper de Digital Methods Initiative.

Como ejercicio del taller, se hicieron descargas sobre los hashtags relacionados al Hemispheric Institute y el encuentro de este año, así como menciones al trabajo de artistas desde hashtags.

Las relaciones registradas en los datos descargados se exploraron desde distintas distribuciones en el software Gephi, que permitían tanto desplegar la estructura topológica y agrupamientos entre coincidencias de hashtags como acentuar los hubs o nodos con mayores conexiones a otros en la red. Este tipo de redes no dirigidas permiten descubrir relaciones semánticas identificables en la combinaciones más recurrentes de hashtags en posts públicos.

Visualización de la red de etiquetas utilizadas en posts publicos en Instagram en la descarga alrededor del hashtag #HemiEnc19.
Distribución de doble círculo, donde se destacan en el órbita superior los 10 hashtags que más se combinaron con otros.

Nodos (etiquetas): 424
Aristas (coincidencias entre dos hashtags): 1546

*Desplaza el cursor sobre la imagen para ver a detalle.



El objetivo fue el de habilitar a los participantes en el uso de herramientas digitales para el análisis y representación visual de datos en el cruce de la política, el performance y el arte. En Signa_Lab seguimos trabajando en el aprendizaje colaborativo y en las metodologías que permitan construir relatos con datos.