Un análisis de 36 millones de posts para revelar las dinámicas del discurso de odio en redes sociales entre 2020 y 2022

Ciudades bajo presión: odio en línea durante la pandemia en Estados Unidos

Shasank Sekhar Pandey, DACS – University of Twente
Alberto García Robledo, SECIHTI – CentroGeo
Mahboobeh Zangiabady, DACS – University of Twente

Resumen

Entre 2020 y 2022, Estados Unidos enfrentó una crisis sanitaria, social y emocional sin precedentes. Las redes sociales jugaron un papel central en canalizar emociones colectivas, pero también se convirtieron en vehículos del discurso de odio. Nuestro estudio analiza 36.7 millones de posts geolocalizados en el país, publicados en X, utilizando un modelo BERT-CNN para clasificar contenido como neutral, ofensivo o abiertamente odioso. Los resultados muestran que las expresiones de odio se concentraron en temas de etnicidad, género y nacionalidad. Aunque el análisis es de alcance nacional, se reconoce que las ciudades —por su conectividad, diversidad y densidad poblacional— son los principales territorios de circulación y amplificación del discurso de odio en línea.

Introducción

La pandemia de COVID-19 trastocó las dinámicas sociales a escala global. En Estados Unidos, el confinamiento, el miedo y la incertidumbre encontraron eco en las redes sociales, donde millones de personas buscaron expresión, información y sentido de pertenencia. Sin embargo, también se intensificaron las expresiones de odio, exclusión y polarización.

X —anteriormente conocida como Twitter— fue una de las plataformas más utilizadas durante ese periodo, y su análisis permite capturar el “pulso emocional” de la sociedad estadounidense. A través de herramientas de inteligencia artificial, nuestro estudio identifica patrones de discurso de odio en el periodo 2020-2022, contribuyendo a la comprensión de cómo las crisis pueden detonar narrativas de odio en el espacio digital.

Aunque el análisis se realizó sobre posts a nivel nacional, es fundamental comprender que las redes sociales no operan en el vacío: su infraestructura técnica, sus usuarios más activos y sus consecuencias sociales están fuertemente anclados en los territorios urbanos. Por ello, este artículo también reflexiona sobre el papel de las ciudades en la propagación y reproducción de discursos excluyentes.

Metodología: Aprendizaje profundo para comprender el odio digital

El estudio utilizó un modelo basado en BERT, una arquitectura de procesamiento de lenguaje natural, combinada con una Red Neuronal Convolucional (CNN) para clasificar los posts en tres categorías: odio, ofensivo o neutral. Se entrenó el modelo con 25,000 posts manualmente etiquetados y posteriormente se aplicó a un conjunto de 36,790,672 publicaciones emitidas desde territorio estadounidense.

Los datos fueron recolectados entre enero de 2020 y diciembre de 2022 usando la API de búsqueda avanzada de X, garantizando cobertura horaria y geográfica. Para el procesamiento previo de texto se utilizó la librería Ekphrasis. La implementación se realizó en TensorFlow, empleando un modelo Small-BERT con dos capas convolucionales para capturar características léxicas relevantes.

Durante la fase de entrenamiento, el modelo alcanzó una precisión global del 90% y un F1-score macro de 0.81. El mayor rendimiento se obtuvo en la detección de lenguaje ofensivo (F1 = 0.95), mientras que la clasificación de discursos explícitamente odiosos fue más desafiante (F1 = 0.65), debido al desbalance en los datos de entrenamiento.

Resultados: Una radiografía del odio en línea

De los más de 36 millones de posts analizados, el 13.84% fueron clasificados como discursos de odio, el 11.5% como ofensivos y el 74.66% como neutrales. Al descomponer el contenido clasificado como odio, se identificaron los siguientes blancos principales:

  • Etnicidad: 2.8%
  • Género: 0.94%
  • Nacionalidad: 0.54%
  • Orientación sexual: 0.12%
  • Clase social: 0.12%
  • Religión: 0.06%

El uso de la base de datos HateBase permitió rastrear 75 términos con alta incidencia, muchos de los cuales mostraron sesgos raciales, sexistas o xenófobos. En términos temporales, el discurso de odio alcanzó su punto más alto en mayo de 2020 (coincidiendo con el asesinato de George Floyd y las protestas de Black Lives Matter) y mostró una disminución paulatina hasta enero de 2022. No obstante, el odio étnico se mantuvo estable, y el relacionado con la orientación sexual mostró una tendencia ascendente.

Ciudades: territorios del discurso digital

Aunque el modelo se aplicó a nivel nacional, existe evidencia empírica de que las zonas urbanas concentran de manera desproporcionada la actividad en redes sociales. Un estudio basado en millones de publicaciones geolocalizadas demuestra que el volumen de contenido generado en X aumenta más que proporcionalmente con la densidad poblacional, lo que confirma que las grandes ciudades son epicentros de producción digital (Arthur & Williams, 2019).

Esta sobrerrepresentación urbana se explica por la alta densidad poblacional, conectividad digital, diversidad cultural y concentración de eventos públicos y mediáticos. Durante la pandemia, los momentos de mayor intensidad discursiva en redes coincidieron con protestas urbanas, confinamientos y crisis sanitarias en ciudades como Nueva York, Minneapolis o Houston. Aunque expresado en línea, el odio digital tiene efectos profundamente territoriales: erosiona la cohesión social urbana, incrementa la percepción de inseguridad y puede escalar hacia violencia física en el espacio público.

Por tanto, monitorear el discurso de odio en redes sociales desde una perspectiva territorial y urbana es una herramienta valiosa para la gobernanza metropolitana y para anticipar crisis sociales emergentes.

Conclusiones

Nuestro estudio demuestra la utilidad de los modelos de aprendizaje profundo como BERT-CNN para detectar y clasificar discurso de odio en redes sociales a gran escala. La clasificación de más de 36 millones de posts permite identificar patrones, temas sensibles y categorías vulnerables.

Si bien el fenómeno tiene un alcance nacional, su epicentro es urbano. Las ciudades, por su densidad, diversidad y conectividad, son los territorios donde el odio digital más se reproduce y amplifica. Este hallazgo tiene profundas implicaciones para los observatorios metropolitanos y las agendas locales de derechos humanos, seguridad ciudadana y cultura digital.

El modelo desarrollado puede ser replicado para analizar discursos digitales en otras regiones del mundo, incluyendo ciudades mexicanas. Esto abriría la puerta a estudios comparativos, intervenciones focalizadas y herramientas de monitoreo que permitan a las autoridades urbanas responder con anticipación a los síntomas de exclusión y polarización.

Nuestro estudio fue desarrollado como parte de una colaboración internacional entre el University of Twente (Países Bajos) y el Observatorio Metropolitano CentroGeo (México), uniendo capacidades en ciencia de datos, análisis territorial y gobernanza urbana para abordar uno de los fenómenos digitales más preocupantes de nuestro tiempo: el odio en línea.

Referencias

  • Pandey, S. S., García-Robledo, A., & Zangiabady, M. (2024). Decoding Online Hate in the United States: A BERT-CNN Analysis of 36 Million Tweets from 2020 to 2022. En 2024 IEEE 18th International Conference on Semantic Computing (ICSC) (pp. 329–334). IEEE. https://doi.org/10.1109/ICSC59802.2024.00059
  • Arthur, R., & Williams, H. T. P. (2019). Scaling laws in geo-located Twitter data. PLOS ONE, 14(7), e0218454. https://doi.org/10.1371/journal.pone.0218454