TikTok, Inteligencia Artificial y probabilidad matemática
TikTok es conocida por su algoritmo de recomendación hiper-personalizado, capaz de enganchar a millones de usuarios. Pero más allá de los bailes virales y los retos, esta plataforma esconde un complejo entramado de matemáticas e inteligencia artificial. Detrás de cada video sugerido, y también de la seguridad del contenido que se publica, hay modelos matemáticos tomando decisiones: ¿qué tipo de escena se muestra? ¿Incumple alguna norma? ¿A qué espectadores podría interesar?
Para ello, le red social más popular de los últimos años, emplea un sistema de Inteligencia Artificial que revisa millones de vídeos al día en tiempo real, con el objetivo de que el muro de cada usuario sea un espacio seguro, en el que los contenidos que se le muestran no violen las reglas de la comunidad.
En este sentido, fundamentos matemáticos como la probabilidad, la estadística, o el álgebra lineal, resultan clave a la hora de clasificar automáticamente el contenido de los vídeos, mejorando la moderación dentro de la plataforma y tomando decisiones automatizadas sobre lo que se muestra, lo que se restringe y el cómo se adapta la experiencia al usuario. Algunos de los procesos que estos algoritmos llevan a cabo son los siguientes:
- Reconocimiento de escenas: identifican automáticamente qué aparece en un video (por ejemplo, determinan si un clip muestra una playa, un rostro conocido, una mascota, etc.).
- Clasificación de imágenes: a continuación, etiquetan o categorizan los fotogramas de un video según su contenido visual (por ejemplo, si contiene texto en pantalla, si es una animación o vídeo real, el género de actividad que muestra, etc.).
- Moderación automática de vídeos: al mismo tiempo, detectan contenido inapropiado (violencia, desnudez, discurso de odio, etc.) para bloquearlo o marcarlo para revisión humana antes de que se difunda masivamente.
Computer vision: entendiendo el contenido de los videos
Para poder recomendar vídeos relevantes o moderar eficazmente, lo primero es saber qué contiene cada uno de los vídeos que se suben a la plataforma (un estudio reciente sugiere que se podrían llegar a publicar hasta 117 millones de vídeos cada día).
TikTok logra esto mediante técnicas de visión por ordenador (un campo de la IA enfocado al análisis de imágenes y video). En esencia, sus algoritmos examinan los fotogramas de un video y reconocen patrones visuales en ellos. Estos modelos de visión se desarrollan a partir de redes neuronales profundas entrenadas con enormes cantidades de datos etiquetados previamente, lo que le permite detectar qué objetos y personas se muestra en una escena (por ejemplo, reconocer un balón de fútbol o un rostro conocido), así como identificar acciones distintas (no es lo mismo alguien bailando que alguien cocinando) o el texto sobreimpreso en el video.
El algoritmo de TikTok llega tan lejos que puede incluso inferir la emoción predominante en las expresiones faciales de las personas, lo cual ayuda a contextualizar el contenido. Toda esta información se utiliza para clasificar y etiquetar posteriormente cada publicación.
Pero TikTok no solo analiza la parte visual: el audio también se analiza con IA. Para ello, algoritmos de procesamiento del lenguaje natural (NLP) transcriben y “entienden” el audio de los vídeos (ya sean diálogos hablados o la letra de una canción), identificando palabras clave o el tema de la conversación. Esto complementa la descripción del contenido. Junto con los metadatos proporcionados por el usuario (como el título, la descripción o los hashtags), el algoritmo construye un perfil detallado de cada pieza. De este modo, la plataforma "sabe" en gran medida qué está mostrando un vídeo.
Moderación automática: la IA como guardián de las normas
El uso de estos algoritmos inteligentes facilita en gran medida la moderación de contenido por parte de los humanos, que de esta forma no se ven obligados a revisar manualmente millones de vídeos.
Como hemos visto, gracias a estas capacidades de computer vision y de NLP, el sistema es capaz de detectar en los vídeos que se suben a la plataforma todo tipo de material explícito, violencia, conductas peligrosas o consumo de sustancias prohibidas. Al mismo tiempo, al “escuchar” el audio, también puede detectar en tiempo real posibles discursos de odio, acoso u otras expresiones ofensivas.
Además, el sistema va más allá, revisando subtítulos, hashtags y texto incrustado en el vídeo e incluso, los metadatos de la propia publicación, analizando patrones sospechosos (por ejemplo, si una cuenta sube muchísimos videos seguidos, puede indicar un intento de SPAM).
Tras este análisis, la IA estima la probabilidad de que el video viole las normas de la comunidad y le asigna un nivel de riesgo. Si el riesgo detectado es alto, el contenido se notifica de inmediato a moderadores humanos, que se encargan de hacer una segunda revisión más detallada. En general, un vídeo que tenga una alta probabilidad de mostrar violencia o desnudez será enviado a revisión humana, mientras que los contenidos de riesgo muy bajo permanecerán en la plataforma sin pasar por el equipo de moderación. Estos modelos de detección se refuerzan constantemente, de modo que el algoritmo de TikTok se reentrena con nuevos datos para adaptarse tanto a las últimas tendencias, como a las posibles estrategias que empleen algunos usuarios que intenten burlar estos filtros automáticos.
Una base matemática
Pero como comentamos antes, para llegar hasta aquí, TikTok necesita contar con una sólida base matemática. En primer lugar, el álgebra lineal resulta fundamental para el procesamiento de imágenes y vídeos, ya que estos se representan como matrices numéricas. Las redes neuronales realizan operaciones matemáticas complejas (como multiplicaciones de matrices) para extraer patrones visuales relevantes, como bordes o formas. Estos filtros actúan como detectores que permiten al sistema identificar objetos y escenas en los contenidos subidos por los usuarios.
Además, la probabilidad también juega un papel esencial en sus modelos de IA. Dado que las predicciones no son certezas absolutas, los sistemas trabajan con estimaciones probabilísticas. Por ejemplo, en lugar de afirmar que un vídeo contiene un perro, asignan una probabilidad a esa hipótesis. Este enfoque permite una moderación más precisa, ya que el sistema solo actúa si el contenido supera ciertos umbrales de riesgo, como el de ser potencialmente dañino o inapropiado.
Por último, la estadística y el aprendizaje automático conforman el núcleo del proceso de entrenamiento. TikTok entrena sus algoritmos analizando millones de vídeos previamente clasificados para encontrar relaciones entre señales de entrada (como píxeles o audio) y las etiquetas asociadas. A través de técnicas de optimización matemática, los modelos ajustan sus parámetros para minimizar errores y mejorar su capacidad de generalización. Así, la plataforma logra sistemas cada vez más efectivos en la clasificación y moderación de contenidos a escala global.
Para los futuros estudiantes y entusiastas de la tecnología, puede resultar realmente interesante descubrir que las mismas herramientas que se aprenden en el aula son las que hacen posible la magia de aplicaciones como TikTok. Entender cómo funciona este engranaje matemático no solo permite apreciar la ingeniería detrás de nuestras redes sociales favoritas, sino que también abre la puerta a innovar y construir nuevos sistemas inteligentes.
Más información
5 razones por las que formarte en matemáticas aplicadas a la ingeniería de software.
¿Qué necesito para estudiar matemáticas?
El tándem perfecto para tu futuro: matemáticas e ingeniería de software.