Una mujer sonriente con auriculares escucha música mientras usa su teléfono móvil en un entorno al aire libre.

Spotify y las matemáticas: así es la fórmula de sus recomendaciones musicales

  • 9 de abril de 2025
  • 7 minutos
  • Blog

¿Quién no ha tenido la sensación de que plataformas como Spotify identifican sus gustos musicales con una precisión casi inquietante? ¿O que parece conocer exactamente el artista o la canción que quiere escuchar en cada momento, que casi todo lo que parece recomendarle tiene sentido?

Para muchos de sus más de 200 millones de usuarios, no hay mejor ejemplo de esto, que “Descubrimiento semanal”, una playlist que se renueva automáticamente cada lunes, ofreciéndoles todas las semanas 30 nuevos temas adaptados a sus preferencias, gustos e incluso, estado de ánimo.

Lo más sorprendente es que, junto a canciones familiares, suele incluir propuestas de artistas completamente nuevos para el oyente, y aun así logra dar en el clavo. Lejos de ser una casualidad o una coincidencia, esta capacidad se sustenta en sofisticados algoritmos matemáticos que aprenden del comportamiento individual y colectivo de millones de personas en todo el mundo. No es magia, son matemáticas.

Personalización musical a gran escala

Actualmente, Spotify cuenta con una base de usuarios enorme (más de 500 millones de usuarios activos) y un catálogo de decenas de millones de canciones. Ante tantísima música disponible, el reto es lograr que cada persona descubra fácilmente canciones que le gustarán.

Ahí entra en juego el sistema de recomendación: una serie de algoritmos de machine learning que personalizan la experiencia musical. Cada vez que se escucha o se guarda una canción, esa información alimenta al algoritmo. De hecho, cada acción (reproducir un tema, marcar "me gusta", añadir a una playlist o incluso pasar una canción tras unos segundos) queda registrada como parte del perfil de cada usuario de esta plataforma.

A partir de aquí y gracias a complejos modelos matemáticos Spotify puede anticipar con bastante precisión qué música le va a gustar a cada usuario, de modo que este pase más tiempo enganchado a su plataforma. Para conseguirlo, combina dos enfoques principales: filtrado colaborativo y filtrado basado en contenido.

Filtrado colaborativo: la sabiduría de la multitud

El filtrado colaborativo es el método clásico de muchos que emplean muchas plataformas de streaming de contenidos (Netflix, Amazon, etc.), y en Spotify forma el corazón de listas personalizadas como Descubrimiento Semanal, que los usuarios reciben en su bandeja de entrada cada viernes.

La idea es sencilla: si otras personas con gustos similares a los de un usuario concreto disfrutan de cierto artista o canción que ese usuario aún no ha escuchado, existe una buena probabilidad de que también le guste. De esta forma, el sistema analiza los hábitos de escucha de todos los usuarios, emparejándolos con “vecinos” con preferencias similares.

Por ejemplo, si el Usuario A y el Usuario B tienen muchas canciones favoritas en común, pero A ha descubierto una banda que B no conoce, el algoritmo puede recomendar esa banda al Usuario B y viceversa.  Para lograr esto a escala masiva, Spotify representa la relación entre usuarios y canciones en una enorme matriz de datos, que en el caso de esta plataforma podría ser una tabla con 200 millones de filas (cada fila es un usuario) y 40 millones de columnas (cada columna es una canción).

Imaginemos una tabla con 200 millones de filas (cada fila es un usuario) y 40 millones de columnas (cada columna una canción) Esta matriz está en su mayoría vacía, ya que ningún usuario puede escuchar todas las canciones, pero el algoritmo la aprovecha mediante técnicas de álgebra lineal. En concreto, Spotify aplica una factorización matricial (una forma de descomponer la matriz) para extraer patrones latentes. El resultado son vectores numéricos que resumen los gustos de cada usuario y las características de cada canción.

Así, a cada usuario le corresponde un "vector de gusto musical" (X) y a cada canción un "vector de características" (Y) en un espacio matemático de dimensiones latentes. Si se compara el vector de un usuario con el de una canción, el grado de similitud indica cuánto podría gustarle esa canción a ese usuario. Con estos vectores de usuario y canción ya calculados, el filtrado colaborativo busca coincidencias: identifica usuarios con vectores cercanos al nuestro (es decir, gustos parecidos) y canciones cuyos vectores estén próximos a los de nuestras canciones favoritas

Así, al recomendar una canción nueva se reduce a encontrar algún tema que esté en la biblioteca de esos usuarios parecidos. En otras palabras, se apoya en la sabiduría de la multitud. Aunque el filtrado colaborativo ha demostrado ser muy eficaz, tiene algunas limitaciones. Suele favorecer lo popular (es más fácil recomendar canciones que ya muchos han escuchado) y tiene problemas con la "novedad": una canción o artista recién lanzado, sin historial de reproducciones, no puede ser recomendado por este método. Para complementar estas carencias, Spotify recurre a estrategias basadas en el contenido mismo de la música.

Filtrado basado en contenido: etiquetas y características sonoras

El enfoque de filtrado basado en contenido consiste en recomendar canciones con atributos similares a las que le gustan a un usuario concreto. En lugar de comparar las bibliotecas de otros usuarios, aquí se examinan las características intrínsecas de cada tema, a partir de una descripción matemática: el contexto textual (lo que se dice o escribe sobre la música) y las propiedades de audio (lo que suena en la grabación).

Para ello parte en primer lugar de un análisis de texto y metadatos: aunque una canción no tiene texto descriptivo por sí misma, hay multitud de texto generado alrededor de la música: reseñas, blogs, noticias, comentarios en redes sociales, etc. A partir de aquí y mediante técnicas de Procesamiento de Lenguaje Natural (PLN), el sistema recopila de Internet las palabras y etiquetas asociadas a artistas y pistas.

Toda esa información se estructura en matrices y vectores de términos, dando a cada canción un perfil semántico propio. Así si el historial del usuario indica que disfruta de canciones descritas como "indie folk acústico", el algoritmo de contenido puede recomendale otras piezas que tengan etiquetas similares, aunque provengan de artistas distintos.

Más allá de las etiquetas textuales, Spotify también analiza directamente los “atributos de audio” de las canciones usando inteligencia artificial. En este sentido, es importante señalar que cada tema musical se puede descomponer en propiedades cuantitativas: tempo (BPM), tonalidad y modo, intensidad o volumen, nivel de energía, “bailabilidad”, positividad (valence), instrumentalidad, etc.

El algoritmo extrae estos rasgos sonoros objetivos de la señal de audio usando modelos de aprendizaje profundo especializados. Para ello Spotify emplea redes neuronales convolucionales (CNNs) que procesan el espectro de audio de forma similar a como una red neuronal "ve" una imagen   Esta red aprende a identificar patrones acústicos, permitiendo comparar canciones por cómo suenan. Por ejemplo, si una canción nueva tiene un tempo, una estructura rítmica y un timbre muy similares a otro tema que nos encanta, el sistema podrá detectarlo.

Así, al desglosar la música en cifras, el filtrado por contenido sonoro puede encontrar canciones que “suenan parecido” a las preferencias del usuario, aunque sean de artistas o géneros poco conocidos. Esto resulta vital para descubrir música nueva que aún no tiene datos de reproducciones. En definitiva, los sistemas de recomendación de Spotify son híbridos: combinan las señales de filtrado colaborativo con las de contenido (texto y audio) para dar en el clavo con los gustos de los usuarios.

No es magia, son matemáticas.

Más información

Grado en Matemáticas Aplicadas a la Ingeniería de Software

5 razones por las que formarte en matemáticas aplicadas a la ingeniería de software. 

El tándem perfecto para tu futuro: matemáticas e ingeniería de software.

Insights relacionados

Un grupo de niños observa un robot en una competencia de robótica.
Ciencia y Tecnología

Las Olimpiadas de la Robótica se disputan en UDIT: mucho más que una competición

18 de junio de 2026

La World Robot Olympiad (WRO) es una competición internacional de robótica educativa que anima a los jóvenes a conectar de una forma divertida con la tecnología y la ingeniería.  Durante cada una de las pruebas, equipos formados por entre 2 y 3 estudiantes y sin contar con ningún tipo de ayuda externa, deben diseñar, construir y programar robots autónomos o teledirigidos para superar diversas misiones planteadas sobre un tablero. 

Dos mujeres interaccionan con robots en un entorno tecnológico moderno.
Ciencia y Tecnología

¿Qué salidas profesionales tiene estudiar Robótica? Trabajos reales más allá de "hacer robots"

18 de junio de 2026

Estudiar robótica puede llevarte a diseñar, programar, integrar y validar sistemas inteligentes: robots móviles, dispositivos conectados, soluciones AIoT, automatización, interfaces persona-máquina o prototipos aplicados a salud, logística, industria, movilidad, educación o asistencia. La clave no es "hacer robots" en abstracto, sino resolver problemas reales combinando software, sensores, IA, electrónica y diseño de interacción.

La imagen muestra tres robots de servicio en un entorno moderno de oficina.
Ciencia y Tecnología
Un joven concentrado trabajando en una computadora portátil en una mesa.
Ciencia y Tecnología

Máster Oficial en Inteligencia Artificial en UDIT: de usar IA a construir soluciones reales

22 de mayo de 2026

Saber qué prompt le das a un modelo para que produzca un resultado útil es una habilidad. Saber por qué ese modelo se equivoca bajo ciertas condiciones, cómo mejorar su rendimiento con datos de entrenamiento más representativos o qué restricciones legales implica desplegarlo en producción —eso requiere otro nivel de formación.

Si estás comparando másteres en inteligencia artificial en Madrid y tu pregunta ya no es general sino específica —qué nivel técnico tiene el programa, si tu base previa es suficiente, cómo es realmente la carga del máster con trabajo— este artículo está escrito para eso.

Un hombre sonriente se encuentra junto a varios robots en un ambiente moderno y luminoso.
Ciencia y Tecnología

"Hoy la robótica demanda perfiles híbridos"

20 de mayo de 2026

El avance de la Inteligencia Artificial ha marcado un punto de inflexión sin precedentes en el desarrollo de la robótica. Hemos dejado atrás la era de las máquinas programadas de forma rígida para tareas repetitivas y automatizadas; hoy, los sistemas son autónomos, adaptativos y capaces de tomar decisiones en tiempo real. Sin embargo, este vertiginoso salto tecnológico plantea un cambio de paradigma crucial.  

Ciencia y Tecnología

UDIT TECH Talk: Blindando el perímetro y el dato en la era de la IA

23 de abril de 2026

La irrupción de la Inteligencia Artificial Generativa no solo ha transformado la creación de contenido o el desarrollo de software; ha inaugurado una nueva era en la guerra digital. En un entorno donde las amenazas (desde el ransomware hasta el phishing) ya son ejecutadas por algoritmos capaces de aprender y adaptarse, la defensa tradicional ha quedado obsoleta. Bajo esta premisa, el Campus de Tecnología, Innovación y Ciencias Aplicadas de UDIT ha acogido su segunda TECH Talk: “Blindando el perímetro y el dato en la era de la IA”.

UDIT nombra a Bernard Cortijo nuevo director del Máster en Ciberseguridad y Hacking Ético
Ciencia y Tecnología

"Tenemos que acostumbrarnos a convivir con el riesgo"

21 de abril de 2026

La evolución de las amenazas digitales ha alcanzado un nuevo nivel de complejidad. Según explica Bernard Cortijo, director del Máster en Ciberseguridad y Hacking Ético de UDIT, gran parte de la responsabilidad se encuentra en el desarrollo de la Inteligencia Artificial, cada vez empleada más por los atacantes para para generar infecciones persistentes. Ante este escenario, Cortijo sostiene que la única respuesta eficaz es la defensa híbrida: un modelo que combine precisamente la potencia tecnológica de la IA defensiva, con la capacidad crítica e insustituible del ser humano.