- El AI DJ de Spotify deja en evidencia los límites de la IA y los problemas del metadata musical a través de casos en los que no logra reconocer correctamente la música clásica
- Cuando el usuario pide la Séptima Sinfonía de Beethoven, la IA no entiende la estructura de la obra ni el orden de los movimientos y reproduce un movimiento equivocado o incluso piezas de otro compositor
- Aun con instrucciones específicas como “reproduce todos los movimientos en orden”, la IA elige la sinfonía incorrecta o grabaciones mezcladas y desordenadas, mostrando resultados inconsistentes
- La causa de fondo de estos errores es que el metadata de la música digital fue diseñado con la música pop como centro, por lo que no refleja adecuadamente conceptos como compositor, obra y movimiento
- El texto señala la brecha entre las expectativas sobre la “inteligencia” de la IA y la realidad, y cierra con una conclusión cínica: preservar la tradición musical occidental no tiene relación con las ganancias corporativas
Experiencia usando AI DJ y detección del problema
- El texto comienza con la pregunta “¿La IA es realmente inteligente?” y plantea si la responsabilidad por los errores de la IA recae en los programadores
- Al usar el AI DJ dentro de la app de Spotify para buscar música clásica, el autor vuelve a confirmar los límites de la estructura de búsqueda de Spotify
- El autor, como usuario que escucha no pop sino 500 años de tradición musical occidental, pone como ejemplo compositores que van de Tallis a Shaw
Límites estructurales del metadata musical digital
- El metadata de los archivos de música digital se compone de tres etiquetas: Artist, Album y Song, un diseño centrado en la música pop
- Señala que el término “Song” es una expresión impropia cuando también se usa para piezas instrumentales, y explica que en música clásica serían más adecuados “composition” o “work”
- El concepto de “movimiento (movement)”, fundamental en la estructura de la música clásica, no está reflejado en el metadata, por lo que Spotify no puede reconocer la composición completa de una obra
Prueba de reproducción de la Séptima Sinfonía de Beethoven
- Al dar la orden “Play Beethoven’s 7th Symphony”, la IA reproduce solo el segundo movimiento, Allegretto, y después enlaza piezas completamente ajenas
- Incluso con “Play Beethoven’s 7th Symphony in its entirety”, la IA interpreta erróneamente que se trata de una obra completa de 9 minutos y vuelve a reproducir solo el segundo movimiento
- Con “Play Beethoven’s 7th Symphony from beginning to end”, ocurre lo mismo: solo el segundo movimiento, seguido luego por una pieza de John Field
- Cuando se pide “Play all four movements”, empieza desde el primer movimiento, pero mezcla grabaciones de distintas orquestas y altera el orden
- Con “Play all four movements in numerical order”, da un resultado totalmente equivocado, empezando por el primer movimiento de la Tercera Sinfonía
Falta de comprensión musical de la IA
- El autor señala que la IA no entiende en absoluto la estructura por movimientos ni la noción de orden dentro de una obra
- Aunque el hecho de que una sinfonía de Beethoven tenga cuatro movimientos puede saberse con solo leer la primera frase de Wikipedia, la IA no logra reflejarlo
- El autor satiriza esta clase de errores comparándolos con leer primero el último capítulo de un audiolibro
Conclusión: desconexión entre la IA y la tradición musical
- El texto expresa escepticismo ante la afirmación de que la IA puede “componer” música, y critica que una IA que ni siquiera entiende conceptos básicos no puede hablar de creación
- Aunque reconoce que Spotify DJ sigue en fase beta, concluye con una visión pesimista: las empresas no tienen incentivos para preservar la tradición musical occidental
- En conjunto, el problema se presenta como una combinación de límites de la tecnología de IA, sesgos en el diseño del metadata y desinterés cultural
1 comentarios
Opiniones de Hacker News
Esto no es un problema de IA sino de diseño de producto. Spotify DJ es básicamente “shuffle + comentarios de voz”, y es muy probable que haya código puesto a propósito para impedir reproducir álbumes completos.
Generalizar la IA como si fuera un solo concepto es un enfoque equivocado. La lógica de “si esta función no sirve, entonces la IA no sirve” es un error de categoría (category error).
Todo el texto mezcla varias opiniones y termina siendo confuso; la mitad no es más que una lista de nombres de piezas clásicas. Estoy de acuerdo en que Spotify DJ es malo, pero no es una crítica convincente
No hay un intento de explorar las fortalezas y debilidades de la tecnología; es el patrón típico de descalificar toda la IA a partir de un caso estrecho. La IA no es humana, así que es natural que tenga limitaciones.
He visto algo parecido con los asistentes de programación con IA. Se los descarta por completo por temas de seguridad, pero se ignora la posibilidad de “crear una app nativa para Mac con una sola frase”
El atractivo de mezclas de DJs en YouTube como Hör Berlin está en la selección y la interpretación del DJ, además de su trasfondo cultural. Si una IA arma una lista optimizada, se pierde esa esencia
Spotify mezcla licencias tipo radio e interactivas para reducir costos. Como las listas creadas por IA no son una elección directa del usuario, es probable que se traten bajo el esquema tipo radio
Escucho seguido emisiones como dublab, NTS1 y NTS2, donde uno se topa con música inesperada
Incluso invirtiendo cientos de millones de dólares no se logró una recomendación perfecta, ni se pudo reemplazar la confianza social (social proof) que da un DJ humano
También es una pena esa visión donde pareciera que la música se reduce solo al pop y a la clásica occidental
Yo lo veo como un fracaso en el diseño del prompt. Si pruebas la misma petición con este ejemplo de ChatGPT, la IA responde correctamente.
O sea, es muy posible que el modelo de Spotify sea débil, o que su prompt interno lo haya guiado en la dirección equivocada.
La afirmación de que “la IA no puede componer música” también es una comparación errónea. La IA ya ha mostrado comprensión de teoría musical y posibilidad de composición. Al final es una cuestión de calidad y de gusto
Cada vez que la gente llama “IA” a los LLM, se distorsiona la percepción.
Eso ha sido el mayor éxito del marketing y, al mismo tiempo, uno de los mayores daños causados al mundo