- Un sistema de búsqueda musical consta de dos etapas: registro y búsqueda
- Registro: convertir las fuentes de audio existentes en huellas de audio (Audio Fingerprint) y almacenarlas en una base de datos
- Búsqueda: convertir el audio de entrada en una huella de audio y luego compararla con la base de datos para buscar audios similares
- Conocimientos previos
- Archivo WAV: formato PCM sin compresión que conserva el original sin alterar los datos
- Muestreo (Sampling): convierte una señal analógica en digital; cuanto mayor sea la tasa de muestreo, mayor será la precisión
- Espectrograma (Spectrogram): gráfico que visualiza los cambios de frecuencia y amplitud
- Transformada de Fourier: convierte una señal al dominio de la frecuencia para analizar el sonido
- Pico (Peak): dato que representa componentes principales de frecuencia, útil para eliminar ruido y comprimir
- Huella de audio (Audio Fingerprint): se genera aplicando hash a los datos de picos y se usa para almacenar y buscar en la base de datos
- Proceso de implementación
- Leer el archivo WAV y generar los datos de muestreo
- Aplicar la transformada de Fourier a los datos de muestreo para generar un espectrograma
- Extraer los picos del espectrograma
- Aplicar hash a los datos de picos para generar una huella de audio
- Guardar la huella de audio en la base de datos o usarla para buscar y verificar audios similares
1 comentarios
Umi