- Usa SD 1.5 tal cual y ajusta finamente el modelo para generar imágenes de espectrogramas usando img2txt
- Las imágenes generadas se pueden convertir en clips de audio reproducibles
- Es posible modificar el sonido usando img2img
- Interpolación para que clips de audio cortos puedan hacer loop infinito
- Se creó como una app web para que sea fácil de usar y también se publicó el código (Next.js + React + Three.js + Tailwind)
Spectrogram : Waveform + Spectrum
- Una representación visual del espectro del sonido usando frecuencia, amplitud (intensidad) y tiempo
- Se puede calcular a partir del audio usando STFT (Short-Time Fourier Transform)
Aún no hay comentarios.