10 puntos por xguru 2022-12-16 | Aún no hay comentarios. | Compartir por WhatsApp
  • Usa SD 1.5 tal cual y ajusta finamente el modelo para generar imágenes de espectrogramas usando img2txt
  • Las imágenes generadas se pueden convertir en clips de audio reproducibles
  • Es posible modificar el sonido usando img2img
  • Interpolación para que clips de audio cortos puedan hacer loop infinito
  • Se creó como una app web para que sea fácil de usar y también se publicó el código (Next.js + React + Three.js + Tailwind)

Spectrogram : Waveform + Spectrum

  • Una representación visual del espectro del sonido usando frecuencia, amplitud (intensidad) y tiempo
  • Se puede calcular a partir del audio usando STFT (Short-Time Fourier Transform)

Aún no hay comentarios.

Aún no hay comentarios.