24 puntos por xguru 2023-04-24 | 2 comentarios | Compartir por WhatsApp
  • Permite generar voz multilingüe muy realista
  • Incluye música, ruido de fondo y efectos de sonido simples
  • También puede producir comunicación no verbal como risas, suspiros y llanto
  • Soporta inglés/coreano, así como alemán/francés/japonés/chino, entre otros
  • Usa el códec EnCodec de Facebook
  • Bark tiene licencia CC-BY 4.0 NC, y el modelo de Suno en sí puede usarse con fines comerciales

2 comentarios

 
dlehals2 2023-04-24

Las generaciones de Bark a veces difieren de mis prompts. ¿Qué está pasando?
Bark es un modelo estilo GPT. Como tal, puede tomarse ciertas libertades creativas en sus generaciones, lo que da como resultado salidas del modelo con mayor variabilidad que los enfoques tradicionales de texto a voz.

Esta parte sí da miedo jaja. O sea, que a veces genere algo distinto al prompt es por la "libertad creativa" del modelo...

 
kuroneko 2023-04-24

Es sorprendente que genere coreano bastante bien.