20 puntos por xguru 2023-10-30 | Aún no hay comentarios. | Compartir por WhatsApp
  • Contenido presentado por Ahmad Khan, jefe de estrategia de AI/ML en Snowflake

Monetización mediante el uso de datos "no estructurados"

  • Más del 80% de los datos empresariales son "datos no estructurados", como documentos de Word, imágenes y archivos de audio/video
  • Sin embargo, la mayoría de las empresas casi no aprovechan esta información, lo que significa que al tomar decisiones de negocio usan menos del 20% de los datos disponibles
  • Si estos datos no estructurados se colocan junto a un modelo de lenguaje grande para crear chatbots de forma efectiva, pueden ayudar a interpretar y analizar enormes volúmenes de información que hoy se aprovechan poco
  • El potencial para crear modelos adaptados a la industria específica de cada empresa es ilimitado

Privacidad y seguridad

  • Entre las empresas crece la preocupación de que sus datos puedan usarse para entrenar modelos que luego puedan ser utilizados por otras compañías, incluidas sus competidoras
  • Como resultado, muchas empresas suelen conformarse con productos inferiores que ofrecen mejor seguridad, lo que crea un mercado para productos más seguros
  • Por ejemplo, Llama 2 no es el modelo de lenguaje grande con mejor desempeño, pero aun así los clientes eligen Llama 2 en lugar de modelos con menos control como Chat GPT
  • Muchas empresas consideran la singularidad de sus datos como una ventaja y por eso quieren evitar situaciones en las que esos datos se hagan públicos en internet

Asegurar una ventaja competitiva ofreciendo una experiencia de usuario sobresaliente

  • ¿Cómo puede una startup competir contra la escala de las grandes empresas?
  • Se propone enfocarse en crear una experiencia de usuario agradable, por ejemplo construyendo una interfaz atractiva
  • Ese es el enfoque que adoptó Snowflake
  • En particular, como la mayoría de sus propios servicios no pueden competir con proveedores de nube como Amazon Web Services, se enfocó en crear una experiencia de usuario superior que justificara un precio más alto

Enfocarse en verticales

  • Otra forma en que David puede vencer a Goliat es enfocarse en industrias específicas como manufactura, finanzas, salud y entretenimiento, en lugar de aplicaciones de uso general
  • Aconseja: "Primero hay que entender qué buscan las empresas de esa industria, y luego ofrecer servicios que satisfagan esas necesidades"
  • Por ejemplo, es muy probable que Google desarrolle un modelo de lenguaje grande para el sector salud, pero también es probable que no lo aborde con tanta profundidad, lo que abre una oportunidad para que empresas pequeñas construyan ese tipo de modelo

Está creciendo cada vez más la demanda de atribución de datos

  • Existe la posibilidad de nuevos modelos que rastreen materiales con copyright y compensen a los creadores originales, incentivándolos a desarrollar más contenido
  • Khan menciona varios casos en los que no se pueden usar modelos open source por razones legales, y pone como ejemplo a un estudio de cine que no quería usar un modelo open source para generación de imágenes
  • Ese estudio paga licencias y costos para usar un modelo entrenado con datos de Getty Images
  • En el futuro, el mercado para modelos similares que usen conjuntos de datos con atribución crecerá cada vez más

Aún no hay comentarios.

Aún no hay comentarios.