2 puntos por GN⁺ 10 시간 전 | 1 comentarios | Compartir por WhatsApp
  • Los modelos frontier de OpenAI y Codex ya están disponibles oficialmente en AWS, y millones de clientes de AWS pueden crear con OpenAI en la misma plataforma donde ya operan sus negocios
  • Las empresas pueden llevar la IA frontier a producción mediante sus flujos de trabajo existentes de seguridad, cumplimiento, compras, facturación y gobernanza, reduciendo la fricción desde la evaluación hasta el despliegue real
  • OpenAI models on Amazon Bedrock permite crear aplicaciones de IA usando controles nativos de seguridad y gobernanza de AWS
  • Codex on Amazon Bedrock lleva al entorno de AWS el agente de ingeniería de software de OpenAI, usado por más de 5 millones de personas cada semana, para ayudar con la escritura de código, revisión, depuración y modernización
  • En el futuro, esto se ampliará con Daybreak para clientes de AWS, incorporando revisión segura de código, modelado de amenazas, validación de parches, análisis de riesgo de dependencias, detección y orientación para mejoras dentro del ciclo diario de desarrollo

Llevar OpenAI a producción en AWS

  • Los modelos frontier de OpenAI y Codex ya están disponibles de forma general en AWS
  • Los clientes de AWS pueden usar capacidades de OpenAI a través de la plataforma de AWS donde ya operan sus negocios
  • Las empresas pueden gestionar dentro de sus flujos existentes procedimientos clave como seguridad, cumplimiento, compras, facturación y gobernanza
  • Las organizaciones pueden reducir barreras operativas y pasar más rápido de la evaluación al despliegue real

Forma de disponibilidad y planes de expansión

  • OpenAI models on Amazon Bedrock permite crear aplicaciones de IA usando controles nativos de seguridad y gobernanza de AWS
  • Codex on Amazon Bedrock se ofrece como un agente de ingeniería de software que ayuda a los equipos con la escritura de código, revisión, depuración y modernización dentro del entorno de AWS donde ya construyen y despliegan
  • Ambas modalidades están disponibles en las regiones AWS Commercial y GovCloud
  • OpenAI y AWS planean seguir ampliando las capacidades de OpenAI disponibles a través de AWS para que los equipos pasen de la evaluación a producción con menos fricción y mayor confianza
  • Daybreak, disponible próximamente, incluirá modelos cibernéticos y Codex Security, diseñados para que los defensores cibernéticos vean los riesgos antes, respondan más rápido y hagan el software más resiliente

1 comentarios

 
Comentarios de Hacker News
  • Cada vez que veo a alguien preguntando por qué confiar en AWS, Azure o GCP, o por qué pagarles un premium, pienso que nunca ha trabajado en un entorno enterprise
    La gran empresa donde trabajo tiene contratos con clientes que incluyen gobernanza de datos estricta, además de requisitos internos de gobernanza. Para evitar un despido o una demanda, hay que usar proveedores no solo aprobados por seguridad de la información, sino también explícitamente definidos como encargados del tratamiento de datos en los contratos con clientes
    Si estás en tu casa jugando con tu código y tus datos, puedes hacer lo que quieras, pero con datos de la empresa y de clientes, jamás. Por la misma razón tampoco usamos cualquier frontier model de moda. Los side projects y las startups tienen restricciones y consideraciones totalmente distintas

    • Me pregunto si de verdad revisaste el contrato de AWS y la responsabilidad limitada que especifica en el contrato y en los documentos enlazados desde el material contractual y de marketing
      Si lees la letra pequeña, es bastante interesante. La responsabilidad por pérdida de datos casi siempre recae en el cliente, para reclamar por el SLA hay que presentar evidencia concreta, y la compensación aceptada normalmente son créditos para uso futuro del mismo producto con el que precisamente perdiste los datos
      Aun así, los términos de AWS son relativamente razonables comparados con lugares como GCP. El SLA de GCP parece servir sobre todo para que compras enterprise diga “hay SLA, así que sí hicimos la debida diligencia y no me van a despedir por elegir esto”. En cambio, GCP puede decir “ya aceptaste la compensación propuesta cuando firmaste el contrato, así que si demandas te vamos a señalar esa cláusula. Gracias por confiar en nosotros”. [0]
      [0] https://docs.cloud.google.com/storage/docs/storage-classes
      El almacenamiento estándar multirregión o de doble región tiene un SLA de disponibilidad de 99.95%, el estándar regional de 99.9%, y Nearline, Coldline y Archive regionales pueden bajar hasta 99.0%. Los créditos son de 10%, 25% o 50% del cargo mensual del nivel de servicio afectado, con un tope mensual acumulado de 50%, y se aplican a uso futuro. Google también dice que si el cliente no solicita el crédito dentro de 30 días, se considera renunciado
    • Además, hay una diferencia enorme entre “ese equipo gastó 1,000 dólares en AI en el reporte de gastos, ¿qué obtuvieron?” y “la factura total de AWS de la empresa subió unos puntos porcentuales, lo revisamos cuando haya tiempo”. Lo segundo vuelve el proyecto mucho más realista
    • La postura de seguridad de AWS es diferente. Las startups de AI, las herramientas para crear webapps de startup o los proveedores de plugins de VSCode tienen muchas probabilidades de ser hackeados y sufrir filtraciones de datos
      AWS también puede ser hackeado, pero se ha preocupado por bajar un poco esa probabilidad y por facilitar el rastreo de qué clientes fueron afectados. Por ejemplo, si te metes a fondo en el logging de AWS, con solo tenerlo activado queda un montón de registro para reconstruir quién hizo qué con permisos o entornos. Supongo que también registran bastante bien el acceso del personal de AWS. Antes, para que un empleado de AWS entrara a mi cuenta, había que pasar por varios procedimientos
    • En resumen, es la vieja idea de que nadie fue despedido por comprar IBM
    • Acabo de pasar de un entorno libre donde podía usar cualquier harness o modelo de AI a un entorno enterprise muy estricto
      Me impresionó descubrir lo difícil que es usar una sola licencia de GitHub Copilot en Azure. Aunque ambos son productos de Microsoft, IT tuvo que averiguar cómo configurar GitHub Enterprise, vincularlo con la suscripción de Azure y hacer todo tipo de trámites
  • Si has usado modelos de AI para programación en una gran empresa, sabrás que muchos despliegues enterprise en la práctica exigen usar AWS Bedrock. La razón es simple

    1. Muchas grandes empresas ya tienen relación con AWS, así que el proceso es mucho más fácil que crear una relación con un proveedor nuevo
    2. Muchas grandes empresas tienen requisitos internos fuertes para que los datos internos sigan bajo control de la compañía. Con AWS Bedrock puedes tener mucha más confianza en que lo que metes al modelo no va a terminar filtrándose hacia algún dataset de entrenamiento. Donde trabajo, por este requisito es obligatorio pasar por AWS Bedrock y no usar directamente la API de OpenAI
    • Si profundizas un poco más, muchas veces agregar un proveedor nuevo es imposible porque en múltiples contratos con clientes prometimos, de distintas formas, que no enviaríamos datos de clientes a otros proveedores
    • En muchos LLM, Bedrock te deja controlar en qué país permanecerán los datos. Por ejemplo, con la API de Claude no tienes ese control
      Nosotros no trabajamos en Estados Unidos, y tenemos requisitos muy fuertes de que los datos se queden dentro de nuestro país, y Bedrock sí ofrece ese control
    • Es un tema interesante
      Si esta es la dirección que está tomando todo, me pregunto cómo va a seguir creciendo la AI. Si asumes que la mayor parte de los datos valiosos está detrás de este tipo de firewalls, entonces los datos públicos ya fueron cosechados y puede que incluso se haya entrenado sobre datos obtenidos de forma ilegal. Esa parte es una zona gris
      ¿Terminaremos en un ecosistema cerrado sin insumos externos?
    • Me pregunto cómo puedes estar seguro de que los datos de Bedrock no se transfieren a proveedores externos
  • Si te preguntas por qué alguien pagaría más por estas APIs a través de AWS en vez de usarlas directo, es porque en algunas empresas conseguir la aprobación de un proveedor nuevo es casi imposible. Si la empresa ya tiene contrato con AWS, se usa lo que ofrece AWS

    • Espera, ¿AWS está revendiendo acceso a los servidores de alguna empresa de AI, o corre los modelos en su propio hardware?
    • Incluso si pudieras conseguir la aprobación, eso amplía el alcance de la auditoría anual de seguridad, agrega otro proveedor que hay que revelar en evaluaciones de seguridad, hace que los datos se difundan a otro encargado del tratamiento, y suma otra factura y otra discusión presupuestaria
      Según el contrato con el cliente, quizá hasta tengas que notificarle sobre el nuevo proveedor, y eso podría disparar una nueva revisión de seguridad. Pero si solo es agregar un modelo más en Bedrock, es mucho más fácil
    • Los CEO, directorios y mandos medios de todo el mundo ahora están obsesionados con las palabras de moda de AI. ¿De verdad se frenaría tanto una solicitud para contratar directamente con un laboratorio frontier?
  • Es una noticia enorme para OpenAI. Había muchas más empresas que adoptaron Claude solo porque se podía usar en AWS de lo que uno imaginaría, y ahora aparece competencia seria

  • Es un buen movimiento para OpenAI y algo que debería preocupar a Anthropic. Durante bastante tiempo, por la dependencia de AWS y los requisitos de seguridad, Bedrock fue la única forma en que yo podía usar modelos fundacionales

    • Claude ya se ofrece tanto pasando por los servidores de Anthropic desde AWS como por Bedrock. https://aws.amazon.com/claude-platform/
      Seguramente no les encanta perder la ventaja de ser los primeros, pero da la impresión de que lo esperaban desde hace mucho
  • Buenas noticias para la competencia
    Claude Code les ha estado quitando funciones nuevas a quienes lo usan por Amazon Bedrock. Por ejemplo, modo automático, plan Ultra y Claude for Chrome. Quizá con un poco más de competencia tengan que replantear la estrategia

    • Lo raro es que los modelos Claude en Amazon Bedrock sí soportan todas esas funciones
      Llevo un tiempo creando un emulador de api.anthropic.com que “a escondidas” envía las solicitudes a Amazon Bedrock. Funciona bien, y ahora incluso se pueden usar de inmediato funciones exclusivas del proveedor primario
    • Ahora el modo automático también funciona en Bedrock
  • Anthropic probablemente debería apresurar su IPO. El enorme salto en ingresos fue básicamente resultado del fracaso de Gemini al lanzarse y de que OpenAI estaba atado de manos por su vínculo con Azure
    Los modelos de Anthropic eran literalmente la única API serverless realmente práctica disponible en AWS, es decir, los modelos de Bedrock. Ni siquiera lanzaron recientemente la línea Qwen 3.5/3.6. Si a eso le sumas la tendencia enfocada en eficiencia por token y retorno sobre la inversión, de verdad quiero ver cómo cierra Anthropic el tercer trimestre

  • Los laboratorios frontier ofrecen a los hyperscalers builds de modelos congelados que solo sirven el modelo sin recolectar datos. Para la mayoría de las empresas que quieren usar LLM frontier mientras almacenan datos sensibles, esto es un requisito previo

  • Son malas noticias para Azure. Era el elegido, pero no pudo seguir el ritmo de la demanda
    Cuando OpenAI salió de su acuerdo exclusivo diciendo que Azure no era confiable, ya se sabía que el siguiente destino sería AWS