1 puntos por GN⁺ 4 시간 전 | 1 comentarios | Compartir por WhatsApp
  • A medida que las empresas pasan de pilotos con un solo modelo a sistemas de producción multimodelo, crece la necesidad de una capa de enrutamiento y gateway
  • OpenRouter es la capa que se encarga de enrutamiento, confiabilidad, optimización de costos y compliance entre los agentes y los proveedores de modelos
  • En los últimos 6 meses, su volumen semanal procesado aumentó de 5 billones de tokens a 25 billones de tokens, y por la velocidad de crecimiento se estima que este año superará 1 cuatrillón de tokens procesados
  • Actualmente respalda a más de 8 millones de desarrolladores que trabajan con más de 400 modelos, impulsando la transición de la IA hacia apps y agentes en producción
  • Los fondos se usarán para expandir la infraestructura, reforzar las funciones empresariales e invertir en enrutamiento inteligente, mientras construye la capa base para la era de la IA multimodelo

Serie B de 113 millones de dólares

Indicadores de crecimiento y escala de uso

  • El volumen semanal procesado de OpenRouter aumentó de 5 billones de tokens a 25 billones de tokens en los últimos 6 meses
  • Por su ritmo de crecimiento, se estima que el volumen de este año llegará a más de 1 cuatrillón de tokens
  • OpenRouter da soporte a más de 8 millones de desarrolladores que trabajan con más de 400 modelos
  • A medida que la IA pasa de la etapa experimental a apps y agentes en producción, aumenta la demanda de infraestructura que funcione de forma estable entre proveedores, modalidades y casos de uso

Transición hacia producción multimodelo

  • A medida que las organizaciones pasan de pilotos con un solo modelo a sistemas de producción multimodelo, se vuelve necesaria una capa de enrutamiento y gateway que maneje la complejidad
  • OpenRouter es la capa que se encarga de enrutamiento, confiabilidad, optimización de costos y compliance entre los agentes y los proveedores de modelos
  • La composición de inversionistas de esta ronda se centra en empresas de infraestructura y plataforma, lo que muestra que esta capa se está consolidando como un componente importante del stack de IA

Funciones principales

  • Inferencia multimodal

  • Controles empresariales

  • Enrutamiento inteligente

    • Ofrece failover a nivel de proveedor, optimización de costo y latencia, y enrutamiento con conciencia de calidad que va más allá del simple balanceo de carga

Próximos pasos

  • Estos fondos se usarán para expandir la infraestructura, reforzar las funciones empresariales y continuar invirtiendo en enrutamiento inteligente
  • OpenRouter planea seguir ampliando la capa de infraestructura para la era de la IA multimodelo, ayudando a encontrar el modelo y proveedor adecuados para cada solicitud

1 comentarios

 
GN⁺ 4 시간 전
Comentarios de Hacker News
  • Me tomó bastante tiempo adoptar OpenRouter. Al principio no entendía por qué poner otro proxy delante del LLM, pero en la práctica sí agrega bastante valor

    1. es la forma con menos fricción de soportar y probar todos los modelos
    2. ofrece un límite de gasto. Si lo vas a conectar a un servicio público, un límite duro que evite que alguien abuse y te genere un millón de dólares en cargos de la noche a la mañana es muy útil
    3. el ranking también, aunque tiene fallas, es una señal interesante para ver qué modelos son populares. Tiene la limitación de que la mayoría de los usuarios de OpenAI/Anthropic no pasan por OpenRouter, y es difícil distinguir si muchos usuarios cambiaron o si fue un solo cliente grande
      En una situación donde el costo de API está creciendo hasta niveles significativos en varias empresas, un servicio como OpenRouter, que te permite medir el gasto y experimentar o cambiar de proveedor fácilmente, parece valioso
    • Otra ventaja es que publican el estado de caché por hora para todas las combinaciones de modelo/proveedor. A partir de eso revisé la lista de niveles de proveedores, y descubrí que una buena parte del hosting de terceros basado en open source simplemente está en el último nivel https://dirac.run/posts/cache-hit-rates-agents
    • Al menos para mí, la mayor reducción de fricción es el pago unificado, porque evita trámites burocráticos adicionales en entornos corporativos. La conversión/abstracción de API suele crear más problemas de los que resuelve
      Preferiría que unificaran el pago, pero permitieran usar directamente las API del proveedor, o a través de una especie de proxy de “HTTP crudo”. Hay muchas API gateways unificadas, pero todavía no he visto un producto que solo agregue pago/autenticación delante de la API nativa del proveedor
    • ¿Sabías que si cargas dinero en tu cuenta de OpenAI, vence después de 1 año? Cuando me pasó de verdad, desapareció como si fueran créditos promocionales, sin reembolso ni advertencia, y fue muy frustrante
      OpenRouter me gusta porque pone una barrera entre proveedores y usuarios que originalmente deberían comportarse como un servicio básico. Siento que, si se deja sola, OpenAI terminará comportándose como una telefónica
    • Buenos puntos. La experimentación sencilla ayuda al desarrollo, pero cuando escalas recomendaría con cautela pasar a una API primaria por precio
      OpenRouter también es un buen lugar para encontrar acceso gratuito a LLM, pero hay condiciones. Hay que asumir que la entrada y la salida van a terminar en la base de datos de entrenamiento de alguien. Si puedes pagar, deberías usar modelos de pago con privacidad, pero los modelos gratuitos fueron excelentes para aprender y experimentar. Especialmente para estudiantes jóvenes sin tarjeta de crédito ni fondos, es una gran forma de aprender programación con API y LLM
    • En este momento DeepSeek V4 rompe el caché, y en V4 el caché es una función clave de precios
      https://news.ycombinator.com/item?id=48319827
  • Soy cofundador y COO de OpenRouter. Hay muchas preguntas sobre por qué levantamos inversión
    Para empezar, OpenRouter sigue siendo una empresa dirigida y controlada por sus fundadores, y pensamos construir un gran producto para builders de todo el mundo y permanecer por mucho tiempo. Básicamente somos gente que ama construir y trastear, y cuando hacemos algo con IA intentamos crear lo que nosotros mismos querríamos usar
    Sobre levantar inversión, creemos que una empresa fuerte debe tener un balance sólido. Manejamos gastos a gran escala y tenemos compromisos de gasto importantes en todo el ecosistema. Asegurar efectivo para resistir lo que venga es una reducción de riesgo responsable y hace a la empresa muy resistente
    También les señala a grandes clientes y socios proveedores que vamos a poder seguir prestando el servicio y pagando las cuentas por mucho tiempo. No necesitamos capital de riesgo para seguir escalando y de hecho el negocio está sano, pero cuando realmente necesitas 100 millones de dólares no es cuando quieres salir a levantar inversión
    También es una buena validación para empleados actuales y futuros de que el valor que estamos construyendo juntos es real. También nos tomamos en serio la obligación de generar retorno para los inversionistas, y no se trata solo de maximizar la valuación; tenemos el privilegio de poder elegir con quién trabajar. Esto no se discute mucho en el mundo startup, pero creo que es importante

    • ¿En qué planea gastar OpenRouter esos 100 millones de dólares? Dijiste que “hace a la empresa muy resistente” y que es “una buena validación para los empleados”, pero parecería que hay cosas más interesantes que se pueden hacer con 100 millones de dólares
    • Me gusta el producto. El pago/autenticación unificados resuelven un dolor grande, así que gracias
      Más que la inversión, me interesa la estrategia de largo plazo. ¿Dónde ves a OpenRouter en 3 a 5 años y cuáles son las apuestas de producto que más te entusiasman ahora? También me da curiosidad si con esta ronda piensan expandirse a áreas adyacentes
    • ¿Se puede mantener el pago unificado y a la vez tener acceso crudo a las API del proveedor? La API unificada es excelente cuando funciona bien, pero en casos de uso raros o con funciones nuevas de API muchas veces termina siendo engorrosa
    • La función que más extraño es distinguir proveedores con cero retención de datos y poder decidir si un modelo cumple reglas que yo definí. Ahora mismo no hay forma de ocultar proveedores que no cumplan mis reglas de ZDR
    • Probé OpenRouter un poco. Testeé el producto hace como un año, pero a través de OpenRouter no pude obtener salida estructurada del modelo Gemini de Google
  • Desde la perspectiva de alguien que usa mucho OpenRouter, hace unos días hasta escribí sin querer un post promocional al respecto https://news.ycombinator.com/item?id=48317294, pero para probar modelos nuevos sin tener que lidiar con las distintas API de cada proveedor, que es un problema cada vez más repetido últimamente, definitivamente es la mejor forma de hacerlo
    Aun así, no entiendo muy bien a quienes ejecutan todo el backbone de sus agentes sobre OpenRouter con modelos caros como Claude Opus. A ese nivel de costo, la comisión del 5% ya se vuelve significativa, así que conviene más usar la API original del proveedor. De todos modos, claramente hay gente que lo usa, y eso es ingreso puro

    • Para ese tipo de cosas, parece mejor implementarlo con una librería open source a la que los proveedores aporten parches de soporte. No entiendo por qué una empresa tiene que hacer de proxy, y por qué no bastaría con correr una capa delgada relativamente simple en mi propia máquina
      Incluso desde la perspectiva de un tonto programador de sistemas que trabaja dentro de AI, entiendo que hay mucho software aparentemente innecesario que vende un poco de conveniencia por dinero. ¿OpenRouter es simplemente otra de esas cosas? Me pregunto si alojan modelos directamente, o si solo centralizan la facturación de varios proveedores
    • En este momento hay mucho gasto tonto de tokens. También existe una dinámica de usar la mayor cantidad posible de tokens. Por el ambiente de miedo a quedarse atrás, el costo económico de los tokens no se está evaluando con cuidado. Pero la gente ya está empezando a darse cuenta, y como este gasto no es sostenible, va a revertirse
    • La disponibilidad puede ser mejor. Al fin y al cabo, se va a enrutar por Anthropic, Amazon Bedrock, Claude Platform de AWS, Google Vertex Europe o Google Vertex
    • Pagar 5% extra por facturación unificada y límites de uso está bien. Simplemente hace todo más fácil
    • La conveniencia se cobra con sobreprecio
  • ¿El “Open” de OpenRouter significa lo mismo que el “Open” de OpenAI? No pude encontrar un repositorio ni código alojado. Pensé que era una herramienta open source y autoalojable con un producto en la nube encima, pero parece que solo existe lo segundo

    • Yo también pensé que era open source, pero al verificarlo vi que no lo es. Dicen que lo llaman “Open” porque enruta hacia modelos abiertos de terceros. ¿Será otra capa chafa estilo VC?
    • El Open de OpenRouter significa lo mismo que el Open de OpenSea. Porque el fundador es el mismo. Que cada quien decida cómo tomar eso
    • Sinceramente, cualquiera podría hacer algo como OpenRouter en un par de noches con Claude Code
      Solo es un proxy
    • “Open” en el sentido de que es una capa única de API que te permite intercambiar el modelo de abajo
  • Mientras siga habiendo mucha experimentación en el espacio LLM y el “modelo popular del momento” siga cambiando entre varios laboratorios frontier, OpenRouter probablemente seguirá siendo muy popular
    Cuando la situación empiece a estabilizarse, es muy probable que se consoliden tanto los modelos frontier como los open source. Entonces la utilidad de OpenRouter va a disminuir. Cuando quieres probar 20 modelos de 10 laboratorios, el sobrecosto del 5% vale totalmente la pena; pero si solo necesitas 5 modelos de 2 proveedores y además puedes ajustar las opciones de API de cada proveedor para abaratar costos, se vuelve más difícil justificarlo

  • Una de las cosas que OpenRouter facilita mucho es la gestión de claves API. Me gustaría que otros proveedores también hicieran posible o más fácil generar nuevas claves y configurar expiración/límites por clave
    Hay muchos casos de uso, como cuando compartes funciones de AI/asistencia con gente externa. Puedes permitirles usar esa función, pero limitar el daño si la clave se comparte o se usa para otra cosa, y además evitar tener que pasar por mecanismos de evasión más frágiles, tipo barandillas improvisadas

  • ¿De verdad hace falta dinero de VC para poner un proxy delante de otras API? ¿Exactamente en qué lo van a gastar? ¿Marketing? Ya son conocidos, ¿qué más quieren promocionar?
    ¿Infraestructura? ¿De verdad hace falta más infraestructura para hacer proxy de solicitudes? Solo paguen Cloudflare
    ¿Contratar más ingenieros? Pero si ustedes son justamente los mejores vendedores de aceite de serpiente diciendo que ya no hacen falta ingenieros
    Entonces, ¿en qué se va a gastar esos 100 millones de dólares?

    • Lo aceptan porque pueden conseguirlo. Funciona como prueba social, porque ayuda a convencer a los clientes de que están creando algo con un valor más profundo. En la práctica, probablemente lo usarán para desarrollar canales y prepararse para convertir a futuro a los clientes y a los datos que esos clientes les confían en producto
    • Esta respuesta del cofundador de OpenRouter parece relevante: https://news.ycombinator.com/item?id=48340940
  • Una buena función de OpenRouter que todavía no vi mencionada aquí es el metamodelo de OpenRouter. Enruta automáticamente cada prompt al modelo con el rendimiento apropiado
    Así no tienes que mandar todo a Opus, ahorras mucho dinero y, cuando preguntas algo más complejo, también evita malos resultados porque lo manda automáticamente a Opus

  • “En los últimos 6 meses, el volumen semanal procesado por OpenRouter aumentó de 5 billones de tokens a 25 billones de tokens
    Guau, eso es más de 41 millones de tokens por segundo. Para un equipo pequeño de unas 48 a 50 personas, la escala es enorme

    • Suponiendo que ese sea el costo de tokens upstream, e incluso considerando el multiplicador de tokens procesados por consulta, eso podría ser, como mucho, unos cuantos miles de solicitudes por segundo. Sigue siendo impresionante, pero para un equipo startup de 50 personas que gasta varios millones de dólares al mes, se siente más o menos de ese orden
      Si un proveedor de correo recibiera miles de mensajes por segundo, y además los reenviara upstream para detección de spam, ¿sonaría igual de impresionante? En ese caso el número de tokens incluso podría ser mayor, pero, esté bien o mal, supongo que en HN la reacción habría sido mucho más tibia
      Por un lado, esto muestra hasta qué punto ha avanzado la industria actual en términos de escala; por otro, muestra cuánto se han disparado los datos y el procesamiento incluso para solicitudes nominalmente simples. Aun así, está claro que el equipo es muy bueno y es un logro digno de reconocimiento
    • Para darse una idea, si tomas cada token como 4 bytes, eso equivale a unos 164 MB/s de tráfico. Visto así, suena un poco menos abrumador
  • Sería interesante ver la hoja financiera de este caso. Normalmente los inversionistas de una Serie B esperan casi un retorno de 10x. ¿OpenRouter realmente puede justificar una valuación de 1.1 mil millones de dólares? Para una función de “gestión”/intermediación, suena realmente alto. Claro, es AI, pero ya tengo la edad suficiente como para recordar cuando cada empresa puntocom recibía valuaciones de mil millones

    • Podría, si logra enrutar fácilmente la mayoría de los tokens del mundo. ¿Qué pasaría si en algún momento ese 5% lo empiezan a pagar los proveedores y OpenRouter se queda con una parte mayor del lado de infraestructura/enrutamiento? Hay muchas formas de convertirse en una empresa de 10 mil millones de dólares
    • Como siempre, a largo plazo el producto serán los datos de los usuarios