La cola larga de la IA

xguru · 2024-11-18T10:21:01+09:00

Tras el lanzamiento de ChatGPT en noviembre de 2022, las startups de IA recibieron una atención intensiva por parte de los inversionistas, y en el segundo trimestre de 2024 el 49% de todo el financiamiento de venture capital se invirtió en startups de IA y machine learning. Aunque los proveedores de modelos como OpenAI y las empresas nativas de IA como Perplexity o Jasper están atrayendo la atención, en realidad hay más empresas "no IA" afectadas por la IA. A este impacto de la IA sobre esas empresas no IA lo llamamos la "cola larga de la IA", y esta cola larga puede dividirse en cuatro categorías según la forma en que las empresas integran la IA: Construcción de modelos independientes Uso de modelos existentes como GPT-4 de OpenAI Desarrollo sobre modelos open source como Llama de Meta Uso de herramientas de IA ya desarrolladas como ChatGPT Construir modelos independientes y propios es la forma más intensiva en recursos de aprovechar la IA, y por lo general es adecuada para empresas con grandes fuentes de datos originales y con suficientes recursos humanos y financieros para entrenar un nuevo modelo. Los modelos de código cerrado como los GPT de OpenAI o Claude de Anthropic fueron entrenados con decenas de miles de millones a billones de parámetros, pueden generar resultados precisos y detallados en una amplia variedad de áreas, desde programación hasta servicio al cliente, y son fácilmente accesibles mediante API. Los modelos open source como Mistral o Llama de Meta son herramientas potentes; Llama 3.1 fue entrenado con 405 mil millones de parámetros. A diferencia de los modelos de código cerrado, los modelos open source ofrecen transparencia y flexibilidad, y permiten ajustar los pesos del modelo para adaptarlo a necesidades específicas del cliente. Las herramientas de IA de terceros como ChatGPT son las más fáciles de integrar, y los clientes pueden usar herramientas ya terminadas sin necesidad de construir o ajustar modelos internamente. Aunque la estrategia de IA varía según la empresa, las compañías exitosas están usando la IA para complementar sus negocios existentes, imitando casos de éxito dentro de su sector y manteniéndose flexibles a medida que evoluciona la tecnología de IA. La ley de potencia del hype en la IA Distribución normal vs. ley de potencia: la distribución normal es común en la vida diaria, como en el IQ, las calificaciones de exámenes o la presión arterial, donde los datos se concentran alrededor del promedio. En cambio, muchos fenómenos del mundo están definidos por una ley de potencia, en la que unos pocos casos extremos determinan la mayor parte de los resultados. Por ejemplo, más de la mitad del alza del índice S&P 500 en 2023 provino de apenas 7 acciones, equivalentes al 1.4%. En venture capital también, unas pocas inversiones exitosas representan la mayor parte de los retornos de un fondo. Ejemplo: Fred Wilson, fundador de Union Square Ventures, mencionó que "una sola inversión puede generar el retorno de todo el fondo". La ley de potencia en el sector de la IA: así como durante la burbuja Dot Com el capital se concentró en las empresas de internet, en 2024 el sector de la IA muestra un hype similar. En la cohorte de verano de 2024 de YCombinator, 75% está desarrollando productos relacionados con IA. 49% de la inversión de venture capital en el segundo trimestre de 2024 se concentró en startups de IA y machine learning (frente a 29% en el segundo trimestre de 2022). A inicios de 2020, la valuación mediana de las empresas tempranas de IA, SaaS y fintech era de $25M, $27M y $28M, respectivamente, pero en 2024 subió a $70M, $46M y $50M. OpenAI estaba operando con pérdidas, pero en octubre de 2024 levantó nuevo capital con una valuación de $157B (39 veces sus ingresos). Límites de las startups nativas de IA: con la aparición de la IA generativa y los LLM, la IA se está convirtiendo en el producto central de muchas empresas. Sin embargo, mientras las compañías nativas de IA monopolizan la atención de los inversionistas, las empresas no IA también se ven afectadas por el desarrollo de esta tecnología. La mayoría de las empresas no son, por naturaleza, compañías de IA, pero los avances de la IA tendrán un gran impacto en sus modelos de negocio. De la cola larga de internet a la cola larga de la IA: después de la burbuja Dot Com, las empresas no relacionadas con internet que se adaptaron a esa tendencia lograron grandes éxitos. Por ejemplo, Walmart fue fundada en 1962, pero en 2023 sus ventas de comercio electrónico alcanzaron $73B, con un crecimiento de 5 veces frente a 2017. Hoy está surgiendo la "cola larga de la IA", que incluye empresas no IA de diversos sectores como fintech, SaaS, salud, comercio electrónico y logística. Impacto amplio de la IA: desde usar herramientas de IA preconstruidas hasta integrar IA en flujos de trabajo internos, empresas de múltiples industrias están aprovechando o intentando aprovechar la IA. Al igual que el impacto de internet sobre las empresas no internet, la IA también tendrá un alcance amplio que no se limita a las compañías que construyen modelos de IA. Definición de la cola larga de la IA Las empresas de IA concentran la mayor parte del interés y la inversión en IA, y pueden dividirse en dos categorías: Empresas de modelos: compañías como OpenAI, Anthropic y Mistral que desarrollan y ofrecen a los usuarios LLM (modelos de lenguaje de gran tamaño) propietarios u open source. Empresas nativas de IA: compañías como Perplexity y Jasper que ofrecen productos y servicios basados en modelos de IA. En la primera categoría, el modelo en sí es el producto. En la segunda, el modelo de IA es el núcleo de la funcionalidad, pero sin el modelo la empresa misma no existiría. Por ejemplo, Tuhin Srivastava, CEO de Baseten, explicó que "sin el modelo, una empresa nativa de IA no existe". Sin embargo, la mayoría de las empresas, como Bloomberg, Walmart y Canva, no pertenecen a ninguna de estas dos categorías. Forman parte de una categoría más amplia llamada la "cola larga de la IA". Preguntas clave de la cola larga ¿Cómo afectarán los avances de la tecnología de IA a modelos de negocio que ya existían antes del lanzamiento de ChatGPT? ¿Cómo están usando y cómo usarán en el futuro la IA los empleados de distintas industrias, desde analistas en firmas de consultoría hasta ingenieros de software en empresas tecnológicas? ¿Cómo se están posicionando las empresas en el mercado de la IA? ¿Están construyendo sus propios modelos o usando herramientas desarrolladas externamente? Casos de uso de IA en distintas empresas Ejemplo: Ramp (plataforma de gestión de gastos) y Atlassian (empresa australiana de SaaS) añadieron IA generativa sobre sus datos y flujos de trabajo existentes. Klarna (empresa fintech sueca) invirtió en IA para mejorar la eficiencia de sus operaciones internas, y su chatbot de IA mostró resultados al nivel de reemplazar a 700 empleados de tiempo completo de servicio al cliente. PwC acordó en mayo de 2024 ofrecer funciones de ChatGPT Enterprise a 100 mil empleados. Además, en una encuesta de la Cámara de Comercio de EE. UU. de 2024, 98% de las pequeñas y medianas empresas respondieron que están usando herramientas de IA. Comparación entre pasado y presente Al igual que después del boom de internet hubo empresas no internet que lograron un gran éxito al adoptar el comercio electrónico, la "cola larga de la IA" implica que empresas no IA de múltiples industrias se verán afectadas por la IA. Así como internet tuvo un impacto amplio sobre las empresas no internet, la IA también afectará a la economía en general y no solo a las compañías que construyen modelos de IA. Las cuatro capas de la cola larga de la IA Construcción interna de modelos de IA independientes: empresas que construyen sus propios modelos de IA aprovechando datasets propietarios. Uso de modelos de código cerrado: empresas que usan modelos de código cerrado de OpenAI, Anthropic y otros. Uso de modelos open source: empresas que usan modelos de Llama, Mistral y Hugging Face. Integración de herramientas de IA preconstruidas: empresas que integran herramientas de IA ya desarrolladas en sus flujos de trabajo. Estas cuatro capas no son fijas, y las empresas que usan IA de distintas maneras pueden clasificarse en varias de ellas a la vez. A medida que la tecnología de IA avanza rápidamente, la forma en que las empresas la aprovechan también sigue cambiando. Capa 1: construir un modelo propio La estrategia que más recursos consume: la estrategia más costosa en la cola larga de la IA es construir un modelo independiente desde cero. Esta estrategia es adecuada para empresas que (1) tienen abundante capital y (2) poseen conjuntos de datos propietarios valiosos. Ejemplo: según Sam Altman, el costo de entrenamiento de GPT-4 asciende a $100M. Aunque los modelos propios implican costos elevados, para las empresas con conjuntos de datos propietarios ofrecen (A) resultados más detallados y adaptados a la empresa, (B) control total sobre el modelo y los pesos, y (C) la posibilidad de reducir costos frente a modelos de código cerrado. Bloomberg Bloomberg es una empresa de datos financieros y medios con sede en Nueva York, que genera más de $12B en ingresos anuales. Su producto insignia, Bloomberg Terminal, representa alrededor de 2/3 de las ventas totales. En Bloomberg, de más de 8 mil ingenieros, más de 350 pertenecen al equipo de ingeniería de IA, y la empresa publica diversos artículos de investigación en IA cada año. En marzo de 2023, Bloomberg presentó BloombergGPT, un LLM especializado en finanzas. El modelo estaba compuesto por un total de 50B parámetros y fue entrenado combinando 345B de datasets públicos con un dataset de 363B documentos financieros recopilados durante 40 años. Se estima que el costo de entrenamiento fue de entre $2.7M y más de $10M. En enero de 2024, Bloomberg incorporó a Terminal una función de resúmenes generados por IA, que se presume usa un modelo propio y fue entrenada con ayuda de analistas internos. Replit Replit es un entorno de desarrollo integrado (IDE) basado en la web, que ofrece colaboración, autocompletado de código y funciones de depuración. Las funciones de IA de Replit se ofrecen mediante una combinación de modelos desarrollados internamente, ajuste fino de modelos open source, y modelos de código cerrado de OpenAI y Anthropic. En abril y octubre de 2023, Replit lanzó su propio modelo de autocompletado de código y lo publicó en Hugging Face. En abril de 2024, lanzó una función de depuración automática tras hacer fine-tuning de un modelo open source. En septiembre de 2024, lanzó un programador en pareja automático basado en su propio modelo de 7B parámetros, aunque algunos usuarios expresaron descontento con las funciones iniciales. Canva Canva es una plataforma de diseño web con base en Australia, valorada en $49B en octubre de 2024. En octubre de 2023, Canva lanzó Magic Studio, un estudio de diseño con IA generativa. Este estudio construye un “modelo propietario” usando como datos de entrenamiento contenido generado por los usuarios. Los datos de los usuarios no se usan sin permiso, y a quienes participan se les paga una compensación. En julio de 2024, Canva adquirió la plataforma de generación de imágenes Leonardo.Ai con planes de integrarla en Magic Studio. Walmart Walmart ha estado construyendo herramientas de IA orientadas al cliente desde 2018, y en junio de 2024 cambió a modelos propios para todas sus funciones de IA generativa. En octubre de 2024, Walmart presentó Wallaby, un LLM especializado en retail. Este modelo fue entrenado con datos de Walmart para generar respuestas naturales relacionadas con atención al cliente. Walmart está usando IA para mejorar chatbots de soporte al cliente, organización de catálogos de productos y experiencias de compra con realidad aumentada. Además, también ofrece experiencias de compra virtual en plataformas en línea como Roblox. Walmart prefiere los modelos propios, pero aún planea usar modelos de terceros según el caso de uso específico. Capa 2: uso de modelos existentes de código cerrado En lugar de construir un modelo de manera independiente, las empresas pueden desarrollar sus propias soluciones accediendo por API a modelos de IA de código cerrado de OpenAI, Anthropic y otras compañías. Los modelos de código cerrado pueden ofrecer resultados precisos en distintos campos, por lo que son útiles para tareas generales como transcripción, atención al cliente y extracción de datos. Los modelos GPT de OpenAI y Claude de Anthropic ofrecen resultados de muy alta calidad. Gracias a la facilidad de acceso por API, se consideran una de las formas más sencillas de adoptar IA desde el punto de vista de ingeniería. Recientemente también se han lanzado modelos pequeños como GPT-4o mini para ofrecer eficiencia en costos y rendimiento de inferencia rápido. Zapier Zapier es una plataforma de automatización de flujos de trabajo, fundada en 2011 y valorada en $5B en agosto de 2023. Usa modelos de OpenAI para mejorar procesos internos de automatización, por ejemplo funciones de generación y resumen de transcripciones de reuniones y de resumen de artículos web. La herramienta Copilot de Zapier permite crear flujos de trabajo usando prompts en lenguaje natural. Klarna Klarna es una empresa fintech sueca que ofrece servicios de “Buy Now, Pay Later”, y en septiembre de 2024 anunció que reemplazaría con IA a Salesforce y Workday. Mediante un asistente de IA de atención al cliente basado en modelos de OpenAI, gestiona 2/3 de las solicitudes de soporte y reemplaza una carga de trabajo equivalente a 700 empleados de tiempo completo. Internamente, usa el asistente de IA Kiki para ayudar a sus empleados a responder más de 2 mil preguntas al día. Ramp Ramp es una startup fintech B2B fundada en 2019, que ofrece diversos productos de software financiero. Usa los modelos GPT-4 y Claude para automatizar análisis de datos de contratos, clasificación de transacciones y redacción de notas de recibos. Internamente, también usa IA para ofrecer funciones de resumen de llamadas con clientes y preguntas y respuestas, integradas con Slack. Atlassian Atlassian es una empresa valorada en $50B que ofrece software de colaboración para equipos como Jira, Trello y Confluence. En abril de 2023 anunció una función de IA generativa llamada Atlassian Intelligence. Esta función combina modelos de OpenAI con modelos propios de Atlassian. El asistente de IA Rovo potencia las funciones de búsqueda de Jira y automatiza la generación de contenido de marketing y la recopilación de feedback mediante agentes no-code. Canva Canva usa modelos propietarios en Magic Studio, pero también utiliza modelos de código cerrado para algunas funciones. Ejemplo: el editor de escritura con modelos de OpenAI genera contenido ajustando el tono a las muestras cargadas. Canva también opera un diverso marketplace de apps de IA, que incluye apps como DALL-E de OpenAI e Imagen de Google. Capa 3: Desarrollo basado en modelos de código abierto En lugar de crear modelos de forma independiente o usar modelos de código cerrado como GPT-4o de OpenAI, muchas empresas están construyendo sus propias herramientas aprovechando modelos de código abierto de Meta, Mistral, Hugging Face y otros. Los modelos de código abierto ofrecen ventajas como alta personalización y transparencia, mayor privacidad de los datos y reducción de costos. Según un informe de Databricks de 2024, el 76% de las empresas que usan LLM eligen código abierto. Los modelos de código abierto no tienen costos de licencia por separado y pueden alojarse por cuenta propia, lo que permite evitar grandes costos de nube. Para los clientes empresariales, también es un factor importante la menor exposición a problemas de derechos de autor y al riesgo de filtración de datos. VMware VMware es un proveedor de software de virtualización que fue adquirido por Broadcom en 2023 por $69B. VMware colaboró con Hugging Face para desarrollar un asistente de programación de código abierto llamado SafeCoder. Usó un modelo de 15.5B parámetros llamado StarCoder, que recopila datos de proyectos de código abierto para minimizar problemas de derechos de autor. Los clientes empresariales pueden ajustar finamente el modelo StarCoder con su propio código, lo que ayuda en tareas internas que requieren conocimiento de dominio. Mathpresso Mathpresso es una empresa surcoreana de edtech que, a través de su aplicación principal QANDA, permite a los estudiantes subir capturas de pantalla de problemas de matemáticas y recibir soluciones automáticas. En 2023, desarrolló MathGPT, un LLM especializado en matemáticas, usando el modelo Llama 2 de Meta. MathGPT utilizó como datos de entrenamiento las soluciones matemáticas de QANDA, y ofreció mayor personalización y precisión adaptada al entorno educativo que los modelos comerciales existentes. MathGPT superó a Microsoft Tora en los benchmarks MATH y GSM8K, y ocupó el primer lugar entre los modelos de 13B parámetros o menos. Brave Brave es un navegador web centrado en la privacidad que ofrece funciones como bloqueo de anuncios y de rastreadores. En agosto de 2023, lanzó un asistente de IA llamado Leo, usando los modelos de código abierto Llama 2 de Meta y Mixtral 8x7B de Mistral. Brave no almacena datos de los usuarios y usa modelos alojados por cuenta propia para proteger la privacidad de los usuarios. También es compatible con el modelo Claude de Anthropic, pero la configuración predeterminada está basada en modelos de código abierto. Replit Además de su modelo personalizado de autocompletado de código, en abril de 2024 Replit lanzó el agente de IA Code Repair tras ajustar finamente un modelo de 7B parámetros de Hugging Face. Los usuarios de pago pueden alternar entre el modelo de código abierto de Replit y otros modelos de código cerrado, ofreciendo soluciones adaptadas a distintas necesidades de los clientes. Capa 4: Uso de herramientas de IA preconstruidas Se trata de casos en los que las empresas no construyen sus propios modelos de IA, sino que compran y usan herramientas de IA generativa ya terminadas. La principal ventaja de las herramientas externas es la reducción de costos. Comprar una herramienta específica es más barato que entrenar o ajustar finamente un modelo. Tres razones principales por las que las empresas eligen herramientas externas de IA: Cuando necesitan herramientas de investigación de conocimiento general y lluvia de ideas - Ejemplo: según una investigación de BCG, las herramientas de IA generativa aumentan la productividad laboral y son especialmente útiles cuando falta experiencia técnica especializada. Cuando necesitan herramientas empresariales generales (por ejemplo, chatbots de atención al cliente) - Es más rentable obtener beneficios rápidamente usando herramientas de terceros que construir un modelo propio. Cuando ya se han desarrollado herramientas específicas adaptadas a una industria - Ejemplo: Kira, una herramienta para revisar contratos legales, es utilizada por muchos bufetes de abogados. Boston Consulting Group (BCG) BCG es una firma global de consultoría con 32K empleados en todo el mundo e ingresos de $12.3B. En 2023, BCG realizó experimentos internos con ChatGPT de OpenAI y observó que la IA generativa mostró una mejora del 40% en el rendimiento en tareas creativas. Por ejemplo, mejoró el desempeño en la resolución creativa de problemas, como generar ideas para nuevos productos de calzado y redactar eslóganes de marketing. En 2024, BCG implementó ChatGPT Enterprise para todos sus empleados, reconociendo la alta utilidad de las herramientas de IA. Dollar Shave Club Dollar Shave Club es un proveedor de productos de afeitado que fue adquirido por Unilever por $1B y después vendido a Nexus Capital Management. En lugar de un chatbot propio, automatizó la atención al cliente con Answer Bot de Zendesk. Answer Bot fue entrenado con datos de 12M interacciones con clientes y responde preguntas simples de clientes en cuestión de segundos. Resuelve 4.5K tickets al mes, lo que representa el 10% del volumen total de tickets de la empresa. Law Firms (bufetes de abogados) La revisión de contratos legales está llena de términos y cláusulas complejas. Muchos bufetes no tienen los recursos para desarrollar herramientas internas de IA, por lo que recurren a herramientas externas de IA como Kira. Ejemplo: grandes firmas legales como Skadden, Hogan Lovells y Paul, Weiss usan Kira para reducir el tiempo de revisión de contratos en hasta un 60%. Kira puede analizar rápidamente más de 1K cláusulas y puntos de datos comunes, por lo que se utiliza en due diligence de M&A, revisión de contratos de préstamo y más. Tres formas en que las empresas de la Long Tail usan la IA Las empresas que pertenecen al Long Tail están aplicando la IA generativa de diversas maneras, como Bloomberg, que desarrolla herramientas personalizadas para profesionales de finanzas, y los consultores de BCG, que usan ChatGPT como herramienta de productividad. Los modelos que impulsan estas herramientas también son diversos, desde el modelo de generación de imágenes de Canva hasta el modelo integrado con GPT de Ramp. Al observar los patrones de las empresas que aplican IA, destacan las siguientes tres tendencias principales, a pesar del ritmo actual de avance tecnológico. Usar la IA como herramienta para complementar el negocio existente La mayoría de las empresas del Long Tail ya ofrecen productos y servicios bien establecidos, y la IA cumple el papel de complementarlos y mejorarlos. Ejemplo: Replit ya había tenido éxito antes de lanzar herramientas de IA, y la IA se usa para mejorar el producto como una extensión de sus herramientas existentes para desarrolladores. Leo AI de Brave es una herramienta de IA generativa que amplía la política del navegador de priorizar la privacidad. Brave ha trabajado durante 8 años en la protección de la privacidad, y Leo es una herramienta que continúa ese principio. En Walmart, los precios bajos y una política de devoluciones flexible son lo esencial, y la IA solo cumple un papel de apoyo, sin reemplazar la estrategia central. En conclusión, las empresas adoptan IA internamente para aumentar la eficiencia de sus procesos, pero la experiencia central del usuario sigue siendo la prioridad. Copiar las estrategias de IA del mismo sector Las empresas adoptan rápidamente estrategias de IA exitosas para mantener su competitividad. Ejemplo: BCG utilizó ChatGPT para mejorar de forma significativa el desempeño en tareas creativas y de programación. Es probable que estos resultados presionen a otras consultoras como McKinsey y Bain a adoptar herramientas de IA similares. Brave y VMware ofrecen productos centrales diferentes, pero ambos priorizan la privacidad de los datos, por lo que eligen modelos de código abierto. Si las empresas líderes logran una ventaja competitiva sostenida mediante la adopción de IA, se espera que otras también deban adoptar estrategias similares. Mantener una estrategia de IA flexible La forma de usar la IA no es fija, y las empresas pueden aplicar o ajustar distintas estrategias. Ejemplo: OpenAI al principio construyó modelos cada vez más grandes, pero en 2024 lanzó modelos pequeños y eficientes como GPT-4o mini. Esto ofrece reducción de costos y mayor velocidad de inferencia. El CTO de Ramp mencionó que GPT-4o mini cumple con el 90% de los requisitos, y evaluó que un modelo pequeño puede ser más eficiente que uno grande. Tuhin Srivastava, CEO de Baseten, señaló que las empresas tienden a querer construir sus propios modelos, pero eso puede consumir demasiados recursos y tiempo. Consejo de Srivastava: "primero usar herramientas probadas y luego reemplazarlas gradualmente con modelos propios". Las empresas deben estar en una posición que les permita responder con flexibilidad cuando aparezcan nuevas tecnologías de IA, para poder aprovechar rápidamente las mejoras tecnológicas. Objetivo final de las empresas del Long Tail Aunque el interés y el entusiasmo actuales por la IA se concentran en los modelos y en las empresas nativas de IA, los casos de uso de IA también se están volviendo cada vez más notorios entre las empresas no nativas de IA. Estas empresas están adoptando diversas soluciones de IA, desde chatbots de atención al cliente hasta experiencias de compra con realidad aumentada. Dada la velocidad de la innovación en IA, la forma más sencilla de entender cómo usan la IA las empresas del Long Tail es clasificarlas en las cuatro capas presentadas en este análisis profundo: modelos personalizados, modelos de código cerrado, modelos de código abierto y herramientas de IA de terceros Los diversos ejemplos tratados en este análisis profundo muestran cómo las empresas han construido y adoptado distintas herramientas de IA, lo que ayuda a los lectores a entender cómo abordar la integración de IA en sus propias organizaciones. Las cuatro capas presentan trade-offs relacionados con tiempo de aprendizaje, costo, personalización, privacidad y calidad, pero como el costo de cambiar entre modelos es bajo, los clientes pueden tener la flexibilidad de experimentar con distintas soluciones. El objetivo final de las empresas del Long Tail no es convertirse en empresas de IA, sino usar herramientas de IA para complementar y acelerar su negocio principal.

(research.contrary.com)

12 puntos por xguru 2024-11-18 | Aún no hay comentarios. | Compartir por WhatsApp

Tras el lanzamiento de ChatGPT en noviembre de 2022, las startups de IA recibieron una atención intensiva por parte de los inversionistas, y en el segundo trimestre de 2024 el 49% de todo el financiamiento de venture capital se invirtió en startups de IA y machine learning.
Aunque los proveedores de modelos como OpenAI y las empresas nativas de IA como Perplexity o Jasper están atrayendo la atención, en realidad hay más empresas "no IA" afectadas por la IA.
A este impacto de la IA sobre esas empresas no IA lo llamamos la "cola larga de la IA", y esta cola larga puede dividirse en cuatro categorías según la forma en que las empresas integran la IA:
- Construcción de modelos independientes
- Uso de modelos existentes como GPT-4 de OpenAI
- Desarrollo sobre modelos open source como Llama de Meta
- Uso de herramientas de IA ya desarrolladas como ChatGPT
Construir modelos independientes y propios es la forma más intensiva en recursos de aprovechar la IA, y por lo general es adecuada para empresas con grandes fuentes de datos originales y con suficientes recursos humanos y financieros para entrenar un nuevo modelo.
Los modelos de código cerrado como los GPT de OpenAI o Claude de Anthropic fueron entrenados con decenas de miles de millones a billones de parámetros, pueden generar resultados precisos y detallados en una amplia variedad de áreas, desde programación hasta servicio al cliente, y son fácilmente accesibles mediante API.
Los modelos open source como Mistral o Llama de Meta son herramientas potentes; Llama 3.1 fue entrenado con 405 mil millones de parámetros. A diferencia de los modelos de código cerrado, los modelos open source ofrecen transparencia y flexibilidad, y permiten ajustar los pesos del modelo para adaptarlo a necesidades específicas del cliente.
Las herramientas de IA de terceros como ChatGPT son las más fáciles de integrar, y los clientes pueden usar herramientas ya terminadas sin necesidad de construir o ajustar modelos internamente.
Aunque la estrategia de IA varía según la empresa, las compañías exitosas están usando la IA para complementar sus negocios existentes, imitando casos de éxito dentro de su sector y manteniéndose flexibles a medida que evoluciona la tecnología de IA.

La ley de potencia del hype en la IA

Distribución normal vs. ley de potencia: la distribución normal es común en la vida diaria, como en el IQ, las calificaciones de exámenes o la presión arterial, donde los datos se concentran alrededor del promedio. En cambio, muchos fenómenos del mundo están definidos por una ley de potencia, en la que unos pocos casos extremos determinan la mayor parte de los resultados.
- Por ejemplo, más de la mitad del alza del índice S&P 500 en 2023 provino de apenas 7 acciones, equivalentes al 1.4%.
- En venture capital también, unas pocas inversiones exitosas representan la mayor parte de los retornos de un fondo. Ejemplo: Fred Wilson, fundador de Union Square Ventures, mencionó que "una sola inversión puede generar el retorno de todo el fondo".
La ley de potencia en el sector de la IA: así como durante la burbuja Dot Com el capital se concentró en las empresas de internet, en 2024 el sector de la IA muestra un hype similar.
- En la cohorte de verano de 2024 de YCombinator, 75% está desarrollando productos relacionados con IA.
- 49% de la inversión de venture capital en el segundo trimestre de 2024 se concentró en startups de IA y machine learning (frente a 29% en el segundo trimestre de 2022).
- A inicios de 2020, la valuación mediana de las empresas tempranas de IA, SaaS y fintech era de $25M, $27M y $28M, respectivamente, pero en 2024 subió a $70M, $46M y $50M.
- OpenAI estaba operando con pérdidas, pero en octubre de 2024 levantó nuevo capital con una valuación de $157B (39 veces sus ingresos).
Límites de las startups nativas de IA: con la aparición de la IA generativa y los LLM, la IA se está convirtiendo en el producto central de muchas empresas. Sin embargo, mientras las compañías nativas de IA monopolizan la atención de los inversionistas, las empresas no IA también se ven afectadas por el desarrollo de esta tecnología. La mayoría de las empresas no son, por naturaleza, compañías de IA, pero los avances de la IA tendrán un gran impacto en sus modelos de negocio.
De la cola larga de internet a la cola larga de la IA: después de la burbuja Dot Com, las empresas no relacionadas con internet que se adaptaron a esa tendencia lograron grandes éxitos. Por ejemplo, Walmart fue fundada en 1962, pero en 2023 sus ventas de comercio electrónico alcanzaron $73B, con un crecimiento de 5 veces frente a 2017.
- Hoy está surgiendo la "cola larga de la IA", que incluye empresas no IA de diversos sectores como fintech, SaaS, salud, comercio electrónico y logística.
Impacto amplio de la IA: desde usar herramientas de IA preconstruidas hasta integrar IA en flujos de trabajo internos, empresas de múltiples industrias están aprovechando o intentando aprovechar la IA. Al igual que el impacto de internet sobre las empresas no internet, la IA también tendrá un alcance amplio que no se limita a las compañías que construyen modelos de IA.

Definición de la cola larga de la IA

Las empresas de IA concentran la mayor parte del interés y la inversión en IA, y pueden dividirse en dos categorías:
- Empresas de modelos: compañías como OpenAI, Anthropic y Mistral que desarrollan y ofrecen a los usuarios LLM (modelos de lenguaje de gran tamaño) propietarios u open source.
- Empresas nativas de IA: compañías como Perplexity y Jasper que ofrecen productos y servicios basados en modelos de IA.
En la primera categoría, el modelo en sí es el producto. En la segunda, el modelo de IA es el núcleo de la funcionalidad, pero sin el modelo la empresa misma no existiría. Por ejemplo, Tuhin Srivastava, CEO de Baseten, explicó que "sin el modelo, una empresa nativa de IA no existe".
Sin embargo, la mayoría de las empresas, como Bloomberg, Walmart y Canva, no pertenecen a ninguna de estas dos categorías. Forman parte de una categoría más amplia llamada la "cola larga de la IA".
Preguntas clave de la cola larga
- ¿Cómo afectarán los avances de la tecnología de IA a modelos de negocio que ya existían antes del lanzamiento de ChatGPT?
- ¿Cómo están usando y cómo usarán en el futuro la IA los empleados de distintas industrias, desde analistas en firmas de consultoría hasta ingenieros de software en empresas tecnológicas?
- ¿Cómo se están posicionando las empresas en el mercado de la IA? ¿Están construyendo sus propios modelos o usando herramientas desarrolladas externamente?
Casos de uso de IA en distintas empresas
- Ejemplo: Ramp (plataforma de gestión de gastos) y Atlassian (empresa australiana de SaaS) añadieron IA generativa sobre sus datos y flujos de trabajo existentes.
- Klarna (empresa fintech sueca) invirtió en IA para mejorar la eficiencia de sus operaciones internas, y su chatbot de IA mostró resultados al nivel de reemplazar a 700 empleados de tiempo completo de servicio al cliente.
- PwC acordó en mayo de 2024 ofrecer funciones de ChatGPT Enterprise a 100 mil empleados. Además, en una encuesta de la Cámara de Comercio de EE. UU. de 2024, 98% de las pequeñas y medianas empresas respondieron que están usando herramientas de IA.
Comparación entre pasado y presente
- Al igual que después del boom de internet hubo empresas no internet que lograron un gran éxito al adoptar el comercio electrónico, la "cola larga de la IA" implica que empresas no IA de múltiples industrias se verán afectadas por la IA.
- Así como internet tuvo un impacto amplio sobre las empresas no internet, la IA también afectará a la economía en general y no solo a las compañías que construyen modelos de IA.
Las cuatro capas de la cola larga de la IA
- Construcción interna de modelos de IA independientes: empresas que construyen sus propios modelos de IA aprovechando datasets propietarios.
- Uso de modelos de código cerrado: empresas que usan modelos de código cerrado de OpenAI, Anthropic y otros.
- Uso de modelos open source: empresas que usan modelos de Llama, Mistral y Hugging Face.
- Integración de herramientas de IA preconstruidas: empresas que integran herramientas de IA ya desarrolladas en sus flujos de trabajo.
Estas cuatro capas no son fijas, y las empresas que usan IA de distintas maneras pueden clasificarse en varias de ellas a la vez. A medida que la tecnología de IA avanza rápidamente, la forma en que las empresas la aprovechan también sigue cambiando.

Capa 1: construir un modelo propio

La estrategia que más recursos consume: la estrategia más costosa en la cola larga de la IA es construir un modelo independiente desde cero. Esta estrategia es adecuada para empresas que (1) tienen abundante capital y (2) poseen conjuntos de datos propietarios valiosos.
- Ejemplo: según Sam Altman, el costo de entrenamiento de GPT-4 asciende a $100M.
- Aunque los modelos propios implican costos elevados, para las empresas con conjuntos de datos propietarios ofrecen (A) resultados más detallados y adaptados a la empresa, (B) control total sobre el modelo y los pesos, y (C) la posibilidad de reducir costos frente a modelos de código cerrado.
Bloomberg
- Bloomberg es una empresa de datos financieros y medios con sede en Nueva York, que genera más de $12B en ingresos anuales. Su producto insignia, Bloomberg Terminal, representa alrededor de 2/3 de las ventas totales.
- En Bloomberg, de más de 8 mil ingenieros, más de 350 pertenecen al equipo de ingeniería de IA, y la empresa publica diversos artículos de investigación en IA cada año.
- En marzo de 2023, Bloomberg presentó BloombergGPT, un LLM especializado en finanzas. El modelo estaba compuesto por un total de 50B parámetros y fue entrenado combinando 345B de datasets públicos con un dataset de 363B documentos financieros recopilados durante 40 años.
- Se estima que el costo de entrenamiento fue de entre $2.7M y más de $10M.
- En enero de 2024, Bloomberg incorporó a Terminal una función de resúmenes generados por IA, que se presume usa un modelo propio y fue entrenada con ayuda de analistas internos.
Replit
- Replit es un entorno de desarrollo integrado (IDE) basado en la web, que ofrece colaboración, autocompletado de código y funciones de depuración.
- Las funciones de IA de Replit se ofrecen mediante una combinación de modelos desarrollados internamente, ajuste fino de modelos open source, y modelos de código cerrado de OpenAI y Anthropic.
  - En abril y octubre de 2023, Replit lanzó su propio modelo de autocompletado de código y lo publicó en Hugging Face.
  - En abril de 2024, lanzó una función de depuración automática tras hacer fine-tuning de un modelo open source.
  - En septiembre de 2024, lanzó un programador en pareja automático basado en su propio modelo de 7B parámetros, aunque algunos usuarios expresaron descontento con las funciones iniciales.
Canva
- Canva es una plataforma de diseño web con base en Australia, valorada en $49B en octubre de 2024.
- En octubre de 2023, Canva lanzó Magic Studio, un estudio de diseño con IA generativa. Este estudio construye un “modelo propietario” usando como datos de entrenamiento contenido generado por los usuarios.
  - Los datos de los usuarios no se usan sin permiso, y a quienes participan se les paga una compensación.
- En julio de 2024, Canva adquirió la plataforma de generación de imágenes Leonardo.Ai con planes de integrarla en Magic Studio.
Walmart
- Walmart ha estado construyendo herramientas de IA orientadas al cliente desde 2018, y en junio de 2024 cambió a modelos propios para todas sus funciones de IA generativa.
  - En octubre de 2024, Walmart presentó Wallaby, un LLM especializado en retail. Este modelo fue entrenado con datos de Walmart para generar respuestas naturales relacionadas con atención al cliente.
- Walmart está usando IA para mejorar chatbots de soporte al cliente, organización de catálogos de productos y experiencias de compra con realidad aumentada. Además, también ofrece experiencias de compra virtual en plataformas en línea como Roblox.
- Walmart prefiere los modelos propios, pero aún planea usar modelos de terceros según el caso de uso específico.

Capa 2: uso de modelos existentes de código cerrado

En lugar de construir un modelo de manera independiente, las empresas pueden desarrollar sus propias soluciones accediendo por API a modelos de IA de código cerrado de OpenAI, Anthropic y otras compañías.
Los modelos de código cerrado pueden ofrecer resultados precisos en distintos campos, por lo que son útiles para tareas generales como transcripción, atención al cliente y extracción de datos.
- Los modelos GPT de OpenAI y Claude de Anthropic ofrecen resultados de muy alta calidad.
Gracias a la facilidad de acceso por API, se consideran una de las formas más sencillas de adoptar IA desde el punto de vista de ingeniería.
Recientemente también se han lanzado modelos pequeños como GPT-4o mini para ofrecer eficiencia en costos y rendimiento de inferencia rápido.
Zapier
- Zapier es una plataforma de automatización de flujos de trabajo, fundada en 2011 y valorada en $5B en agosto de 2023.
- Usa modelos de OpenAI para mejorar procesos internos de automatización, por ejemplo funciones de generación y resumen de transcripciones de reuniones y de resumen de artículos web.
- La herramienta Copilot de Zapier permite crear flujos de trabajo usando prompts en lenguaje natural.
Klarna
- Klarna es una empresa fintech sueca que ofrece servicios de “Buy Now, Pay Later”, y en septiembre de 2024 anunció que reemplazaría con IA a Salesforce y Workday.
- Mediante un asistente de IA de atención al cliente basado en modelos de OpenAI, gestiona 2/3 de las solicitudes de soporte y reemplaza una carga de trabajo equivalente a 700 empleados de tiempo completo.
- Internamente, usa el asistente de IA Kiki para ayudar a sus empleados a responder más de 2 mil preguntas al día.
Ramp
- Ramp es una startup fintech B2B fundada en 2019, que ofrece diversos productos de software financiero.
- Usa los modelos GPT-4 y Claude para automatizar análisis de datos de contratos, clasificación de transacciones y redacción de notas de recibos.
- Internamente, también usa IA para ofrecer funciones de resumen de llamadas con clientes y preguntas y respuestas, integradas con Slack.
Atlassian
- Atlassian es una empresa valorada en $50B que ofrece software de colaboración para equipos como Jira, Trello y Confluence.
- En abril de 2023 anunció una función de IA generativa llamada Atlassian Intelligence.
- Esta función combina modelos de OpenAI con modelos propios de Atlassian.
- El asistente de IA Rovo potencia las funciones de búsqueda de Jira y automatiza la generación de contenido de marketing y la recopilación de feedback mediante agentes no-code.
Canva
- Canva usa modelos propietarios en Magic Studio, pero también utiliza modelos de código cerrado para algunas funciones.
  - Ejemplo: el editor de escritura con modelos de OpenAI genera contenido ajustando el tono a las muestras cargadas.
- Canva también opera un diverso marketplace de apps de IA, que incluye apps como DALL-E de OpenAI e Imagen de Google.

Capa 3: Desarrollo basado en modelos de código abierto

En lugar de crear modelos de forma independiente o usar modelos de código cerrado como GPT-4o de OpenAI, muchas empresas están construyendo sus propias herramientas aprovechando modelos de código abierto de Meta, Mistral, Hugging Face y otros.
Los modelos de código abierto ofrecen ventajas como alta personalización y transparencia, mayor privacidad de los datos y reducción de costos.
- Según un informe de Databricks de 2024, el 76% de las empresas que usan LLM eligen código abierto.
Los modelos de código abierto no tienen costos de licencia por separado y pueden alojarse por cuenta propia, lo que permite evitar grandes costos de nube.
Para los clientes empresariales, también es un factor importante la menor exposición a problemas de derechos de autor y al riesgo de filtración de datos.
VMware
- VMware es un proveedor de software de virtualización que fue adquirido por Broadcom en 2023 por $69B.
- VMware colaboró con Hugging Face para desarrollar un asistente de programación de código abierto llamado SafeCoder.
- Usó un modelo de 15.5B parámetros llamado StarCoder, que recopila datos de proyectos de código abierto para minimizar problemas de derechos de autor.
- Los clientes empresariales pueden ajustar finamente el modelo StarCoder con su propio código, lo que ayuda en tareas internas que requieren conocimiento de dominio.
Mathpresso
- Mathpresso es una empresa surcoreana de edtech que, a través de su aplicación principal QANDA, permite a los estudiantes subir capturas de pantalla de problemas de matemáticas y recibir soluciones automáticas.
- En 2023, desarrolló MathGPT, un LLM especializado en matemáticas, usando el modelo Llama 2 de Meta.
- MathGPT utilizó como datos de entrenamiento las soluciones matemáticas de QANDA, y ofreció mayor personalización y precisión adaptada al entorno educativo que los modelos comerciales existentes.
- MathGPT superó a Microsoft Tora en los benchmarks MATH y GSM8K, y ocupó el primer lugar entre los modelos de 13B parámetros o menos.
Brave
- Brave es un navegador web centrado en la privacidad que ofrece funciones como bloqueo de anuncios y de rastreadores.
- En agosto de 2023, lanzó un asistente de IA llamado Leo, usando los modelos de código abierto Llama 2 de Meta y Mixtral 8x7B de Mistral.
- Brave no almacena datos de los usuarios y usa modelos alojados por cuenta propia para proteger la privacidad de los usuarios.
- También es compatible con el modelo Claude de Anthropic, pero la configuración predeterminada está basada en modelos de código abierto.
Replit
- Además de su modelo personalizado de autocompletado de código, en abril de 2024 Replit lanzó el agente de IA Code Repair tras ajustar finamente un modelo de 7B parámetros de Hugging Face.
- Los usuarios de pago pueden alternar entre el modelo de código abierto de Replit y otros modelos de código cerrado, ofreciendo soluciones adaptadas a distintas necesidades de los clientes.

Capa 4: Uso de herramientas de IA preconstruidas

Se trata de casos en los que las empresas no construyen sus propios modelos de IA, sino que compran y usan herramientas de IA generativa ya terminadas.
La principal ventaja de las herramientas externas es la reducción de costos. Comprar una herramienta específica es más barato que entrenar o ajustar finamente un modelo.
Tres razones principales por las que las empresas eligen herramientas externas de IA:
- Cuando necesitan herramientas de investigación de conocimiento general y lluvia de ideas
  - Ejemplo: según una investigación de BCG, las herramientas de IA generativa aumentan la productividad laboral y son especialmente útiles cuando falta experiencia técnica especializada.
- Cuando necesitan herramientas empresariales generales (por ejemplo, chatbots de atención al cliente)
  - Es más rentable obtener beneficios rápidamente usando herramientas de terceros que construir un modelo propio.
- Cuando ya se han desarrollado herramientas específicas adaptadas a una industria
  - Ejemplo: Kira, una herramienta para revisar contratos legales, es utilizada por muchos bufetes de abogados.
Boston Consulting Group (BCG)
- BCG es una firma global de consultoría con 32K empleados en todo el mundo e ingresos de $12.3B.
- En 2023, BCG realizó experimentos internos con ChatGPT de OpenAI y observó que la IA generativa mostró una mejora del 40% en el rendimiento en tareas creativas.
- Por ejemplo, mejoró el desempeño en la resolución creativa de problemas, como generar ideas para nuevos productos de calzado y redactar eslóganes de marketing.
- En 2024, BCG implementó ChatGPT Enterprise para todos sus empleados, reconociendo la alta utilidad de las herramientas de IA.
Dollar Shave Club
- Dollar Shave Club es un proveedor de productos de afeitado que fue adquirido por Unilever por $1B y después vendido a Nexus Capital Management.
- En lugar de un chatbot propio, automatizó la atención al cliente con Answer Bot de Zendesk.
  - Answer Bot fue entrenado con datos de 12M interacciones con clientes y responde preguntas simples de clientes en cuestión de segundos.
- Resuelve 4.5K tickets al mes, lo que representa el 10% del volumen total de tickets de la empresa.
Law Firms (bufetes de abogados)
- La revisión de contratos legales está llena de términos y cláusulas complejas.
- Muchos bufetes no tienen los recursos para desarrollar herramientas internas de IA, por lo que recurren a herramientas externas de IA como Kira.
  - Ejemplo: grandes firmas legales como Skadden, Hogan Lovells y Paul, Weiss usan Kira para reducir el tiempo de revisión de contratos en hasta un 60%.
- Kira puede analizar rápidamente más de 1K cláusulas y puntos de datos comunes, por lo que se utiliza en due diligence de M&A, revisión de contratos de préstamo y más.

Tres formas en que las empresas de la Long Tail usan la IA

Las empresas que pertenecen al Long Tail están aplicando la IA generativa de diversas maneras, como Bloomberg, que desarrolla herramientas personalizadas para profesionales de finanzas, y los consultores de BCG, que usan ChatGPT como herramienta de productividad.
Los modelos que impulsan estas herramientas también son diversos, desde el modelo de generación de imágenes de Canva hasta el modelo integrado con GPT de Ramp.
Al observar los patrones de las empresas que aplican IA, destacan las siguientes tres tendencias principales, a pesar del ritmo actual de avance tecnológico.
- Usar la IA como herramienta para complementar el negocio existente
  - La mayoría de las empresas del Long Tail ya ofrecen productos y servicios bien establecidos, y la IA cumple el papel de complementarlos y mejorarlos.
    - Ejemplo: Replit ya había tenido éxito antes de lanzar herramientas de IA, y la IA se usa para mejorar el producto como una extensión de sus herramientas existentes para desarrolladores.
    - Leo AI de Brave es una herramienta de IA generativa que amplía la política del navegador de priorizar la privacidad. Brave ha trabajado durante 8 años en la protección de la privacidad, y Leo es una herramienta que continúa ese principio.
    - En Walmart, los precios bajos y una política de devoluciones flexible son lo esencial, y la IA solo cumple un papel de apoyo, sin reemplazar la estrategia central.
  - En conclusión, las empresas adoptan IA internamente para aumentar la eficiencia de sus procesos, pero la experiencia central del usuario sigue siendo la prioridad.
- Copiar las estrategias de IA del mismo sector
  - Las empresas adoptan rápidamente estrategias de IA exitosas para mantener su competitividad.
    - Ejemplo: BCG utilizó ChatGPT para mejorar de forma significativa el desempeño en tareas creativas y de programación. Es probable que estos resultados presionen a otras consultoras como McKinsey y Bain a adoptar herramientas de IA similares.
    - Brave y VMware ofrecen productos centrales diferentes, pero ambos priorizan la privacidad de los datos, por lo que eligen modelos de código abierto.
  - Si las empresas líderes logran una ventaja competitiva sostenida mediante la adopción de IA, se espera que otras también deban adoptar estrategias similares.
- Mantener una estrategia de IA flexible
  - La forma de usar la IA no es fija, y las empresas pueden aplicar o ajustar distintas estrategias.
  - Ejemplo: OpenAI al principio construyó modelos cada vez más grandes, pero en 2024 lanzó modelos pequeños y eficientes como GPT-4o mini. Esto ofrece reducción de costos y mayor velocidad de inferencia.
  - El CTO de Ramp mencionó que GPT-4o mini cumple con el 90% de los requisitos, y evaluó que un modelo pequeño puede ser más eficiente que uno grande.
    - Tuhin Srivastava, CEO de Baseten, señaló que las empresas tienden a querer construir sus propios modelos, pero eso puede consumir demasiados recursos y tiempo.
    - Consejo de Srivastava: "primero usar herramientas probadas y luego reemplazarlas gradualmente con modelos propios".
    - Las empresas deben estar en una posición que les permita responder con flexibilidad cuando aparezcan nuevas tecnologías de IA, para poder aprovechar rápidamente las mejoras tecnológicas.

Objetivo final de las empresas del Long Tail

Aunque el interés y el entusiasmo actuales por la IA se concentran en los modelos y en las empresas nativas de IA, los casos de uso de IA también se están volviendo cada vez más notorios entre las empresas no nativas de IA.
- Estas empresas están adoptando diversas soluciones de IA, desde chatbots de atención al cliente hasta experiencias de compra con realidad aumentada.
  - Dada la velocidad de la innovación en IA, la forma más sencilla de entender cómo usan la IA las empresas del Long Tail es clasificarlas en las cuatro capas presentadas en este análisis profundo:
    - modelos personalizados, modelos de código cerrado, modelos de código abierto y herramientas de IA de terceros
Los diversos ejemplos tratados en este análisis profundo muestran cómo las empresas han construido y adoptado distintas herramientas de IA, lo que ayuda a los lectores a entender cómo abordar la integración de IA en sus propias organizaciones.
- Las cuatro capas presentan trade-offs relacionados con tiempo de aprendizaje, costo, personalización, privacidad y calidad, pero como el costo de cambiar entre modelos es bajo, los clientes pueden tener la flexibilidad de experimentar con distintas soluciones.
El objetivo final de las empresas del Long Tail no es convertirse en empresas de IA, sino usar herramientas de IA para complementar y acelerar su negocio principal.