Olvídate de ChatGPT: por qué los investigadores ahora ejecutan IA pequeña en sus laptops
(nature.com)- Los modelos de inteligencia artificial (IA) generalmente se usan en línea, pero varias herramientas abiertas están cambiando eso
- El bioinformático Chris Thorpe usa modelos de lenguaje grandes (LLM), una herramienta de IA, para convertir
histo.fyi, una base de datos de moléculas del complejo mayor de histocompatibilidad (MHC), proteínas del sistema inmunitario, en resúmenes fáciles de leer - Thorpe ejecuta la IA en su laptop en lugar de usar LLM basados en la web como ChatGPT
Tendencias recientes en los LLM
- Organizaciones están creando versiones de LLM con "pesos abiertos" para que los usuarios puedan descargarlas y ejecutarlas localmente si cuentan con suficiente capacidad de cómputo
- Empresas tecnológicas también están creando versiones reducidas que pueden ejecutarse en hardware de consumo y que rivalizan con el desempeño de modelos grandes anteriores
Por qué los investigadores usan modelos locales
- Reducción de costos
- Protección de la confidencialidad de pacientes o empresas
- Garantía de reproducibilidad
- A medida que las computadoras se vuelven más rápidas y los modelos más eficientes, cada vez más personas ejecutarán IA en laptops o dispositivos móviles
Ejemplos recientes de modelos pequeños de pesos abiertos
- Google DeepMind, Meta y Allen Institute for Artificial Intelligence, entre otros, han publicado modelos con miles de millones de parámetros
- Microsoft publicó modelos de lenguaje pequeños como Phi-1, Phi-1.5, Phi-2, Phi-3 y Phi-3.5; algunos de ellos también pueden procesar imágenes
- Sébastien Bubeck, vicepresidente de IA generativa en Microsoft, explicó que el desempeño de Phi-3 se debe a su conjunto de datos de entrenamiento
Desarrollo de aplicaciones personalizadas
- Los investigadores pueden desarrollar aplicaciones personalizadas a partir de estas herramientas
- Alibaba, de China, construyó un modelo llamado Qwen, y un científico biomédico de New Hampshire lo ajustó finamente con datos científicos para crear Turbcat-72b
Protección de la privacidad
- Otra ventaja de los modelos locales es la protección de la privacidad
- Enviar información personalmente identificable a servicios comerciales puede violar regulaciones de protección de datos
- Cyril Zakka, médico y líder del equipo de salud de Hugging Face, usa modelos locales para generar datos de entrenamiento para otros modelos
- Johnson Thomas, endocrinólogo del sistema de salud Mercy en Springfield, está desarrollando un sistema para transcribir y resumir conversaciones entre médicos y pacientes usando Whisper de OpenAI y Gemma 2 de Google DeepMind, con el fin de proteger la privacidad de los pacientes
- CELLama, desarrollado por la farmacéutica Portrai en Seúl, usa LLM locales para condensar en oraciones resumidas información sobre la expresión génica de células y otras características, y destaca la privacidad como una ventaja clave
Uso de los modelos
- Los investigadores se enfrentan a un panorama de opciones de LLM que cambia rápidamente
- Thorpe actualmente usa Llama en su laptop y dice que los modelos locales tienen la ventaja de la reproducibilidad porque no cambian
- Thorpe está escribiendo código para alinear moléculas MHC basándose en estructuras 3D y usa un modelo de pesos abiertos llamado ProtGPT2 para diseñar nuevas proteínas
- Sin embargo, a veces una app local puede no ser suficiente, y Thorpe usa GitHub Copilot, basado en la nube, para programar
Cómo acceder
- Es posible ejecutar LLM localmente usando software como Ollama, GPT4All y Llamafile
- Dependiendo de las preferencias del usuario, se puede elegir entre una app o la línea de comandos
- Stephen Hood, de Mozilla, dice que pronto los LLM locales serán lo suficientemente buenos para la mayoría de las aplicaciones
Opinión de GN+
- Los LLM locales pueden ser una herramienta muy útil para los investigadores, por ventajas como la reducción de costos, la protección de la privacidad y la garantía de reproducibilidad
- Sin embargo, a veces los servicios basados en la nube pueden ofrecer mejor desempeño, por lo que los investigadores deben elegir la herramienta adecuada según los requisitos de su aplicación
- Como el desarrollo de los LLM locales avanza rápidamente, los investigadores necesitan seguir explorando y probando nuevos modelos y herramientas
- También vale la pena considerar el desarrollo de modelos personalizados según el área de investigación. Por ejemplo, un investigador biomédico podría ajustar finamente un modelo con datos médicos para obtener mejor desempeño
- Como los LLM locales aún están en una etapa temprana, los investigadores deben ser conscientes de los problemas y limitaciones que pueden surgir al usarlos. Por ejemplo, es necesario prestar atención a sesgos del modelo, calidad de los datos y consideraciones éticas
7 comentarios
Por ahora, sigue siendo algo caliente, lento e impreciso. Para ser de Nature, la calidad del artículo es baja.
¿No es lento y menos preciso cuando se ejecuta en el edge?,
En realidad, salvo en dominios donde la latencia y la privacidad son un problema, no hay razón para usar edge computing (local)..
Ya casi todos los datos del mundo se procesan en AWS y Google, así que venir a hablar de privacidad a estas alturas no es más que una táctica de marketing de empresas que no tienen la tecnología para crear LLMs..
Aunque en el título del artículo de Nature aparece
small, en la mayor parte del contenido la clave eslocal.Cada vez nos dicen que nos olvidemos de ChatGPT...
jajaja
Comentarios de Hacker News
Recomendación de usar modelos locales
Experiencia usando LLM locales
AMD Strix Halo APU
Problemas de licencia de Llama 3.1
Uso de Docker y Ollama
Rendimiento de los LLM locales
Experimento con LLM locales
Productos basados en LLM de grandes empresas
Datos de entrenamiento de LLM
Recomendación de especificaciones para ejecutar modelos pequeños