- Google cree en crear una IA útil para todas las personas y ha contribuido con innovaciones a la comunidad abierta, como Transformers, TensorFlow, BERT, T5, JAX, AlphaFold y AlphaCode
- Gemma es una familia de modelos abiertos, ligeros y de última generación, construidos a partir de la misma investigación y tecnología utilizadas para crear los modelos Gemini
- Fue desarrollada por Google DeepMind y otros equipos, e inspirada en "gemma", que en latín significa "joya"
- Desde hoy está disponible globalmente, junto con pesos del modelo, herramientas para impulsar la innovación de los desarrolladores, fomentar la colaboración y orientar el uso responsable de los modelos Gemma
- Al compartir componentes tecnológicos y de infraestructura con Gemini, Gemma 2B y 7B logran el mejor rendimiento en relación con su tamaño en comparación con otros modelos abiertos
- Puede ejecutarse directamente en la laptop o computadora de escritorio de los desarrolladores, y supera a modelos mucho más grandes en benchmarks clave, al mismo tiempo que cumple estándares estrictos para ofrecer resultados seguros y responsables
- A través de Native Keras 3.0, ofrece toolchains para inferencia y SFT (ajuste fino supervisado) en todos los frameworks principales, incluidos JAX, PyTorch y TensorFlow
- Es fácil comenzar con Gemma gracias a la integración con notebooks de Colab y Kaggle, y con herramientas populares como Hugging Face, MaxText, NVIDIA NeMo y TensorRT-LLM
- Los modelos Gemma preentrenados y ajustados con instrucciones pueden desplegarse fácilmente en Vertex AI y Google Kubernetes Engine (GKE) para ejecutarse en notebooks, estaciones de trabajo o Google Cloud
- Garantiza rendimiento líder en la industria mediante optimizaciones para múltiples plataformas de hardware de IA, incluidas las GPU de NVIDIA y las TPU de Google Cloud
- Permite uso comercial y distribución para organizaciones de cualquier tamaño, de acuerdo con los términos de uso
Diseñado para ser responsable
- Gemma fue diseñado poniendo los principios de IA como prioridad, y utiliza técnicas automatizadas para filtrar información personal y otros datos sensibles del conjunto de entrenamiento
- Además, usa ampliamente aprendizaje por refuerzo a partir de retroalimentación humana (RLHF) en los modelos ajustados con instrucciones para alinearlos con un comportamiento responsable
- Para comprender y reducir el perfil de riesgo de los modelos Gemma, se realizaron evaluaciones sólidas, como red teaming manual, pruebas adversariales automatizadas y evaluación de la capacidad del modelo para actividades peligrosas
Optimizado en frameworks, herramientas y hardware
- Los modelos Gemma pueden ajustarse con datos propios para adaptarse a requisitos específicos de aplicaciones, y admiten diversas herramientas y sistemas
- Herramientas multi-framework: se puede usar el framework preferido, como Keras 3.0, PyTorch nativo, JAX y Hugging Face Transformers. Se proporcionan implementaciones de referencia
- Compatibilidad entre dispositivos: puede ejecutarse en dispositivos populares, incluidas laptops, desktops, IoT, móviles y la nube
- Plataformas de hardware de última generación: mediante una alianza con NVIDIA, las optimizaciones para GPU de NVIDIA —desde centros de datos hasta la nube y PCs locales con RTX AI— garantizan rendimiento líder en la industria e integración con tecnología de punta
- Optimizado en Google Cloud: con Vertex AI ofrece un amplio conjunto de herramientas MLOps y varias opciones de ajuste, además de despliegue con un clic usando optimizaciones de inferencia integradas
Créditos gratuitos para investigación y desarrollo
- Gemma fue construido para la comunidad de desarrolladores e investigadores que impulsa la innovación en IA, y desde hoy se puede empezar a trabajar con acceso gratuito en Kaggle, el nivel gratuito de notebooks de Colab y $300 en créditos para quienes usan Google Cloud por primera vez
- Los investigadores pueden solicitar hasta $500,000 en créditos de Google Cloud para acelerar sus proyectos
2 comentarios
Ahora resulta que la única IA abierta es la que está cerrada.
Opiniones de Hacker News
feedforward hidden sizees 16 vecesd_model, a diferencia de la mayoría de los modelos donde es 4 veces.