Leanstral 1.5
(docs.mistral.ai)- Leanstral 1.5 es un modelo actualizado, orientado a la ingeniería de pruebas formales con Lean 4, enfocado en la demostración automática de teoremas y la formalización automática
- La escala del modelo se compone de 119B parámetros totales y 6.5B parámetros activos, asumiendo el manejo de contextos largos de pruebas y documentos
- El identificador disponible es
labs-leanstral-1-5, y en la documentación aparece como modelo Labs v1.5 - La longitud de contexto es de 256k, y el precio figura como $0, destacando su accesibilidad para experimentación y evaluación
- Puede usarse junto con las API de Chat Completions, llamadas a funciones, agentes, salidas estructuradas, OCR, Document QnA, FIM, embeddings, moderación, audio y procesamiento por lotes
Modelo orientado a pruebas formales con Lean 4
- Leanstral 1.5 es una versión actualizada del modelo de ingeniería de pruebas formales para Lean 4
- Sus optimizaciones principales apuntan a la demostración automática de teoremas y la formalización automática
- El identificador del modelo se ofrece como
labs-leanstral-1-5
Escala del modelo y propiedades básicas
- La configuración de parámetros se muestra como 119B total parameters, 6.5B active
- La longitud de contexto es de 256k
- El precio figura como $0
- La clasificación de lanzamiento es Labs v1.5
API de conversación, agentes y salidas estructuradas
- Chat Completions:
/v1/chat/completions - Function Calling:
/v1/chat/completions,/v1/conversations - Agents & Conversations:
/v1/agents,/v1/conversations - Built-In Tools:
/v1/agents,/v1/conversations - Structured Outputs:
/v1/chat/completions,/v1/conversations - Predicted Outputs:
/v1/chat/completions,/v1/conversations - Prefix:
/v1/chat/completions,/v1/conversations
Procesamiento de documentos, completado de código y embeddings
- OCR:
/v1/ocr - Annotations - Structured:
/v1/ocr - BBox Extraction:
/v1/ocr - Document QnA:
/v1/chat/completions,/v1/conversations - FIM:
/v1/fim/completions - Embeddings:
/v1/embeddings
Seguridad, audio y procesamiento por lotes
- Moderations:
/v1/moderations - Chat Moderations:
/v1/chat/moderations - Transcriptions:
/v1/audio/transcriptions - Text to Speech:
/v1/audio/speech - Timestamps:
/v1/audio/transcriptions - Batching:
/v1/batch
1 comentarios
Opiniones de Hacker News
Me dio curiosidad, me registré, puse dinero en la cuenta y cuando intenté usarlo, no funcionó. Como decía que era un modelo de Labs, intenté activar Labs, pero esta vez me salió un error desconocido. Quise contactar a soporte como indicaban, pero no había soporte, solo una FAQ hecha a la rápida.
La FAQ parecía vibe-coded y la búsqueda era pésima: sin importar qué consulta pusiera, solo devolvía respuestas totalmente irrelevantes. Entonces caí en cuenta: si la IA es buena para atención al cliente, ¿por qué las empresas de IA no ofrecen soporte al cliente con su propia IA?
[1]: https://news.ycombinator.com/item?id=43683012
Para una empresa a la que le molesta tener que gastar dinero en arreglar problemas reales, eso cuenta como “buen” soporte al cliente.
En el último año, esta es la cuarta respuesta automática de vacaciones que recibo de esta persona.
La muestra es de solo dos casos, pero me hace asumir que a las empresas francesas no les gusta mucho que las contacten en inglés.
Es un tema un poco distinto, pero es bastante triste que la UE no tenga nada en el mercado de LLM realmente de frontera. Sobre todo considerando que hace poco EE. UU. restringió por completo el acceso a los modelos verdaderamente de frontera.
¿Será solo por falta de financiamiento e infraestructura?
Más que mirar cuánto puede aportar toda la economía de la UE a los modelos de frontera, es más preciso mirar cuánto puede aportar la economía francesa y compararla con EE. UU. o China. No da la escala. En cambio, conviene mirar qué logra con esa escala menor, y productos de nicho como Leanstral y Voxtral son resultado de eso.
Francia y Alemania son las economías más grandes de la UE; Francia tiene a Mistral, y Alemania tiene una institución con carácter de venture capital respaldado por el gobierno. Esa institución se muestra muy orgullosa de poner nada menos que 125 millones de euros (<150 millones de dólares) para ayudar a investigadores europeos a lograr un nuevo estado del arte en modelos soberanos[1].
Ese dinero ni siquiera va a un único ganador, sino que se reparte entre varios beneficiarios. Como primer paso está bien, pero, para ser exactos, habría sido un primer paso aceptable hace 3 o 4 años. Una verdadera lástima.
[1] (en alemán) https://www.sprind.org/worte/magazin/verkuendung-next-fronti...
Vivimos en una economía colonial donde el capital humano es la materia prima, y todo fluye hacia EE. UU. Para evitarlo, hay que dejar de jugar el juego actual y, como China, desarrollar industrias competitivas con una política industrial en serio. En las últimas décadas no hubo voluntad para eso, pero Trump está mostrando con mucha claridad el regreso del Estado, y Europa lo está reconociendo lentamente.
Lo difícil es justificar financieramente el desarrollo puro de LLM. Los modelos son muy parecidos entre sí. OpenAI se justificó al principio como una “organización benéfica” dedicada a la investigación pura, y Anthropic se separó diciendo que OpenAI no se preocupaba lo suficiente por la seguridad. Elon dijo que, si él no creaba Grok, la IA fingiría estar despierta y no sería veraz; y Google creó Gemini porque originalmente ellos fueron el punto de partida y la investigación en IA era una misión central que Larry y Sergey le dieron a la empresa al fundarla. Aunque, por razones financieras, la dejaron en pausa durante un tiempo.
La motivación de los modelos chinos, sinceramente, no está clara. No he visto una buena explicación, solo hipótesis. Pero viendo que los liberan gratis o los ofrecen a precios demasiado bajos, tampoco parece que su motivación sea financiera.
En cambio, Mistral es una empresa normal. No tiene un patrocinador rico que crea en una narrativa de destino cósmico y meta dinero a raudales, así que tiene que justificar lo que hace por retorno de inversión. Eso prácticamente descarta entrenar LLM a gran escala.
También hay que considerar la regulación de la UE. Cuando lo revisé hace un tiempo, había muchas reglas extrañas que eliminaban las posibilidades de la industria tecnológica europea. En Reino Unido incluso había una norma que permitía rastrear la web solo con fines de investigación.
https://knowledgerights21.org/news-story/the-uks-copyright-l...
Y sin la Primera Enmienda, el riesgo de ser procesado por algo que dijo un modelo es mucho mayor. Basta ver el caso en que Alemania llevó a Google a los tribunales por contenido que el modelo había incluido en una página de resultados de búsqueda.
Así que las ganancias son inciertas y el riesgo legal es muy alto.
¿Sería posible levantar 100.000 millones de dólares para un nuevo laboratorio en Europa? Si no, se acabó, y mejor rendirse.
Qué casualidad. Esta mañana acabo de lanzar OpenATP. OpenATP es un paquete de Python open source y una CLI para demostradores automáticos de teoremas de tipo agente.
También incluye soporte para Leanstral mediante el harness Vibe de Mistral. El modelo Leanstral de producción anterior se retiró el 22 de mayo, y voy a actualizar el paquete lo antes posible para que apunte a Leanstral 1.5.
GitHub: https://github.com/henryrobbins/open-atp
Docs: https://open-atp.henryrobbins.com
¿Es un 404?
https://web.archive.org/web/20260630223430/https://docs.mist...
No entiendo bien la política de pesos. Este sitio dice que los pesos tienen licencia Apache, así que parecen pesos abiertos, pero no encuentro un enlace de descarga.
El perfil de Hugging Face parece ofrecer solo snapshots anteriores[0]. ¿Alguien sabe si se pueden descargar los pesos y, de ser así, de dónde?
[0] https://huggingface.co/mistralai/Leanstral-2603
A mí también me aparece “Page not found”. ¿Lograste acceder? ¿De qué trata?
Es un modelo actualizado de ingeniería de pruebas formales Lean 4, optimizado para demostración automática de teoremas y formalización automática. 119B parámetros en total, 6.5B activos.
https://web.archive.org/web/20260630223430/https://docs.mist...
Discusión sobre Leanstral 1: https://news.ycombinator.com/item?id=47404796
Lean 4 e Idris 2 están subvalorados y, como ofrecen garantías adicionales, tienen muchas posibilidades de ser excelentes para que los LLM programen.
Ahora mismo da 404.
Me registré por esta noticia, pero para usar “Code”, ¿hay que hacer una conexión con GitHub? Se ve demasiado restrictivo.