- Apple anunció una nueva función para iOS y macOS que utiliza un modelo de lenguaje Transformer para ofrecer sugerencias de texto predictivo mientras el usuario escribe
- Sería uno de los primeros modelos basados en Transformer que Apple reconoce públicamente, y se integrará en el sistema operativo
- Una función similar al autocompletado de Gmail, capaz de completar palabras individuales y a veces sugerir dos o más palabras a la vez
- El modelo de texto predictivo fue encontrado en AppleSpell, una aplicación interna de macOS que revisa errores ortográficos y gramaticales mientras el usuario escribe
- El modelo se encuentra en
/System/Library/LinguisticData/RequiredAssets_en.bundle/AssetData/en.lm/unilm.bundle, que incluye varios archivos de modelos Espresso usados durante la escritura
- El vocabulario del modelo de texto predictivo está compuesto por 15,000 tokens, incluidos tokens especiales, abreviaturas y emoticonos
- La estructura del modelo de texto predictivo parece estar basada en GPT-2, e incluye embeddings de tokens, codificación posicional, una serie de bloques decodificadores y una capa de salida
- El modelo de texto predictivo de Apple tiene alrededor de 34 millones de parámetros y 512 unidades ocultas, por lo que es mucho más pequeño que la versión más pequeña de GPT-2
- Gracias a su tamaño reducido, el modelo puede ejecutarse de forma rápida y frecuente sin consumir demasiada batería del dispositivo, mejorando la experiencia del usuario
- Debido a las limitaciones de tamaño del modelo, no parece capaz de escribir oraciones o párrafos completos, pero cuando tiene alta confianza sobre la siguiente palabra o dos, es lo suficientemente bueno como para sugerírselas al usuario
- Para quienes quieran probar directamente la función de texto predictivo, el autor proporcionó un script en GitHub
1 comentarios
Comentarios de Hacker News
unilm.bundlees el nuevo modelo de predicción de texto.UnilmCtrlsugiere alguna dependencia del modelo CTRL de Socher, pero esto no está confirmado. Algunos usuarios dicen que respetarían más a Apple si hubiera estado trabajando en NLP desde hace más tiempo.