2 puntos por GN⁺ 2023-07-12 | 1 comentarios | Compartir por WhatsApp
  • Posible filtración de detalles de GPT-4
  • La información filtrada sugiere que GPT-4 tendrá funciones avanzadas
  • Se espera que GPT-4 cuente con capacidades mejoradas de procesamiento y comprensión del lenguaje natural
  • Los detalles filtrados también mencionan una mejor comprensión del contexto y capacidades de razonamiento
  • Se rumorea que GPT-4 tendrá un tamaño de modelo más grande, lo que podría contribuir a mejorar el rendimiento
  • La información filtrada despertó interés entre personas con conocimientos técnicos
  • Este artículo analiza el impacto potencial que GPT-4 podría tener en diversas industrias y áreas de aplicación
  • Se desconoce cuándo será lanzado oficialmente GPT-4
  • Los detalles filtrados generaron especulación y expectativa entre ingenieros de software y entusiastas de la tecnología

1 comentarios

 
GN⁺ 2023-07-12
Opiniones de Hacker News
  • La fuente original de los detalles filtrados de GPT-4 es una publicación del blog de semianalysis.com.
  • El usuario de Twitter que compartió los detalles aparentemente reformuló la publicación del blog, lo que provocó que el tuit fuera eliminado.
  • El MoE (Mixture of Experts) usado en GPT-4 es interesante y podría explicar la variación en la calidad de las respuestas.
  • Aunque el modelo de visión de GPT-4 no ha sido publicado, hay expectativas al respecto.
  • El entrenamiento de GPT-4 requirió 21 yottaflops, lo que representa un logro computacional considerable.
  • El costo de entrenamiento de GPT-4 cayó a 1/3 del año pasado, lo que es una buena noticia para el código abierto.
  • Se especula que la calidad de GPT-4 se degradó al aceptar secuencias de baja probabilidad de un modelo de decodificación especulativa.
  • Google está investigando la mezcla de expertos para escalar modelos de lenguaje, y el modelo GLaM tiene 1.7 billones de parámetros y 64 expertos.
  • George Hotz mencionó en una entrevista que GPT-4 tiene 220 mil millones de parámetros y es un modelo de mezcla de 16 componentes con 8 conjuntos de pesos.
  • Hay curiosidad sobre si servicios premium como Thread Reader todavía pueden seguir operando debido al alto precio de la API de Twitter.
  • Algunos usuarios están buscando enlaces alternativos para acceder a los detalles filtrados del entrenamiento de GPT-4 sin registrarse en Twitter.
  • Las únicas personas que realmente saben información verídica sobre cómo funciona GPT-4 son los empleados de OpenAI; el resto tiene que depender de especulaciones.