En 2024, la comunidad Instruct Korea https://instruct.kr, junto con el lanzamiento del leaderboard LogicKor, se convirtió en una de las comunidades de modelos de lenguaje de código abierto más grandes de Corea, donde alrededor de 700 investigadores comparten voluntariamente sus resultados.
Con motivo del inicio del año 2025, queremos preparar un espacio para compartir las tendencias de investigación y las novedades de los miembros de la comunidad de Discord de Instruct Korea, y para que puedan hacer networking. El tema de este meetup es “Mis ideas y desafíos al investigar modelos de lenguaje”. Esperamos escuchar experiencias de otras personas, compartir también nuestras ideas de investigación y que personas con diferentes opiniones interactúen.
El evento se realizará el 25 de enero de 2025 (sábado), de 14:00 a 18:00.
El lugar es Nonce, cerca de la estación Gangnam (Yeoksam-dong 624-17).
Consultas: https://instruct.kr
Patrocinio del lugar: Nonce Community (https://nonce.community/)
Presentación de expositores Se actualizarán más ponentes.
Go Seok-hyeon (Sionic AI) Go Seok-hyeon contará su experiencia haciendo procesamiento de lenguaje natural con Scala y JVM. En particular, hablará de su experiencia al portar código de deep learning basado en Python a lenguajes JVM para ponerlo en producción.
Kim Jisu (kuotient, Olegeonaijeu): Desarrollo del modelo de Qwen2.5 en coreano Mediante “Desarrollo del modelo de Qwen2.5 en coreano” compartirá un proceso innovador de desarrollo de modelos de lenguaje. En especial, destaca el proceso que logró una mejora de rendimiento de 37.60 en m-ArenaHard. Cubre el pipeline de entrenamiento completo, incluyendo SFT, Merging y Alignment, e introduce también innovaciones técnicas pioneras en Corea, como el reemplazo de capas y la adopción de una estrategia on-policy. También detallará el secreto para registrar el mejor rendimiento entre modelos por debajo de 8B.
Lee Seung-yu (dopeornope, Marker AI): Guidance y quantization en LLM Con el tema “LLM guidance y quantization”, ilumina las últimas tendencias de esta tecnología de LLM de evolución acelerada. Proporciona un análisis perspicaz sobre los conceptos y la dirección de desarrollo de la guidance y la quantization de LLM, áreas que se investigan intensamente últimamente.
Yoo Yong-sang: Reseña de la competencia de modelo de lenguaje financiero de KRX A través de “Reseña de la competencia de modelo de lenguaje financiero de KRX” comparte las buenas prácticas para desarrollar modelos de dominio en campo real. Aborda estrategias de domain adaptation y continual pretraining para mejorar el rendimiento en el benchmark MCQA, así como contenidos profundos sobre safety auditing.
Choi Seon-woong: La historia del proyecto de desarrollo de RAG Comparte la experiencia de campo de un proyecto real de desarrollo de RAG. En especial, revisará con honestidad los problemas detectados durante la ejecución del proyecto y presentará, a partir de ello, las lecciones y la dirección de mejora.
Jang Young-jun (yjoonjang): Modelo de embedding en coreano Con “Modelo de embedding en coreano” y huggingface.co/nlpai-lab, compartirá características de diversos modelos de embedding y los puntos clave durante el proceso de entrenamiento real. Desde la selección del modelo de embedding hasta el entrenamiento, entregará ideas aplicables de inmediato en la práctica.
Jeong Se-min (Sionic AI): Construir un Recsys con Graph RAG - Storm fooding Con el tema “Construir un Recsys con Graph RAG - Storm fooding” compartirá su experiencia en el desarrollo de un sistema de recomendación usando un sistema RAG basado en grafos. Se abordará el proceso completo desde el diseño del sistema hasta la implementación.
Kim Dong-kyu (Jeffrey Kim, AutoRAG): Conseguir 3,000 estrellas en GitHub Con el tema “Conseguir 3,000 estrellas en GitHub” contará la historia de crecimiento del proyecto de código abierto AutoRAG, compartiendo el recorrido desde el inicio del proyecto hasta su exitosa apertura como código abierto y su dirección de desarrollo futuro.
maywell (instruct.kr, Wanot AI) TBD
Aún no hay comentarios.