Vaya, si es un proyecto de una sola persona, parece muy bueno para echar un vistazo a qué hiciste todo ese tiempo cuando lo terminas. Como si lo escribiste tú, aunque pase rapidísimo, más o menos te va a hacer pensar: “Ah, ¿qué estaba haciendo en ese momento?”. Está interesante.

 

Creo que era Gource in Bloom; me parece impresionante, pero también algo gracioso, cómo al principio y a mitad del video de presentación anda por ahí solo mordisqueando, apareciendo, probando y disfrutando el árbol por todos lados jajajaja

 
roxie 2025-12-01 | comentario padre | en: Advent of Code 2025 (adventofcode.com)

Yo también participé un poco el año pasado... de verdad que el año se pasa volando :(

 

Vaya, en un avión tan grande, reemplazar el hardware solo toma de 3 a 4 horas. Me sorprende lo bien modularizado que parece estar...

 

Parece que en Corea el problema no es muy grande.

  • Según el Ministerio de Tierra, Infraestructura y Transporte y la industria aeronáutica, entre las aerolíneas nacionales que operan aviones de pasajeros de la familia A320 están Korean Air (18 aeronaves), Asiana Airlines (24), Air Busan (21), Air Seoul (6), Aero K (9) y Parata Air (2), un total de 6 compañías
  • De ellas, 42 aeronaves están sujetas a este retiro, y entre estas no hay modelos antiguos que requieran incluso el reemplazo de hardware, un trabajo que toma entre 3 y 4 horas
  • Según el ministerio, en todos los aviones de pasajeros afectados las medidas necesarias pueden completarse en menos de 1 hora mediante una actualización de software desde la cabina, y al 30/11 a las 6:00, 40 de las 42 aeronaves (95%) ya habían completado la actualización
 

Estoy intentando dejar Windows en serio, así que esta vez compré una UMPC y estoy probando Bazzite; estoy muy satisfecho. La parte de la entrada de texto en coreano fue un poco complicada en KDE, así que me pasé al entorno GNOME, y se parece a Mac, lo cual me gusta mucho. GPT ayuda bastante.

 
aer0700 2025-11-30 | comentario padre | en: ¿Quieres construir un RAG local? (blog.yakkomajuri.com)

Sea una base de datos vectorial o lo que sea, en realidad solo habría que implementar la búsqueda...

 

Sería ideal que un sistema estuviera diseñado con suficiente holgura y flexibilidad para poder ofrecer buena calidad. Y sin duda, en promedio hoy es más así que en épocas en las que la ingeniería organizacional y las metodologías de desarrollo estaban menos avanzadas que ahora.

Aun así, a mis ojos suena como si alguien con un ego inflado como ingeniero, pero con poco sentido de responsabilidad como miembro de una organización, estuviera poniendo excusas diciendo que nada de esto es culpa suya sino de la gerencia.

¿Acaso los arquitectos, los diseñadores industriales y los animadores no tienen fechas de entrega y son evaluados solo por creatividad y calidad en vez de productividad, y únicamente los programadores sí tienen plazos?

 

Por experiencia, si tienes bases sólidas de CS, especialmente de PLT, al final escribes código relativamente mejor en cualquier entorno.

Aunque no tengas conocimientos extraordinarios, si al menos entiendes los principios más básicos, cuando tienes suficiente tiempo y trabajas con código que te resulta familiar, sale una calidad de código bastante decente. Si haces refactoring n veces, hasta si lo escribió una IA termina viéndose razonablemente bien.

Por más tiempo que alguien pase aferrado a un mismo código fuente, también hay muchas personas que dicen tener 20 años de experiencia pero no saben hacer más que producir espagueti, y ni siquiera entienden por qué no debería hacerse así.

A menos que te den un entorno perfecto con tiempo y presupuesto infinitos, me parece un contenido vacío que no tiene demasiado sentido. ¿No es esto igual en cualquier época y en cualquier trabajo?

Escribir mejor código dentro del mismo sistema claramente sí es una capacidad del ingeniero.

 

Los textos que se publican aquí pueden corresponder a un entorno algo distinto de ciertas perspectivas o experiencias del mercado local de SI, donde a menudo incluso se ignora el OCP.

En cualquier caso, Linus Torvalds no es un junior...

 
dkmin 2025-11-30 | comentario padre | en: ¿Quieres construir un RAG local? (blog.yakkomajuri.com)

Gemini: Sí, el uso de una base de datos vectorial (Vector Database) en RAG (Retrieval-Augmented Generation) tiene su base conceptual desde que se publicó por primera vez el artículo relacionado en 2020.
RAG combina básicamente recuperación (Retrieval) y generación (Generation), y en esa etapa de recuperación los embeddings vectoriales y una base de datos vectorial que los almacene y los busque de forma eficiente cumplen un papel esencial.
💡 Punto de partida de RAG y las bases de datos vectoriales
La idea de que RAG necesita una base de datos vectorial parte de los siguientes artículos y conceptos clave.

  1. Nacimiento de RAG: artículo de Lewis et al. (2020)
  • Título del artículo: "Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks" (generación aumentada con recuperación para tareas de procesamiento de lenguaje natural intensivas en conocimiento)
  • Punto clave: este artículo fue el primero en presentar el término y el framework de RAG.
  • Rol del Retriever: el modelo RAG propuesto en el artículo está compuesto por un Retriever y un Generator. El Retriever busca documentos (latent documents) relacionados con la consulta en datasets de gran escala como Wikipedia.
  • Uso de índice vectorial: este modelo RAG inicial utilizó un índice vectorial (Vector Index) sobre el dataset para recuperar documentos, de modo que un pretrained retriever pudiera obtenerlos.
  • Conclusión: como la etapa central de "recuperación" en RAG se basa en calcular similitud a partir de representaciones vectoriales de la consulta y los documentos, el concepto de un almacén vectorial (Vector Store) o un índice vectorial quedó implícitamente incorporado como algo esencial para una búsqueda eficiente.
  1. Embeddings vectoriales y búsqueda por similitud
    La razón fundamental por la que una base de datos vectorial se volvió un componente esencial de RAG es la siguiente.
  • Embedding: en un sistema RAG, tanto el conocimiento externo (documentos, texto) como la consulta del usuario (pregunta) se convierten en una representación matemática llamada vector. Ese vector expresa el significado del texto como un arreglo denso de números en un espacio de alta dimensión.
  • Búsqueda por similitud (Similarity Search): encontrar los vectores de documentos más cercanos al vector de consulta dentro del espacio vectorial significa encontrar los documentos semánticamente más similares o relevantes.
  • Rol de la base de datos vectorial: una base de datos vectorial es una base de datos especializada en almacenar una gran cantidad de estos vectores de documentos y en buscar de forma rápida y eficiente los vectores más similares para un vector de consulta dado. Por eso es indispensable para maximizar el rendimiento de recuperación en RAG.
    Resumen: por qué se necesita una base de datos vectorial
    Para que un LLM pueda acceder a conocimiento reciente o específico de un dominio que no aprendió durante su entrenamiento, es necesario encontrar información con base en similitud semántica, no simplemente mediante keyword matching (búsqueda tradicional). La base de datos vectorial es la tecnología clave que se integró de forma natural al framework RAG para ejecutar eficientemente esa búsqueda basada en similitud semántica.
 

Qué montón de tonterías hay por ahí... eso de código malo o código bueno es cosa de juniors que andan hablando; lo más importante es si hay o no seniors que sepan hacer bien el diseño de software adecuado para ese sector...

 

La publicidad es solo el comienzo y ofrecerá una experiencia de usuario que lleve a comprar productos y servicios. Quién sabe, tal vez hasta ofrezcan Worldcoin.