En mi empresa probé operar Gemma4-31B con 2 H100, y
La calidad de las respuestas es bastante decente y maneja bien el coreano.
También decide bien cuándo ejecutar herramientas y organiza bien los resultados después de ejecutarlas.
Pero, al fin y al cabo, lo sorprendente es considerando que solo tiene 31B parámetros, y por supuesto es cierto que, al compararlo con modelos con más parámetros (por ejemplo, MiniMax-M2.5), queda por debajo en la calidad general de las respuestas y otros aspectos.
En general, si quieren algo pequeño y ágil, creo que Gemma4 es más que suficiente. Yo cambié de GPT-OSS-120B → Qwen3.5-35B-A3B y ahora me terminé quedando con Gemma4-31B, y me dejó bastante satisfecho. Creo que lo voy a seguir usando.
Hace poco, mientras probaba varias cosas para que sonara MBC Radio en Google Nest, terminé usando Cloudflare Tunnel.
Es un servicio tan bueno que te hace preguntarte por qué es gratis.
Viendo el gasto de Apple, no parece que se vaya a quedar quieta. También es una empresa bien posicionada para lograr la IA física... Al final, Nvidia también está yendo hacia lo físico... Lo impresionante es Google, que lo tiene todo.
Primero les doy mi recomendación, y entiendo que no siempre hay alternativa, pero en cuanto lo instalé me pidió la contraseña sin rodeos, así que por ahora... lo dejé 😅
Yo también uso un túnel en la nube y la verdad es que está muy bien.
Normalmente, cuando hay un router físico, muchas veces la IP externa la tiene el router.
Usando Cloudflare Tunnel, incluso una IP interna
puede quedar disponible para conexión externa mediante el registro de un dominio~
Antes: bloqueaban los reclamos de los clientes con incomodidades intencionales
Ahora: eliminan esas incomodidades para ejercer activamente sus derechos
Más bien, creo que la idea es que los datos de personalización terminarán siendo un foso importante en la próxima era de la IA, y como Apple ya los tiene, quedaría en una posición ventajosa.
Parece que también podría surgir una forma de planear mediciones de velocidad al mismo tiempo en el mismo edificio o vecindario y bajar intencionalmente la velocidad de forma momentánea.
Ah, ¿o quizás ya existe?
Es medio una tontería,
lo que están diciendo es que como ahora las empresas de modelos de IA están compitiendo a pérdida,
Apple, que no ha hecho nada, es la gran beneficiada, ¿no?
Pero eso es solo porque ahorita la tendencia es esta competencia excesiva entre modelos LLM,
si los modelos de IA estuvieran en una etapa de estabilización o crecimiento, ¿de verdad creen que Meta estaría loca como para publicar Gemma?
Todo el know-how acumulado al desarrollar y operar modelos es lo que termina volviéndose oro y diamante.
En mi empresa probé operar Gemma4-31B con 2 H100, y
En general, si quieren algo pequeño y ágil, creo que Gemma4 es más que suficiente. Yo cambié de GPT-OSS-120B → Qwen3.5-35B-A3B y ahora me terminé quedando con Gemma4-31B, y me dejó bastante satisfecho. Creo que lo voy a seguir usando.
Hace poco, mientras probaba varias cosas para que sonara MBC Radio en Google Nest, terminé usando Cloudflare Tunnel.
Es un servicio tan bueno que te hace preguntarte por qué es gratis.
Meta -> Google
Viendo el gasto de Apple, no parece que se vaya a quedar quieta. También es una empresa bien posicionada para lograr la IA física... Al final, Nvidia también está yendo hacia lo físico... Lo impresionante es Google, que lo tiene todo.
Primero les doy mi recomendación, y entiendo que no siempre hay alternativa, pero en cuanto lo instalé me pidió la contraseña sin rodeos, así que por ahora... lo dejé 😅
Aun así, es un proyecto interesante.
Me gustaría comprobar si también funciona bien en coreano.
A veces hay amigos que tardan en responder y de vez en cuando lanzan un 502, pero bueno,
¡es gratis~!
Cloudflare Tunnel
Me encanta demasiado.
Yo también uso un túnel en la nube y la verdad es que está muy bien.
Normalmente, cuando hay un router físico, muchas veces la IP externa la tiene el router.
Usando Cloudflare Tunnel, incluso una IP interna
puede quedar disponible para conexión externa mediante el registro de un dominio~
Y encima es gratis,
Me pregunto si se podrá ejecutar con Wine.
Oh, qué curioso.
Antes: bloqueaban los reclamos de los clientes con incomodidades intencionales
Ahora: eliminan esas incomodidades para ejercer activamente sus derechos
Más bien, creo que la idea es que los datos de personalización terminarán siendo un foso importante en la próxima era de la IA, y como Apple ya los tiene, quedaría en una posición ventajosa.
Justo tengo una Mac mini conectada por cable porque quería probar OpenClaw,
así que estaría bueno probarlo.
No creo que el tráfico usado para la medición de velocidad en el sitio web de KT se incluya en la medición del uso de internet, ¿verdad?
(¡Si ustedes, las telecom, hicieran bien su trabajo normalmente...!! )
Parece que también podría surgir una forma de planear mediciones de velocidad al mismo tiempo en el mismo edificio o vecindario y bajar intencionalmente la velocidad de forma momentánea.
Ah, ¿o quizás ya existe?
Medir la velocidad = usar al máximo el ancho de banda
así que, mientras más se use en muchas casas, más va a bajar la calidad general del internet.
Un buen caso de vibe coding
¡Qué buena idea! Estaría bien que también hubiera para SK y LG jaja
Es medio una tontería,
lo que están diciendo es que como ahora las empresas de modelos de IA están compitiendo a pérdida,
Apple, que no ha hecho nada, es la gran beneficiada, ¿no?
Pero eso es solo porque ahorita la tendencia es esta competencia excesiva entre modelos LLM,
si los modelos de IA estuvieran en una etapa de estabilización o crecimiento, ¿de verdad creen que Meta estaría loca como para publicar Gemma?
Todo el know-how acumulado al desarrollar y operar modelos es lo que termina volviéndose oro y diamante.
Vamos, MLX de Apple