26 puntos por skg09203 2026-02-18 | 4 comentarios | Compartir por WhatsApp

Es un servidor MCP que procesa subtítulos de YouTube en el servidor (resumen/entidades/temas/análisis de sentimiento) para
enviar al cliente LLM solo resultados comprimidos.

Por qué lo hice:
Revisé unos 80 servidores MCP de YouTube existentes, y todos envían los subtítulos originales
tal cual al LLM. En un solo video de 20 minutos se consumen ~15,000 tokens; esto
los reduce a ~200-500 tokens para el resumen, y a ~3,000 tokens incluso para el reporte completo.
Como pensé en usarlo con Claude skills, también dejé disponible su uso por CLI.

Funciones principales:

  • Reporte estructurado (resumen + temas + entidades + comentarios de una vez)
  • 9 herramientas MCP + CLI (mcp-yt)
  • Resumen gratuito con LLM mediante integración con Ollama/vLLM
  • Monitoreo de RSS de canales
  • Diccionario de más de 200 entidades en coreano/inglés
  • Caché SQLite

pip install mcp-youtube-intelligence
Se puede conectar de inmediato desde Claude Desktop, Cursor y Claude Code.

GitHub: https://github.com/JangHyuckYun/mcp-youtube-intelligence
PyPI: https://pypi.org/project/mcp-youtube-intelligence/

4 comentarios

 
bohblue23 2026-02-19

Definitivamente parece que debieron surgir trade-offs al reducir la cantidad de tokens, pero no pude encontrar nada sobre esa parte en el README.

Últimamente el contexto base es de 200k, así que me da curiosidad la degradación de calidad causada por la pérdida por compresión.

 
skg09203 2026-02-19

¡Hola!

El resumen extractivo (sin LLM), en comparación con el original, se siente más o menos en un nivel de 6/10. Sí extrae las frases clave, pero le falta conexión de contexto.
El resumen con LLM (como Ollama, etc.) es mucho mejor, y de hecho, al probarlo con algunos videos de presentación y videos relacionados con desarrollo, parecía suficiente para entender el contenido. Aun así, a veces se pierden cifras detalladas o matices sutiles.

Con un contexto de 200k, si se trata de un solo video relativamente corto, de 30 minutos a 1 hora, el original es mejor;
pero al procesar en masa cientos de videos o hacer análisis repetidos, creo que se pueden consumir menos tokens y extraer solo el contenido clave.
(Por ejemplo: análisis completo del canal de un competidor, análisis de 100 videos de youtubers de economía, etc.)

¡Voy a probarlo con una mayor variedad de videos en el README y también agregaré con más claridad los resultados de benchmark y los trade-offs!

 
bohblue23 2026-02-19

¡¡Muchísimas gracias por tu respuesta tan dedicada!! ¡¡Espero que el proyecto dé frutos!!

 
skg09203 2026-02-19

Jaja, sí, gracias.