13 puntos por GN⁺ 2026-02-13 | Aún no hay comentarios. | Compartir por WhatsApp
  • Con el aumento del tráfico centrado en rastreadores y agentes de IA, la estructura del contenido web está cambiando para que no solo las personas, sino también las máquinas lo consuman directamente
  • Al convertir HTML a Markdown, el uso de tokens se reduce aproximadamente un 80%, mejorando los costos y la eficiencia de procesamiento
  • Soporte a nivel de red para la conversión en tiempo real de HTML→Markdown basada en el encabezado Accept: text/markdown
  • Los encabezados x-markdown-tokens y Content-Signal también proporcionan una estimación de la cantidad de tokens y la política de uso para IA
  • La forma en que los bots de IA consumen contenido puede rastrearse en Radar, y está disponible gratis en beta para planes Pro o superiores

Contexto: la estructura del tráfico web cambia hacia un modelo centrado en agentes de IA

  • La forma de descubrir contenido en línea está pasando rápidamente de un modelo centrado en motores de búsqueda tradicionales a una estructura centrada en rastreadores y agentes de IA
    • Antes, el SEO determinaba el tráfico, pero ahora los sistemas de IA que requieren datos estructurados están surgiendo como principales consumidores
  • Las empresas deben considerar no solo a los visitantes humanos, sino también a los agentes como ciudadanos de primera clase (first-class citizen)
  • La web existente está basada en HTML y diseñada para personas, por lo que contiene demasiados elementos innecesarios para que la IA los procese

Por qué Markdown

  • HTML, por elementos como <div>, <script> y navegación sin relación con el significado semántico, tiene una estructura que desperdicia tokens
    • Ejemplo: ## About Us usa alrededor de 3 tokens, mientras que el mismo HTML <h2 class="section-title"...> consume entre 12 y 15 tokens
  • Según esta publicación del blog, HTML pasa de 16,180 tokens a 3,150 tokens en Markdown, lo que representa una reducción de tokens de aproximadamente 80%
  • Markdown proporciona una estructura explícita que mejora la eficiencia de procesamiento de IA y la calidad de los resultados
  • Actualmente, la mayoría de los pipelines de IA incluyen una etapa de conversión de HTML a Markdown, pero esto implica
    • aumento en el costo computacional
    • mayor complejidad de procesamiento
    • posibilidad de alejarse de la intención del autor

Markdown for Agents: conversión automática a nivel de red

  • La red de Cloudflare ofrece conversión en tiempo real de HTML→Markdown
    • Funciona con content negotiation en zonas habilitadas
  • Cuando el cliente envía una solicitud con el encabezado Accept: text/markdown
    • obtiene el HTML original desde el origin
    • lo convierte a Markdown en la red y lo devuelve
  • Ejemplo de respuesta
    • content-type: text/markdown
    • vary: accept
    • incluye el encabezado x-markdown-tokens: 725
  • x-markdown-tokens proporciona una cantidad estimada de tokens del documento Markdown
    • útil para calcular la ventana de contexto
    • o decidir estrategias de chunking

Integración con Content Signals Policy

  • Integrado con el marco de trabajo Content Signals framework
  • Las respuestas en Markdown incluyen de forma predeterminada
    • el encabezado Content-Signal: ai-train=yes, search=yes, ai-input=yes
  • Permite indicar si se autoriza el uso para entrenamiento de IA, búsqueda y entrada para agentes
  • Más adelante se ofrecerán opciones de políticas personalizadas

Casos de uso: Cloudflare Blog y Developer Docs

  • La función está habilitada en la documentación para desarrolladores y en el blog
  • Una solicitud con curl -H "Accept: text/markdown" devuelve Markdown
  • La parte superior de la respuesta incluye metadatos YAML
    • title
    • description
    • image y otra información estructurada

Cómo convertir documentos fuera de Cloudflare

  • Workers AI AI.toMarkdown()
    • admite conversión y resumen de varios formatos de documento, incluido HTML
  • Browser Rendering /markdown REST API
    • admite conversión a Markdown después de renderizar en un navegador real
    • puede manejar páginas dinámicas

Seguimiento del uso de Markdown: Cloudflare Radar

  • Radar AI Insights añade la dimensión content_type
    • permite ver la distribución de tipos MIME del contenido devuelto a bots y rastreadores de IA
  • Se pueden filtrar solicitudes de Markdown por agente específico
    • por ejemplo: OAI-Searchbot(GPTBot)
  • Los datos están disponibles mediante la API pública y Data Explorer

Cómo empezar y alcance de disponibilidad

  • Activar la función en Cloudflare Dashboard → seleccionar Zone → Quick Actions
  • Disponible para clientes de planes Pro, Business, Enterprise y SSL for SaaS
  • Actualmente está en beta y se ofrece sin costo
  • Más detalles disponibles en Developer Docs

Aún no hay comentarios.

Aún no hay comentarios.