2 puntos por GN⁺ 2023-12-12 | 2 comentarios | Compartir por WhatsApp
  • Muchos sitios ofrecen feeds RSS pero omiten el enlace RSS/Subscribe o los metadatos de autodetección, así que a los usuarios les cuesta encontrar la dirección del feed
  • Si se muestra directamente un enlace RSS en la página, aparte de la autodetección del lector de feeds, también se le informa al visitante de la existencia de RSS, lo que mejora la accesibilidad de la web abierta
  • La autodetección de RSS es el método estándar que busca type="application/rss+xml" en la etiqueta <link> del HTML, y puede ser aprovechado por lectores de feeds como NetNewsWire cuando se ingresa una URL
  • Si se agrega en el head del sitio web una etiqueta <link> con rel="alternate", type, title y href, es posible exponer explícitamente el feed RSS
  • Si hay varios feeds, como RSS, Atom, JSON Feed o podcast feed, se pueden incluir varias etiquetas <link>, y conviene que el botón de RSS parezca un botón de RSS

Ofrecer juntos el enlace RSS y la autodetección

  • Lo primero que revisan los usuarios cuando buscan un feed RSS es un enlace RSS/Subscribe dentro del sitio, pero muchos sitios no lo tienen
  • Algunos usuarios simplemente pegan la URL del sitio web en un lector de feeds y dejan que la app encuentre el feed, pero si el enlace RSS aparece en la página, el visitante puede saber de inmediato si hay soporte para RSS
  • La autodetección de RSS funciona buscando entre las etiquetas <link> del sitio web aquella cuyo type sea application/rss+xml
return Array.from(document.getElementsByTagName('link')).find(l => l.type.includes('application/rss+xml'))?.href
  • Este método es un estándar llamado RSS auto-discovery, que ayuda a los navegadores y a otros programas a encontrar automáticamente el feed RSS de un sitio
  • Lectores de feeds como NetNewsWire pueden usar estos metadatos para encontrar el feed cuando se pega una URL

Metadatos del feed que van en el head

  • Si hay un feed RSS, se puede agregar en el head del sitio web una etiqueta de autodetección como la siguiente
<link rel="alternate" type="application/rss+xml" title="My Cool Website" href="https://example.com/feed.xml"; />
  • Los feeds Atom usan application/atom+xml en type
<link rel="alternate" type="application/atom+xml" title="My Cool Website" href="https://example.com/atom.xml"; />
  • Si hay varios feeds, también se pueden incluir varias etiquetas <link>
    • feed RSS del sitio web
    • JSON Feed
    • feed de podcast
<!-- Website RSS feed -->
<link rel="alternate" type="application/rss+xml" title="My Cool Website" href="https://example.com/feed.xml"; />

<!-- Website JSON feed -->
<link rel="alternate" type="application/json" title="My Cool Website but JSON" href="https://example.com/feed.json"; />

<!-- Podcast RSS feed -->
<link rel="alternate" type="application/rss+xml" title="My Cool Podcast" href="https://example.com/podcast.xml"; />
  • En una actualización del 9 de diciembre de 2023, se añadió la sugerencia de que, al agregar un botón RSS, debería verse como un botón RSS y usar el color naranja de RSS

2 comentarios

 
ndrgrd 2023-12-14

Hay muchos sitios muy bien escondidos, ¿no? Cuando de verdad quiero suscribirme, a veces pruebo escribir directamente /rss, /rss.xml, /index.xml, /feed o /feed.xml.

 
GN⁺ 2023-12-12
Opiniones de Hacker News
  • Tip: los canales de YouTube también publican feeds RSS, así que puedes suscribirte con solo pegar la URL del canal en tu lector de noticias
    Puede haber feeds RSS en lugares inesperados, así que conviene usar una extensión que le devuelva al navegador el botón de “suscribirse por RSS”
    <https://addons.mozilla.org/en-US/firefox/addon/awesome-rss/>
    <https://chromewebstore.google.com/detail/rss-subscription-ex...>

  • Hay dos razones principales por las que muchos feeds RSS/Atom no se muestran: desaparecieron los servicios tipo Google Reader y los navegadores dejaron de ofrecer soporte básico para RSS, incluida la detección de feeds
    Si restauras esa función que originalmente debería tener el navegador, al menos podrás encontrar feeds, y luego puedes suscribirte con herramientas como newsbeuter

    • Fue intencional. RSS es una forma de esquivar los anuncios
      Solo hay que pensar en quién hace el navegador más usado hoy en día
    • Que algunos servicios corporativos hayan desaparecido no significa que ya no se puedan poner enlaces "application/rss+xml" en el código HTML
      De hecho, puede haber muchas apps de escritorio “irrecuperables”, como los lectores RSS, y es raro depender de servicios que pueden desaparecer; todavía hay muchos lectores RSS, y hacer uno también es bastante sencillo
      Para encontrar el feed basta con revisar el código HTML. El problema es cuando el feed existe pero no aparece en ninguna parte del sitio
    • Una vez descubrí que no se veía el botón RSS en mi sitio web, y no sabía por qué hasta que revisé el bloqueador de anuncios
      Al menos dos listas, AdGuard Widgets y EasyList Social Widgets, todavía tienen reglas que bloquean el ícono RSS. Eso sí, no vienen activadas por defecto
    • Incluir soporte nativo para RSS como función central del navegador nunca fue algo tan razonable, y las extensiones encajan mucho mejor
      También hay muchos servicios que reemplazan a Google Reader y ofrecen funciones más allá del RSS simple
      En medios optimizados para la participación y la adicción, RSS es una vía de salida de la plataforma, así que por supuesto no lo usan. Incluso los blogs personales, que son el foco principal del artículo, pueden querer retener al lector dentro del sitio para conseguir clics
      Esto es un conflicto de intereses entre proveedores y consumidores de contenido, en gran parte un problema de publicidad y no de implementación
  • Ojalá también hubiera una forma de que el operador del sitio sepa que me suscribí al feed del blog
    A veces leo algo bueno y le mando un correo de elogio al dueño del sitio, o dejo un comentario breve en HN para decirle que me suscribí al feed. Ojalá eso anime a la gente que crea buen contenido con tanto esfuerzo y cariño a seguir haciéndolo
    Si te interesa, también puedes ver mi lector RSS hecho por mí en https://www.heyhomepage.com; agrega parámetros como /?rss_ref=heyhomepage.com a los enlaces en los que se hace clic. El operador del sitio recibe mi tráfico y, si mira sus estadísticas de visitas, puede ver fácilmente de dónde vino

  • RSS tampoco es del todo consistente. Algunas personas ponen el contenido en el feed y otras solo ponen enlaces
    Si solo hay enlaces, para extraer el contenido por programa normalmente hace falta código especial para cada sitio. Sí existen scrapers genéricos, pero hay que tolerar que se mezclen datos con ruido arbitrario, como encabezados del sitio
    Creo que con la llegada de los LLM por fin podría haber mercado para esto. La gente podría vender datos tipo artículos como fuente de datos para pipelines de aprendizaje automático, y también podría ser una vía para salir de la publicidad
    Así que me gustaría que empezáramos por mejorar RSS. Es como un faro en un mar oscuro

    • No creo que RSS necesite “mejorarse” para los scrapers
    • NewsBlur tiene un interruptor para elegir entre vista de feed y vista de texto
      La vista de texto normalmente puede traer el artículo completo desde el sitio web aunque el feed solo tenga un resumen
    • ¿Eso significa que RSS podrá lavar derechos de autor mejor?
    • Basado en esta idea, hice un lector/rastreador de RSS algo opinionado que maneja solo enlaces
      Así se obtiene una experiencia consistente y el autor también recibe visitas a su sitio web
      Puedes probarlo aquí: https://lenns.io. Me daría gusto recibir comentarios
    • Dejé de usar RSS precisamente por eso de que algunas personas ponen contenido en el feed y otras solo enlaces
      Si de todos modos tengo que seguir el enlace, mejor voy directo al sitio web que quiero leer para ahorrar tiempo
  • Una de las viejas razones por las que algunas personas no quieren hacer público su RSS es que quieren tener una idea de cuántos suscriptores tienen, pero hace poco descubrí que muchos lectores RSS grandes muestran cifras analíticas de alto nivel
    Con eso también se puede estimar la cantidad de lectores RSS. Ojalá más lectores soportaran esta función. Viendo todos los feeds RSS que publico en mi producto, los clientes que parecen soportar este protocolo falso son NewsBlur, Feedly, Feedbin e inoreader
    Me enteré gracias al artículo de Darek Kay https://darekkay.com/blog/rss-subscriber-count/

    • Que los grandes lectores RSS publiquen el número de suscriptores es una buena función adicional, pero también empuja un poco hacia la centralización
      Yo intento añadir parámetros URL como /?rss_ref=heyhomepage.com para avisarle al operador del sitio que estoy suscrito a su feed. El operador puede o no ver ese referente RSS en sus estadísticas de visitas
      No consumo el artículo completo solo dentro del lector; prefiero que muestre un resumen corto y luego hago clic en el enlace del artículo. Así puedo disfrutar su sitio personal y el operador también puede ver mi tráfico con más claridad
    • También es una práctica común en los clientes de pódcast que rastrean desde el lado del servidor; de hecho, casi todos lo hacen así
    • La solución más fácil es simplemente revisar las solicitudes del servidor
      Mi lector está basado en terminal, así que soportar analítica con JavaScript iría en contra del propósito mismo
  • El autodescubrimiento está roto o ausente en muchos sitios, así que mi lector de feeds Temboz prueba estos sufijos con la esperanza de que haya un feed RSS o Atom escondido en algún lugar
    'feed', 'feed/', 'rss', 'atom', 'feed.xml', '/feed', '/feed/', '/rss', '/atom', '/feed.xml', 'index.atom', 'index.rss', 'index.xml', 'atom.xml', 'rss.xml', '/index.atom', '/index.rss', '/index.xml', '/atom.xml', '/rss.xml', '.rss', '/.rss', '?rss=1', '?feed=rss2'

  • Hace tiempo hice https://hn-blogs.kronis.dev, basado en feeds RSS/Atom compartidos por la gente en HN, y todavía sigue corriendo en segundo plano para traer los artículos más recientes cada día
    El sitio tiene enlaces a publicaciones originales de HN y a un post de blog que escribí; el post del blog está aquí: https://blog.kronis.dev/articles/ever-wanted-to-read-thousan...
    Fue un trabajo bastante interesante y me gusta que esta tecnología exista, pero cada persona la integra de forma muy distinta. A veces se reporta mal el tipo de feed, otras veces no se obtiene todo el feed o todos los metadatos de los elementos que uno quiere, y también puede haber errores de red o secuencias de control dentro del texto que rompen el parseo del XML
    Cada vez estoy más convencido de que, cuanto más crece el tamaño del conjunto de datos, más problemas potenciales aparecen. Si un error puede ocurrir, tarde o temprano tendrás que manejarlo

  • Siento que este artículo iba dirigido a mí, así que añadí un ícono de RSS al pie de página de mi sitio
    https://github.com/gavinanderegg/gavinanderegg.github.io/com...
    Pensé que un enlace "application/rss+xml" sería suficiente, pero entiendo que hoy en día la gente no va a asumir que todos los sitios tienen uno de esos enlaces. Como alguien que lee posts de blog principalmente por RSS, me parece muy bueno hacerlo más explícito
    [1] https://mastodon.social/@gavinanderegg/111362850402497489

    • Mi página tampoco dejaba muy visible su feed RSS. No se me da bien HTML, así que tomé como referencia lo que hiciste en tu sitio y lo adapté al mío
      Ahora los dos ya mostramos nuestro RSS
  • Uso miniflux, y cuando trato de encontrar un feed simplemente pongo el dominio y, tres de cada cuatro veces, lo encuentra en algún lugar como /rss o feed
    Estaría bien que fuera explícito. Supongo que como probablemente viene integrado en el framework y aparece gratis, no sienten la necesidad de exponerlo, aunque puede que esa sea una idea ingenua

  • El hecho de que RSS haya sido relegado me enoja cada vez que lo pienso

    • ¿Quién se supone que lo relegó? Puede que Google haya matado su propio lector de noticias, pero RSS no depende de Google, así que nunca se detuvo
      Me encanta que Wordpress añada feeds automáticamente a todos los sitios de internet
      Yo lo veo como un filtro. El contenido tonto de clickbait se va a otra parte, y el contenido de calidad, del que su creador se hace responsable directamente, entra muy bien en mi lector de feeds. Para mí, es casi una bendición disfrazada
      Claro, cultivar una buena colección de feeds requiere esfuerzo adicional. Pero ¿no pasa eso con todas las cosas buenas de la vida? Ese esfuerzo se acumula como interés compuesto y pronto da frutos
      ¡Larga vida al RSS, larga vida a la web abierta!