5 puntos por GN⁺ 2025-12-16 | 2 comentarios | Compartir por WhatsApp
  • Un proyecto que recopiló datos de todos los restaurantes de Londres y construyó un modelo de machine learning para analizar el impacto estructural del algoritmo de Google Maps sobre la supervivencia de pequeños negocios urbanos
  • El ranking de Google Maps no es una lista simple, sino que cumple el papel de "creador de mercado" al organizar activamente la demanda mediante señales de relevancia, distancia y prominence (prominencia)
  • Muestra una estructura que se refuerza de forma acumulativa por el volumen y ritmo de reseñas, reconocimiento de marca y menciones en la web, generando un ciclo de exposición inicial → aumento de demanda → más reseñas → exposición adicional
  • Esta estructura favorece a las cadenas y a los restaurantes en zonas céntricas, mientras que los nuevos restaurantes independientes enfrentan un "problema de cold start" que dificulta incluso que sean descubiertos por falta de reseñas
  • Para distinguir esto, se construyó un modelo de ML que predice la calificación esperada (contrafactual) usando solo las condiciones estructurales del restaurante, y la diferencia con la calificación real se calcula como residual, lo que permite identificar restaurantes que el algoritmo sobrevalora o subvalora
  • Además, se agregaron los restaurantes por zona para analizar con PCA y clustering la fortaleza estructural de los hubs de restaurantes, mostrando cómo la plataforma reorganiza el ecosistema gastronómico de la ciudad

Google Maps no es un directorio, sino un creador de mercado (Market Maker)

  • A diferencia de la narrativa oficial de que Google Maps refleja pasivamente "lo que le gusta a la gente", en la práctica organiza la demanda mediante tres señales clave: relevance (relevancia), distance (distancia) y prominence (prominencia)
  • La relevance se infiere mediante coincidencia textual entre la búsqueda y los metadatos del negocio; la distance es un factor puramente espacial
  • La prominence se calcula a partir del número de reseñas, la velocidad a la que se acumulan, la calificación promedio, el reconocimiento de marca y la visibilidad web, y es ahí donde comienza su impacto político-económico
    • Refleja con qué frecuencia la gente interactúa con un lugar, lo menciona o ya lo conoce
  • Es decir, Google Maps no "refleja" la demanda: es un market maker que la organiza mediante su algoritmo de ranking

Estructura de ventaja acumulativa y efecto Mateo

  • La visibilidad en la lista de resultados determina los visitantes, los visitantes determinan la velocidad de acumulación de reseñas, y esas reseñas vuelven a alimentar la señal de prominence: una ventaja acumulativa (cumulative advantage)
  • Se parece a la forma en que el capital crece por interés compuesto en los mercados financieros, y es una versión del efecto Mateo (Matthew Effect) de Robert Merton aplicada a los locales de kebab
    • El principio de "al que tiene, se le dará más"
  • Las cadenas salen favorecidas por el reconocimiento de marca entre ubicaciones, y los negocios en zonas de alto tránsito acumulan reseñas más rápido incluso con la misma calidad, lo que eleva su posición en prominence
  • Los nuevos negocios independientes enfrentan un problema de cold start: sin reseñas es difícil que los descubran, y si no los descubren, también es difícil acumular reseñas
  • Lo que parece una elección neutral del consumidor debe entenderse en realidad como un diseño de mercado mediado por algoritmos

La plataforma como creador de mercado

  • En economía, un market maker no solo refleja oferta y demanda, sino que es un intermediario que moldea activamente la liquidez, el matching y el descubrimiento de precios
  • Plataformas como Google Maps cumplen una función similar en los servicios locales, no controlando precios sino la visibilidad
  • En términos de economía digital, el algoritmo de ranking actúa como un attention allocator que dirige la demanda hacia ciertos negocios y la aleja de otros

Una ciudad contrafactual construida con machine learning

  • Si Google Maps es el creador de mercado de la demanda urbana, la pregunta clave es cómo se vería la ciudad sin esa capa de amplificación
  • Para separar el desempeño intrínseco de un restaurante del efecto de visibilidad de la plataforma, se construyó un modelo de machine learning
  • Se utilizó HistGradientBoostingRegressor (el gradient-boosted decision tree de scikit-learn)
    • Es adecuado para datos tabulares mixtos, grandes y desordenados, y permite capturar efectos de interacción sin necesidad de especificarlos manualmente
  • Variables del modelo (features):
    • Número de reseñas (con transformación log para reflejar el efecto decreciente de la atención)
    • Tipo de cocina, si es cadena o independiente, rango de precios, tipo de negocio (restaurante/cafetería/takeaway/bar)
    • Ubicación dentro de la ciudad mediante una grilla espacial

Se construyó por separado un modelo de clasificación del tipo de cocina

  • Se detectó que la clasificación del tipo de cocina en Google Maps era imprecisa e inconsistente
    • Muchos estaban etiquetados de forma ambigua como "restaurant", "cafe" o "meal takeaway"
  • Se construyó un modelo de clasificación aparte para predecir el tipo de cocina a partir del nombre del restaurante, el idioma del menú y el texto de las reseñas
  • El filtro de tipo de cocina del dashboard usa el resultado del modelo de machine learning, no las etiquetas de Google
  • Si el tipo de cocina está mal clasificado, se distorsionan los análisis de diversidad, clustering y competencia a larga distancia

Medición de subvaloración algorítmica con el residual de calificación (rating residual)

  • Todas las variables pasaron por un pipeline estándar de preprocesamiento (imputación de faltantes, encoding, etc.)
  • El modelo aprende únicamente el mapeo entre características observables en la plataforma y calificación
  • Para cada restaurante se genera una calificación esperada contrafactual (counterfactual expected rating)
  • La diferencia entre la calificación real y la predicha es el rating residual
    • Residual positivo: desempeño realmente superior a la línea base de la plataforma
    • Residual negativo: desempeño inferior a lo que el algoritmo normalmente recompensa
  • No es una medida perfecta de la calidad de la comida, pero sí un indicador potente de mispricing algorítmico
    • Captura dónde el valor social o culinario se desvía de lo que la plataforma amplifica estructuralmente

Los límites de la visibilidad pagada con anuncios

  • Algunos restaurantes pagan por promoted pins o anuncios en búsquedas locales
  • Esa visibilidad pagada no es pública, por lo que no puede estimarse
    • Es una señal de cuán opaco se ha vuelto el poder de la plataforma
  • El residual de calificación podría reflejar en parte gasto publicitario no observable

Presentación de London Food Dashboard

  • Se construyó el London food dashboard para resumir los resultados del análisis
  • Funciones actuales: búsqueda por nombre, filtro de joyas infravaloradas (identificadas por el algoritmo de machine learning), filtros por tipo de cocina, borough, rango de precios, calificación mínima y número de reseñas
  • Aunque está en beta, funciona como un microscopio para observar la economía alimentaria algorítmica de Londres
  • Dirección de acceso: laurenleek.eu/food-map
  • El filtro "underrated gems" es un ejemplo de uso del residual del modelo
    • Las burbujas más grandes y oscuras indican lugares que el algoritmo subvalora

Del restaurante individual al vecindario algorítmico

  • Los restaurantes no fracasan de manera aislada, sino dentro de un ecosistema
  • Para analizar qué ocurre cuando la dinámica de la plataforma se extiende del restaurante individual al ecosistema alimentario completo del barrio, se añadió una segunda capa de modelado
  • Los restaurantes se agregaron en pequeñas celdas espaciales (hexágonos en el mapa, más favorables que los cuadrados frente a los edge effects)
  • Se calcularon variables resumen por zona: densidad de restaurantes, calificación promedio, residual promedio, total de reseñas, proporción de cadenas, cuisine entropy y rango de precios
  • Tras estandarizar las variables, se ejecutó un PCA (análisis de componentes principales) para comprimir la "fortaleza del ecosistema de restaurantes" en un único hub score continuo
  • Luego se aplicó K-means clustering en el mismo espacio de variables para clasificar las zonas en 4 tipos estructurales:
    • hubs elite, strong, everyday y weak

Resultados del análisis de hubs

  • El patrón resulta familiar: domina el centro de Londres
  • Lo importante no es dónde están los hubs, sino qué tipo de hubs son
  • En lugar de usar calificaciones crudas, se identificaron los 5 hubs de restaurantes estructuralmente más fuertes de Londres con el hub score total
    • Lugares donde se alinean densidad, atención algorítmica, supervivencia de negocios independientes y poder adquisitivo del consumidor
    • Están etiquetados en el mapa
  • Para evitar conflictos vecinales, el texto no enumera explícitamente el ranking

Densidad por tipo de cocina y diversidad culinaria de Londres

  • Al superponer el panel de densidad por tipo de cocina sobre el análisis de hubs, el resultado se vuelve más claro
  • La diversidad culinaria de Londres no está distribuida de forma uniforme en la economía de plataforma
  • Las cocinas migrantes se agrupan con fuerza en áreas urbanas donde la visibilidad algorítmica es estructuralmente más débil
  • Italian, Indian, Turkish, Chinese, Thai, British, Japanese, French, American y fish-and-chips reflejan, cada una, historias propias de asentamiento, redes laborales, formatos comerciales y relaciones con el capital y la renta
  • Algunas cocinas forman corredores largos y continuos; otras aparecen como clusters discontinuos vinculados a ciertos corredores comerciales o estratos de ingreso
  • La diversidad culinaria no es solo cuestión de gusto: está ligada a dónde se asentaron las familias, qué corredores comerciales siguieron siendo lo bastante accesibles para que la segunda generación abriera negocios y en qué partes de la ciudad ocurrió la migración antes de que maduraran los ecosistemas culinarios

Implicaciones de política pública

  • Este proyecto comenzó como un problema de búsqueda y terminó llevando a una pregunta mucho más grande
  • El resultado más importante no es qué barrio ocupa el primer lugar, sino el reconocimiento de que las plataformas ahora estructuran silenciosamente la supervivencia en los mercados urbanos cotidianos
  • La escena de restaurantes de Londres ya no se organiza solo por gusto
    • Se organiza por una visibilidad que crece de forma compuesta, por rentas que suben una vez que llega el descubrimiento, y por algoritmos que asignan atención mucho antes de que lleguen los consumidores
  • Lo que parece una "elección" es cada vez más un efecto aguas abajo de los sistemas de ranking

Necesidad de transparencia y auditoría algorítmica

  • Si el descubrimiento ahora moldea la supervivencia de los pequeños negocios, entonces competencia, equidad y regeneración urbana ya no pueden ignorar los sistemas de ranking de las plataformas
  • Aunque los gobiernos locales reconstruyan calles y liberalicen licencias, la invisibilidad algorítmica puede aislar económicamente a un lugar
  • La transparencia y auditabilidad de las plataformas ya no son un debate técnico de nicho, sino que se están convirtiendo silenciosamente en una herramienta de política económica local
  • Como mínimo, un algoritmo de ranking con este nivel de efectos económicos debería poder auditarse
    • Así como se auditan los mercados financieros, también habría que auditar el mercado de la atención (attention market)
  • Vale la pena prestar atención a la magnitud del poder que tiene Google Maps como app de navegación

2 comentarios

 
colus001 2025-12-16

Creo que a esto también se suma la intervención en las reseñas por parte de dueños de negocios muy activos, lo que está generando grandes ineficiencias. Es un problema difícil. Antes confiaba en las reseñas de Google Maps, pero ahora parece que la parte de descubrimiento está completamente arruinada.

 
illiil1lii 2025-12-16

Naver Maps se volvió muy poco confiable, y Kakao Map me pareció un poco mejor. Aun así, como hasta hay comentaristas pagados, en este tipo de áreas mientras más grande es el servicio, menos confiable termina siendo.