Análisis de Aceptación de Pedidos para Rappi

Entendiendo qué afecta la aceptación de pedidos por los repartidores

Victor Sarmiento

2026-01-19

Resumen Ejecutivo

Hallazgos Clave

Tasa de Aceptación General

  • 92.3% de aceptación general (115,860 de 125,549 pedidos)
  • Variación significativa por hora: desde 54.8% (5h) hasta 97.4% (10h)

Factores Principales

  • Factor distancia
  • Impacto de elevación
  • Estructura de ganancias

Oportunidad de Negocio: Mejorar la aceptación del 7.7% de pedidos rechazados (9,689 pedidos) podría incrementar significativamente los ingresos y la satisfacción del cliente

Resumen de Metodología

Detalles del Conjunto de Datos

  • Tamaño: 125,549 pedidos
  • Período: 5 Sep - 4 Oct 2017 (30 días)
  • Alcance: 808 tiendas analizadas

Enfoque de Análisis

  • Análisis exploratorio de datos
  • Modelado estadístico
  • Análisis predictivo
  • Análisis temporal y por tienda

Herramientas y Técnicas

  • R (tidyverse, tidymodels, etc.) + Quarto
  • Modelos: Regresión Logística, Random Forest, XGBoost
  • Pruebas estadísticas y validación
  • Métricas para datos desbalanceados

Limitaciones

Cobertura Temporal

  • Datos de un período limitado (5 Sep - 4 Oct 2017)
  • Patrones estacionales no capturados

Características Faltantes

  • Sin ubicación del repartidor
  • Sin tiempo de preparación del pedido
  • Sin ratings de cliente/repartidor

Alcance del Análisis

  • Sin análisis geoespacial (solo análisis por tienda)

Consideraciones

  • Reentrenar modelo periódicamente
  • Mejoras futuras con más características

Desafío

Por qué importa la aceptación de repartidores

Impacto:

  • Clientes: Tiempo de espera, confiabilidad de entrega
  • Repartidores: Ganancias, satisfacción laboral
  • Rappi: Ingresos, eficiencia operativa

Pregunta de Investigación: ¿Qué factores impulsan la aceptación de pedidos por parte de los repartidores y cómo podemos optimizar las tasas de aceptación?

Descripción de Datos

Variables Principales

  • order_id: Carácter (125,549 únicos)
  • store_id: Carácter (808 tiendas)
  • to_user_distance: Numérico (0-9.36 km)
  • to_user_elevation: Numérico (-260 a 975 m)
  • total_earning: Numérico (0-108,200 COP)
  • created_at: Fecha (5 Sep - 4 Oct 2017)
  • taken: Binario (0/1)

Calidad de Datos

  • Completitud: 100% (0% faltantes)
  • Unicidad: 100% (0 duplicados)
  • Validez: 100%
  • Alcance: 125,549 pedidos, 808 tiendas

Valores Atípicos

  • Distancia: 0.9% (1,144)
  • Elevación: 7.9% (9,960)
  • Ganancias: 2.1% (2,615)

Feature Engineering

Resumen de Características:

  • Features originales: 11
  • Features creadas: 46
  • Total: 57 features

Temporales: weekday, hour, time_of_day, is_peak_hours, is_weekend

Distancia: distance_bins, earning_per_km, log_distance, is_near/medium/far

Elevación: elevation_abs, direction, is_steep, elevation_per_km

Económicas: earning_bins, earning_per_km, earning_to_distance_ratio

Dificultad: difficulty_score, difficulty_category

Interacción & Store-level: distance × elevation, peak × distance, store_acceptance_rate, store_n_orders

Exploración Inicial

Respuestas al Desafío

¿Cuántos pedidos NO fueron tomados?

  • 9,689 pedidos rechazados (7.7%)
  • 115,860 pedidos aceptados (92.3%)

¿Qué día tiene mayor rechazo?

  • Sábado: 10.0% rechazo (peor)
  • Domingo: 4.7% rechazo (mejor)
  • Ranking: Sáb > Vie/Jue (8.9%) > Lun (8.6%) > Mar (7.3%) > Mié (6.8%) > Dom

Distribución de Aceptación

Distribución de Aceptación

Métricas Clave:

  • Aceptación general: 92.3% (115,860 de 125,549 pedidos)
  • Variación por: distancia (89.2%-95.1%), tiempo (74.2%-94.4%), día de semana (90.0%-95.3%)

Patrones por Día de la Semana

Patrones por Día de la Semana

Aceptación por Día:

  • Domingo: 95.3% (mejor día)
  • Miércoles: 93.2%
  • Martes: 92.7%
  • Lunes: 91.4%
  • Jueves/Viernes: 91.1%
  • Sábado: 90.0% (peor día, 10.0% rechazo)

Patrones por Hora del Día

Patrones por Hora del Día

Aceptación por Período:

  • Mañana: 94.4% (mejor período)
  • Tarde: 93.3%
  • Noche: 74.2% (caída significativa)

Impacto de la Distancia

Impacto de la Distancia

Insights Clave:

  • La aceptación disminuye con la distancia: 95.1% (cerca) → 91.9% (media) → 89.2% (lejos)
  • Punto óptimo: < 1 km (95.1% de aceptación)
  • Umbral crítico: > 2 km muestra caída significativa (89.2% de aceptación)

Correlaciones de Distancia

Correlaciones Estadísticas:

  • Distancia vs aceptación: r = -0.087
  • Ganancias por km: r = 0.066 (positiva)
  • Dificultad: r = -0.064 (negativa)

Desafío de Elevación

Impacto de la Elevación

Efectos Topográficos:

  • Entregas cuesta arriba: 92.6% de aceptación
  • Entregas cuesta abajo: 91.4% de aceptación
  • Terreno plano: 93.1% de aceptación (mejor rendimiento)

Efectos de Interacción:

  • Distancia × Elevación: Correlación negativa con aceptación (-0.064)
  • Impacto combinado: Rutas largas con elevación alta muestran menor aceptación

Impacto de las Ganancias

Impacto de las Ganancias

Compensación Actual:

  • Ganancias promedio (aceptados): $5,399 COP
  • Ganancias promedio (rechazados): $5,085 COP (7.7% menor)
  • Aceptación por categoría: Baja (86.4%) → Media (92.9%) → Alta (93.3%)

Recomendaciones:

  • Precios dinámicos por distancia/elevación
  • Precios de sobrecarga para rutas difíciles
  • Correlación: r = 0.066 (ganancias por km vs aceptación)

Análisis por Tienda

Variabilidad entre Tiendas:

  • 707 tiendas analizadas (mínimo 10 pedidos)
  • Rango de aceptación: desde 25% hasta 100%
  • Variabilidad significativa sugiere factores específicos por tienda

Tiendas con Mejor Rendimiento:

  • Top 5 tiendas: 100% de aceptación
  • Características comunes: distancias promedio 1.0-1.5 km, ganancias promedio 4,800-6,400 COP

Tiendas con Bajo Rendimiento:

  • Peores tiendas: 25-56% de aceptación
  • Factores asociados: distancias mayores (1.4-2.2 km) y/o ganancias relativamente bajas (4,900-7,000 COP)

Implicaciones:

  • Oportunidades de mejora en tiendas problemáticas
  • Identificar y replicar mejores prácticas de tiendas top

Hallazgos Clave

Efectos Marginales: Magnitud del Impacto

Cambio en probabilidad de aceptación (puntos porcentuales):

Factores Negativos:

  • Hora +1: -2.8 pp [-3.3, -2.3]
  • Distancia +1km: -2.5 pp [-2.9, -2.1]
  • Pedido nocturno: -2.3 pp [-2.5, -2.0]
  • Ganancias bajas: -1.4 pp [-1.6, -1.2]

Factores Positivos:

  • Ganancias +1 SD: +2.4 pp [+2.1, +2.7]
    • (~1,785 COP)
  • Distancia cercana: +0.8 pp [+0.3, +1.3]
  • Elevación +1m: +0.5 pp [+0.2, +0.8]

Insight: 1 km adicional reduce aceptación ~2.5 pp; distancias >5km reducen >12 pp

Comparación de Modelos

Modelos Entrenados:

  • Regresión Logística
  • Random Forest
  • XGBoost

Métricas de Evaluación:

  • ROC-AUC
  • Precisión / Recall
  • F1-Score
  • MCC (Matthews Correlation)

Enfoque Metodológico:

  • Validación cruzada estratificada (k=5)
  • Split temporal train/test (70/30)
  • Métricas para target desbalanceados
  • Optimización de umbrales

Resultados (ROC-AUC):

  • Logistic Regression: 0.383 (mejor)
  • Random Forest: 0.354
  • XGBoost: 0.338
  • Desbalance: 11.6:1 (clase minoritaria 7.9%)

Efectos Marginales Promedio

Escenarios de Negocio

Escenario 1: Pedido Típico (5km, tarde)

  • Baseline: 92.3% aceptación
  • Distancia 5km: -12.7 pp → 79.6%
  • Si es tarde (vs. noche): +1.3 pp → 80.9%
  • Con ganancias +2,000 COP: +2.7 pp → 83.6%

Acción: Incrementar compensación en pedidos largos

Escenario 2: Pedido Nocturno Cercano

  • Baseline: 92.3% aceptación
  • Pedido nocturno: -2.3 pp → 90.0%
  • Distancia cercana (<1km): +0.8 pp → 90.8%
  • Elevación favorable: +0.5 pp → 91.3%

Insight: Factores se compensan entre sí

Conclusión: Modelo permite identificar qué palancas ajustar para mejorar aceptación

Comparación de Métricas

Curvas ROC

Matrices de Confusión

Recomendaciones

1. Compensación Dinámica por Distancia

Hallazgo:

  • Cada km adicional reduce 2.5 pp la aceptación
  • Pedidos >5km tienen 12.7 pp menos aceptación

Propuesta:

  • Incrementar compensación progresiva por distancia
  • Prima adicional para pedidos >4km
  • Ajuste basado en hora del día

Implementación:

  1. Piloto A/B en tiendas seleccionadas
  2. Métrica clave: Tasa de aceptación en pedidos largos
  3. Validar costo vs. beneficio operativo

Potencial:

Mejorar 7.7% de pedidos rechazados (~9,689 pedidos)

2. Optimización Horaria y Temporal

Hallazgo:

  • Pedidos nocturnos: -2.3 pp aceptación
  • Hora pico: -0.6 pp aceptación
  • Variación significativa por hora (54.8% a 97.4%)

Propuesta:

  • Incentivos diferenciados por franja horaria
  • Bonos para horas de baja aceptación (5-8h)
  • Estrategia de reclutamiento nocturno

Acción Inmediata:

  • Analizar disponibilidad de repartidores vs. demanda
  • Ajustar compensación en ventanas críticas
  • Comunicar claramente primas nocturnas

Beneficio:

Balancear oferta/demanda en horas problemáticas

3. Focalización en Tiendas Problemáticas

Hallazgo:

  • Variabilidad 25%-100% entre tiendas
  • 707 tiendas analizadas (≥10 pedidos)
  • Tiendas bajas: distancias mayores + compensación baja

Propuesta:

  • Identificar top 20% tiendas con peor desempeño
  • Análisis profundo de factores locales
  • Intervención específica por tienda

Acciones:

  1. Diagnóstico: Perfil de cada tienda problemática
  2. Ajuste: Compensación personalizada
  3. Monitoreo: KPIs semanales de mejora

Meta:

Reducir variabilidad y elevar piso de aceptación

4. Sistema Predictivo de Riesgo

Propuesta:

  • Modelo en tiempo real para predecir rechazo
  • Score de riesgo por pedido (alto/medio/bajo)
  • Alertas proactivas a despachadores
  • Sugerencias de ajuste de compensación

Basado en:

  • Distancia, hora, elevación, compensación
  • Efectos marginales validados

Implementación:

  • API de predicción en tiempo real
  • Dashboard para operaciones
  • Logs para mejora continua

Valor:

Intervenir antes del rechazo, no después

Arquitectura

Flujo de Predicción:

┌─────────────────┐
│  Pedido Creado  │
└────────┬────────┘
         │
    ┌────▼────┐
    │ ML API  │
    └────┬────┘
         │
    ┌────▼─────────┐
    │ Motor de     │
    │ Decisión     │
    └────┬─────────┘
         │
    ┌────▼────────┐
    │ Despachador │
    │ + Repartidor│
    └─────────────┘

Componentes Clave:

  1. API de Predicción
    • Recibe features del pedido
    • Retorna score de riesgo
  2. Motor de Decisión
    • Ajusta compensación
    • Sugiere rutas alternativas
  3. Monitoreo
    • Performance en tiempo real
    • Alertas de degradación

Conclusiones

Puntos Clave

  1. Distancia es el factor más crítico: cada km reduce 2.5 pp la aceptación
  2. Ganancias tienen impacto positivo significativo: +2.4 pp por desviación estándar (~1,785 COP)
  3. Factores temporales (hora, pedidos nocturnos) reducen hasta 2.8 pp la aceptación
  4. Variabilidad entre tiendas (25%-100%) presenta oportunidad de mejora
  5. Efectos marginales cuantificados permiten estimar impacto preciso de intervenciones

Próximo Paso: Diseñar experimentos A/B para validar recomendaciones

¿Preguntas?

¡Gracias!

Resumen del Análisis:

  • 125,549 pedidos analizados (sept. 2017)
  • 808 tiendas, 707 con datos suficientes
  • Modelo de regresión logística con efectos marginales cuantificados
  • 4 recomendaciones accionables basadas en datos