R Data
¿De qué vamos?
- Visión del equipo (“a ayudar en la toma de decisiones”). Hasta ahora solo habíamos hablado principalmente en las Rs de uno de los ámbitos de actuación: predicciones. Pero ayudar en las decisiones implica trabajar en muchos niveles más:
https://medium.com/@thomasschaefer.ts22/https-medium-com-thomasschaefer-ts22-the-dark-side-of-data-science-28c3478fc7ba-rev-28c3478fc7ba
- Asegurarnos que somos data-driven y no basurilla-driven: que lo datos estén ok.
- Soporte de análisis.
- Optimizaciones (e.g., Routing).
Continuous roadmap
…
Demand forecasting
Provide a stable and unambiguous help to demand forecasting.
- Aclarar que teníamos que probar pero ganarle a seres humanos pudiendo hacer la predicción a mano iba a ser difícil. No lo conseguimos, pero acabamos el Q con un modelo que lo hace razonablemente bien: cerca de Negocio.
- No
Valores
Mencionar que no está la masturbación matemática ahí?
World Data Tour
- La idea será encontrar algo cuyos bounds de beneficio y error sean más o menos altos, después hacer un MVP, y si es prometedor, meterle caña.
Hucalc
- Recordarle a la audiencia que no pillamos de esto.
- (Equipo) Al final sí que hicimos lo de tener en cuenta que las cajas podían tener distinto tamaño. ¿Pero cómo se calcula entonces cuántas cajas son una columna en ese caso? ¿Se mantienen los valores?
- (Equipo y Jordi) Si hay ruido con las underestimations porque pueden causar un problema, ¿les echamos un ojo?
Recomendaciones
- (Equipo) Lo que decimos del CTR de MyRegulars es engañoso: no se puede comparar su CTR medido desde la propia página. Cuando partes de home view, el CTR está más en un 8%.
- (Equipo) De hecho, estoy timando más porque estoy comparando CTR con CR y no es lo mismo (pero podríamos medirlo).
- ¿Cuánto sería en euros?
- Juntando ambas cosas, creemos que merece la pena echarle un ojo.
Robotización
- (Equipo & Jordi) En realidad falta medir el efecto con una estantería más larga. Por otro lado, le dijeron a Jordi que no se llenan enteras, ¿pero cuánto entonces? ¿Es decir, nuestro resultado es un caso pesimista?
- (Rubén & Jordi) Cuando Rubén y Jordi dicen que esto es un análisis “necesario pero no suficiente”, ok, ¿pero qué es lo que faltaría?
Data Quality
- Esto es un requisito indispensable para poder decir que somos data-driven (data-informed, o data-inspired). Porque si no, somos “basurilla-driven”.
- Pensamos que los equipos son los dueños de sus propios datos, son un producto más de ellos mismos por los que tendrían que velar (por practicidad (que son los que más cerca están de sus datos=, por que casa con otras cosas que hemos aceptado en software, como Domain Driven Design)… Nuestra idea es habilitar herramientas para que los equipos gestionen esto por si mismos. Pero, al final requiere de unas skills que los equipos hoy no tienen y no parece que tengan el foco para adquirir, por lo que de momento, nosotros mismos atacamos datasets que nos parecen de importancia.
- Intentar precisar exactamente los errores.
- (Adri y Iago) ¿En qué estado está lo de CuVo?
Demand forecasting
- History:
- Acabamos Q1 con el modelo que predice usando oferta ideal y que parece que tiene un performance similar (incluso un poco mejor en VLC y MAD) que Negocio.
- Para VLC lo usamos en Mayo por primera vez y sobreestima (se nos va a un 15% de error). Es importante remarcar aquí que como la predicción se hace el 15 de Abril, el modelo
Offtopic:
- Cuando hagamos análisis, deberíamos hacer chequeos de seguridad y ponerlos por ahí. Si hay movidas raras, no nos vamos a dar cuenta.
- Add the new CuVo objective to the continuous roadmap
- [ ]