Atmira Pharma Visualization

El Data Partner

Atida | Mifarma es el ecommerce líder en España y Portugal en la venta de productos de parafarmacia y farmacia. Con sede en Albacete y Madrid, más de 10 años de experiencia en el sector y un equipo de más de 120 profesionales, ofrece una experiencia confiable y personalizada antes, durante y después de todo el proceso de compra. La compañía ofrece un amplio catálogo de productos para el cuidado y bienestar a través de un servicio rápido y personalizado respaldado por expertos farmacéuticos.

En el año 2019 Mifarma se unió a Atida con el objetivo de convertirse en la mayor plataforma de salud holística online en Europa. De este modo, trabajan día a día para construir un ecosistema online cuyo objetivo es transformar el panorama de salud y bienestar, convirtiéndose en la farmacia online más grande de Europa y un lugar de referencia al que acudir en busca de información y consejo profesional.

El objetivo

La comprensión del negocio es esencial para que las empresas puedan conseguir sus objetivos, así como para el desarrollo de sus planes de futuro. La visualización de datos es imprescindible para entender el negocio (clusterización de clientes, paquetización de productos, identificación de zonas de expansión, segmentación comportamental en ventas...).

Te retamos a que crees la mejor aplicación y/o visualización sobre los datos anonimizados facilitados por Atida | Mifarma, con la información de negocio del periodo transcurrido entre el 01/01/2017 y el 31/12/2018. Puedes realizar un cuadro de mando, un ejercicio analítico exploratorio, una infografía, una web, un análisis gráfico avanzado… Sorpréndenos.

Los datasets

Ponemos a tu disposición 3 datasets con la información necesaria para poder realizar tu proyecto. Todos los ficheros están en formato CSV, separados por comas y usando el punto como indicador decimal en las variables numéricas.

Dataset 1

El primer dataset “items_ordered_2years.csv” incluye la información de las ventas realizadas a través de la web desde enero de 2017 a diciembre de 2018 en España. Se presentan los datos de los tiques de compra, mostrando las siguientes variables:

NOMBRE DEFINICION TIPO
num_order Identificador de pedido CATEGÓRICA
item_id Identificador del objeto CATEGÓRICA
created_at Fecha de la compra TEMPORAL
product_id Identificador del producto CATEGÓRICA
qty_ordered Número de productos en el pedido NUMÉRICA
base_cost Precio base NUMÉRICA
price Precio de venta NUMÉRICA
discount_percent Descuento aplicado NUMÉRICA
customer_id Identificador del cliente CATEGÓRICA
city Municipio del cliente CATEGÓRICA
zipcode Código postal del cliente CATEGÓRICA

Dataset 2

Por su parte, el segundo dataset “products.csv” presenta la información del catálogo de productos disponible en la web. Incluye las siguientes variables de cada producto:

NOMBRE DEFINICION TIPO
product_id Identificador del producto CATEGÓRICA
sku Código del producto CATEGÓRICA
name Nombre del producto CATEGÓRICA
marca_value Marca del producto CATEGÓRICA
short_description Descripción del producto CATEGÓRICA
analytic_category Categoría del producto CATEGÓRICA
picture Url con la imagen del producto CATEGÓRICA

Dataset 3

Por último, el tercer dataset “products_cat.csv”, contiene la clasificación de los productos a distintos niveles, presentando las siguientes variables:

NOMBRE DEFINICION TIPO
sku Código del producto CATEGÓRICA
cat1 Categorización primer nivel CATEGÓRICA
cat2 Categorización segundo nivel CATEGÓRICA
cat3 Categorización tercer nivel CATEGÓRICA

Se valorará

Análisis exploratorio de los datos (20 ptos)

Que el proyecto realice, permita y obtenga conclusiones de los datos facilitados.

Enriquecimiento de datos (10 ptos)

Que el Proyecto, además de utilizar los datos procedentes de los Datasets, contenga datos de otras fuentes.

Utilidad (20 ptos)

Que el Proyecto permita una mejor toma de decisiones.

Grado de innovación (20 ptos)

Originalidad de las hipótesis planteadas, así como de las técnicas de visualización, modelización y comunicación utilizadas.

Comunicación (30 ptos)

Que los resultados del Proyecto se transmitan de forma clara y concisa, la documentación interna aportada (códigos, comentarios) esté correctamente expresada y estructurada, y sea reproducible. Esta puntuación se dividirá entre:

  • Presentación resultados mediante app y/o web funcional (15 ptos)
  • Valoración de la interactividad y la experiencia del usuario (15 ptos)

Ayudas al desarrollo del reto

Además de los datasets proporcionados, te proponemos algunos recursos que podrían ser de interés en la búsqueda de otros orígenes de datos a utilizar para la realización del presente reto.

EuroStat
Eurostat, la Oficina Estadística de la Unión Europea, se encarga de publicar estadísticas e indicadores de alta calidad a escala europea e internacional, permitiendo de esta manera poder hacer comparaciones entre países y regiones. Se pone a disposición pública y en formato Open Data una gran variabilidad de información: Estadísticas generales y regionales, economía y finanzas, población y condiciones sociales...

Instituto Nacional de Estadística (INE)
El Instituto Nacional de Estadística ofrece en este sitio web una gran cantidad de información estadística de libre acceso para todos los usuarios de la estadística oficial española. Sin duda en la actualidad, a pesar de la vigencia de otros canales de comunicación con nuestros usuarios, el medio Internet es el más importante, tanto por su inmediatez como por su extraordinaria capacidad de almacenamiento y transmisión de contenidos.
Junto con los datos estadísticos que se ofrecen sobre la economía, la demografía y la sociedad española en esta web también se encuentra información de carácter institucional y metodológico, así como sobre diversas actividades y servicios que el INE ofrece a los distintos segmentos de usuarios.