Marketing by
Data Science for Business
Programa Machine Learning Predictivo
Adquiere la habilidad más importante para un data scientist en 12 semanas, aunque no sepas programar ni conozcas los algoritmos
La única formación en español que enseña Data Science 100% orientado a negocio con metodologías y casos reales
Destinada a formar Data Scientist que sepan resolver problemas reales de negocio
Resolverás un caso de negocio real de principio a fin, haciéndo énfasis en el valor de negocio
  • Es la diferencia que incrementará tu valor profesional: las empresas pagan dinero por saber cómo conseguir resultados, no por saber académicamente tal o cual lenguaje o técnica analítica
  • Te trasmito directamente toda mi experiencia de más de 15 años haciendo estos proyectos en las mayores empresas
Aprenderás METODOLOGÍA que hará tus proyectos más rápidos y seguros
  • Ninguna otra formación tiene este enfoque: todas se centran en las técnicas, pero quien haya tenido experiencia real sabe que lo importante es la metodología
  • Aprenderás la metodología exacta con la que yo hago mis proyectos
Usarás Rstudio con los paquetes más imporantes actualmente para data science (Tidyverse)
  • Usaremos principalmente tydiverse: y paquetes como Skimr, Dplyr, Tidyr, y Ggplot2
  • Perderás el miedo al código
  •  Multiplicarás la velocidad de tu aprendizaje de R
Es la formación perfecta para ti si eres:
Un recién licenciado que quiere iniciar su carrera en Data Science
Un profesional con experiencia que quiere reconvertir su perfil a una de las áreas con mayor demanda laboral
Un profesional del ámbito de datos, que aunque no quiera ser Data Sciencist, quiere aprender machine learning para aplicarlo en su trabajo
El programa está pensado para completar en 12 semanas con una dedicación de unas 2-3 horas semanales
Pero podrás adaptarlo 100% a tus necesidades, ya que todo el contenido está disponible en una plataforma online sin límite de tiempo
  • 69 lecciones en video: sólo del programa principal, más todos los bonus ofertados en el momento de comprar el programa
  • Más de 17 horas de contenido total: dividido en videos de una duración media de 15 minutos, para que puedas adaptarlos a tu ritmo
  • Todos los códigos en formato notebook: podrás primero centrarte en entender qué se hace y por qué, y después replicar tú el código hasta convertirte en una máquina de Data Science
  • Sin límite de tiempo: el contenido estará siempre disponible para tí en la plataforma
  • Incluso puedes aprovechar la oferta ahora y ponerte dentro de un tiempo: si tienes claro que Data Science es lo tuyo pero ahora no tienes disponibilidad puedes comprar ahora y aprovechar la oferta y los bonus, y empezar el programa dentro de 3, 6 meses o cuando tú quieras!
  • O convertirte en un master data science en un mes!: si tienes prisa por incrementar tus habilidades y te pones full time 8h al día en un mes puedes haber pasado de 0 a 100 en machine learning
Esto es lo que vas a aprender en el programa:
  • SEMANA 1: Introducción y preparación - En esta primera semana vamos a instalar todo lo necesario y a conocer el caso de negocio. Comenzaremos desde lo más básico, cómo instalar y configurar Rstudio. Entendermos el tipo de proyecto que vamos a realizar y por qué es de los más importantes en la aplicación práctica de Data Science en las empresas. Y veremos la metodología general a llevar a cabo en proyectos reales y cómo la vamos a aplicar a este caso concreto.
  • SEMANA 2: Calidad de datos - Te anticipo una cosa, los datos nunca están bien de inicio. Y aquí es cuando la gente que ha aprendido en cursos con datos de juguete y ya preparados se da su primera bofetada de realidad. Te voy a enseñar la batería exacta de calidad de datos (que yo llamo sota-caballo-rey) que te ahorrará cientos de horas de trabajo al inicio del proyecto y minimizará los riesgos del mismo. Esto es clave sobre todo si trabajas para clientes, porque si pasas mucho tiempo al inicio del proyecto con temas de calidad y sin entregar resultados, el cliente se empezará a poner nervioso y a pensar que no sabes lo que estás haciendo.
  • SEMANA 3: Metología de tranformación de datos - Esta es una de las fases más diferentes cuando comparamos las metodologías académicas con las usadas en proyectos de negocio, y por tanto más diferenciales de nuestra aproximación. Las empresas buscan además de una buena capacidad predictiva obtener conclusiones e insights de negocio, poder explicar los resultados y aprovechar todo el conocimiento de negocio creando nuevas variables específicas del sector, etc. Por eso nuestra aproximación es distinta y es por si misma uno de los valores añadidos que los clientes suelen valorar más.
  • SEMANA 4: Preselección de variables - En entornos reales solemos tener muchos cientos o incluso miles de variables que considerar en el proyecto. Esta semana vamos a aprender cómo identificar a priori las variables que van a ser más predictoras para nuestro caso de uso antes incluso de que tengamos que trabajar sobre ellas (y no es usando la correlación como hace la mayoría de la gente y se deja la mitad de variable predictivas fuera) si no con técnicas avanzadas capaces de detectar relaciones no lineales. Entre ellas la técnica maestra de los modelizadores de riesgos que la mayoría de los modelizadores de marketing ni siquiera saben que existe.
  • SEMANA 5: Variables sintéticas - Éstas son variables que construimos a partir de las variables originales, y que nos ayudan a aprovechar al máximo la información contenida en las originales, su histórico, su tendencia, etc, al mismo tiempo que las dejamos estructuradas en un formato correcto para posteriormente entrenar los modelos de machine learning
  • SEMANA 6: Discretización de variables - Hay data scientist a los que lo les gusta discretizar, generalmente porque dicen que se pierde información al hacerlo. Mi experiencia es la contraria si se hace de la manera correcta. Esta semana descubrirás por qué y la forma que muy pocos saben sobre cómo hacerlo de la forma correcta.
  • SEMANA 7: Conceptos fundamentales de Machine Learning - Vamos a dedicar esta semana a que aprendas los principios de machine learning. Cosas que necesitas conocer y dominar para entender por qué se hacen las cosas, y que te harán sonar como un auténtico profesional, cosas como: problema sesgo-varianza, sobre ajuste, hyperparametrización, desbalanceo de clases, etc
  • SEMANA 8: La regresión logística - Suele ser la primera técnica que usa el data scientist en sus proyectos, y después intenta batir sus resultados con otros algoritmos.
    En proyectos de negocio, en la mayoría de los casos termina funcinando mejor una estrategia de incorporar más datos y trabajarlos correctamente como hemos visto en las semanas anteriores para luego hacer una técnica "sencilla" como la regresión logística, que una estrategia de centrarse mucho en la parte de modelización para generar algoritmos más avanzados como redes neuronales, etc. descuidando el tema datos y preparación
  • SEMANA 9: Evaluación de modelos - Antes de continuar con el  resto de los algoritmos vamos a aprender cómo se realiza la evaluación de un modelo, y vamos a aplicar esas métricas para evaluar la regresión logística que construimos la semana anterior. También te explicaré la métrica que nunca debes usar para evaluar los modelos (muchos cometen este error y se destapan como falsos data scientist)
  • SEMANA 10: Modelizando con árboles de decisión - Seguramente, tras la regresión logística, los árboles de decisión sean el segundo algoritmo más usado, especialmente en contextos de marketing. Y sobre todo es debido a que la salida que generan, en forma de una serie de reglas si-entonces es fácilmente entendible por cualquier tipo de usuario final. No obstante no están exentos de problemas, que tendremos que conocer y saber cómo solventar.
  • SEMANA 11: Random Forest - Hasta ahora hemos visto dos algoritmos muy "de negocio" como son la regresión logística y los árboles de decisión. En el sentido de que son fácilmente comprensibles y su salida es muy interpretable. Pero creo que un data scientist debería complementar su repertorio también con algún algoritmo más del estilo "caja negra", que normalmente consiguen mejores resultados predictivos a cambio de que no podamos explicar en detalle lo que están haciendo. Uno de los más usados en la realidad son los Random Forest, que estudiaremos esta semana.
  • SEMANA 12: Explotación de los modelos desde el punto de vista de negocio - Esta semana nos centraremos mucho en la visualización y te enseñaré a crear una serie de gráficos con los que podrás poner en valor todo el trabajo que has realizado. También te enseñaré diferentes formas en las que se usa en la práctica el modelo generado para optimizar las campañas de venta cruzada, que era el objetivo de negocio de nuestro proyecto.
¿Por qué DS4B es diferente de cualquier otra formación que puedas hacer en Data Science o Machine Learning?
Básicamente, porque se centra en enseñarte a realizar un proyecto de forma real, con las cosas que pasan en los proyectos reales. Pero la mejor forma de que captes la diferencia es que veas una lección de muestra:
Y recuerda la garantía única de DS4B: puedes comprar hoy y acceder a todo el contenido del programa para ver si es para ti y si es lo que tú esperas. Y si no lo es, sólo tienes que mandarme un email durante los 15 primeros días solicitando el reembolso y te reintegro el 100%, sin preguntas
DS4B se va a convertir en la mejor comunidad formativa de Data Science en España, y sólo quiero dentro gente satisfecha al 300% que se conviertan en evangelizadores de la marca ¿Quieres ser uno de ellos desde el principio?
Yo no soy técnico: ¿Seguro que podré aprender?
El formato está pensado para empezar de cero. Obviamente tienes que estar dispuesto a querer aprender código. Pero si quieres hacerlo, gracias al uso de notebooks cualquier usuario no técnico con ganas de aprender puede hacerlo.
Yo sí soy técnico y ya sé algo de R: ¿Me aportará valor a mi?
El mayor valor del programa no está en programar en R que es algo que podrías aprender en muchos sitios. Si no en aprender la metodología a aplicar en situaciones reales, por qué hacerlo y cómo hacerlo. Pero por supuesto además aprenderás los paquetes más avanzados de R para Data Science como dplyr, tydyr, ggplot2, ...
Yo no trabajo en marketing: ¿Me servirá el curso?
La difernencia en DS4B es que aprendes haciendo un caso real de inicio a fin. En este programa el caso es de marketing, pero exactamente la misma metodología se utiliza en otros ámbitos como riesgos (probabilidad de impago), operaciones (mantenimiento preventivo), fraude (bloqueo de tarjetas), etc. Sí interiorizas la metodología sólo es cuestión de cambiar la variable target y el resto sirve al 100%.
¿Cómo es el formato del programa?
En cuanto realices la compra podrás acceder inmediatamente a todo el contenido del programa. A partir de un usuario y claves únicos para tí accederás a una plataforma online donde estarán todos los contenidos por tiempo ilimitado para que puedas completar el programa a tu ritmo, tardes 1 mes o 2 años.
¿Puedo descargar los videos?
Por razones de seguridad y copyright no se pueden descargar los videos. Pero como te comentaba antes estarán a tu disposición para siempre en la plataforma.
¿Puedo descargar el código?
Sí claro, además de ver el código en los videos podrás descargar un notebook con todo el proyecto para que puedas ir replicándolo sin esfuerzo o incluso usarlo en tus proyectos.
¿Y si veo que no es lo que yo necesito?
Pues solicitas la garantía: si en los primeros 15 días por cualquier motivo decides que no lo quieres sólo tienes que enviar un email a isaac@datascience4business.com y te reembolso el 100% del coste, sin preguntas ni explicaciones.
DS4B. Copyright 2019 Todos los derechos reservados