Diplomado en Data Mining

El Data Mining o minería de datos es el proceso de analizar gran cantidad de información, proveniente de las bases de datos de gran tamaño, para descubrir o identificar patrones que muchas veces no son evidentes a simple vista. Estos patrones revelan información para entender comportamientos y predecir acciones.

DIPLOMADO EN DATA MINING

diplomado-en-data-mining
  •  Inicio: 15 Enero 2019

  •  Duración: 160 Horas

  •  Modalidad: 100% online

Diplomado en Data Mining

El Data Mining o minería de datos es el proceso de analizar gran cantidad de información, proveniente de las bases de datos de gran tamaño, para descubrir o identificar patrones que muchas veces no son evidentes a simple vista. Estos patrones revelan información para entender comportamientos y predecir acciones.

Esta disciplina involucra la informática, la estadística y la documentación en una integración de técnicas actualizadas, para procesar y analizar gran cantidad de datos existentes, los cuales ya han sido recopilados estructurados y organizados.

Por ejemplo, podríamos tener una situación real y simplificada en un hospital. En este se recopila información de todos los pacientes, entre las que se encuentran la edad, la cantidad de glóbulos blancos y los índices de azúcar. Aplicando las técnicas de minería de datos predictiva, se podrían establecer estados informativos de cada paciente, en cuanto a edad, promedio de cantidad de glóbulos blancos, e índices de azúcar baja o alta.

Con esta información se puede determinar aproximadamente el estado de salud del paciente y determinar si está desarrollando diabetes, y así poder actuar preventivamente.

En cuanto al ámbito económico, el cual se hace cada día más dinámico, las empresas, organizaciones y consorcios deben tomar decisiones oportunas y acertadas para llegar a sus clientes y seguir creciendo. Estas organizaciones,  usan la minería de datos como herramienta para lograr los objetivos de negocios.

Diplomado en Data Mining

El Diplomado en Data Mining ofrece la oportunidad de adquirir los conocimientos y habilidades para abordar las últimas tendencias en métodos y técnicas descriptivas y predictivas necesarias que permitirán identificar, extraer, consolidar, analizar, gestionar, modelar de forma eficaz y ágil patrones e información del Análisis de Negocio, utilizando para ello, la herramienta RStudio y el lenguaje de programación R.

Acelere su carrera y domine las áreas clave necesarias para el éxito en Data Mining. Conviértase en un profesional internacional que pueda impulsar la innovación en cualquier organización.

Profesionales relacionados con las áreas Tecnologías de Información, consultores de Business Intelligence y Bases de Datos, de marketing e investigación de mercados, análisis financiero y gestión del riesgo, economistas, administradores, contadores, econometristas, actuarios, entre otros. Este curso está diseñado para el desarrollo del perfil de analistas de información con conocimientos básicos de estadística, que necesiten manejar y analizar enormes volúmenes de información para obtener conocimiento oculto del comportamiento de su negocio.

Para postularse a este programa, es necesario:

  • Tener estudios o experiencia en Análisis de datos
  • Tener conocimientos básicos estadística, gestión de datos y procesos de Inteligencia de Negocios
  • Consignar Currículum Vitae

La universidad Central de Venezuela  otorgará el Diploma en Minería de Datos a quienes hayan aprobado el programa, caso contrario se entregará una constancia de participación a los alumnos que hayan desarrollado al menos el del 80% del total del programa.

 

UCV_DIPLOMA1

ucv_diploma2

La finalidad de este programa es proporcionar un adecuado enfoque metodológico que le permita participantes concebir, diseñar, gestionar y liderar proyectos en el área de Minería de Datos.

Al finalizar el diplomado, los participantes estarán en capacidad de:

  • Liderar ó ejecutar proyectos de Minería de Datos. Identificar y aplicar metodologías, técnicas y herramientas adecuadas para el desarrollo de soluciones de análisis avanzado de datos para el apoyo a la toma de decisiones.
  • Desarrollar instrumentos de análisis avanzado para la reproducción de operaciones complejas sobre grandes volúmenes de datos y su integración con los sistemas operacionales de la organización.
  • Estar en la capacidad de identificar y seleccionar los métodos más adecuados para el tratamiento de determinados tipos de problemas, así como su calibración para obtener los mejores resultados.
  • Descubrir, interpretar y analizar nuevos patrones, de forma de poder proponer estratégicas para maximizar su aprovechamiento en las organizaciones.

El diseño del programa está orientado a presentar al participante una modalidad que le permita la reflexión y proponga la integración teoría-práctica como idea general y fuerza del proceso que plantea optimizar el tiempo de aprendizaje introduciéndolos en los conceptos y fundamentos del Data Mining. Esto se logrará suministrando a los participantes una integración de conocimientos que lo prepare en todos los métodos, protocolos y aplicaciones a problemas reales del descubrimiento de patrones de comportamiento y el analisis de datos.

El Diplomado en Data Mining está constituido por tres (03) módulos  y un proyecto final, el cual es de entrega obligatoria para la validación de conocimientos y aprobación del programa.

Metodologías y estándares. Identificación de las fuentes de datos. Herramientas para el desarrollo. Introducción a la programación en R. Gestión y Visualización de datos.

  • Definiciones básicas
    • Conceptos
    • Relación con otras disciplinas
    • Aplicaciones y ejemplos
    • Objetivos de la minería
    • Patrones
    • Modelos
  • Áreas de aplicación y ejemplos
    • Ejemplos de aplicación en varias áreas
    • Tareas de minería de datos para construir modelos
  • Metodologías y estándares
    • Proceso KDD
    • Metodología CRISP-DM
  • Características de los datos
    • Fuentes de datos
    • Conjuntos de datos
  • Caja de herramientas
  • Introducción al lenguaje R
  • Generación de números aleatorios
  • Programación vectorial e indexación lógica
  • Familia de funciones applay
  • Visualización de los datos
  • Persistencia de datos y modelos
  • Selección de atributos
  • Pre-procesamiento y limpieza
  • Problema de la dimensionalidad
  • Extracción de características
  • Tipos de métodos en Minería de Datos
  • Análisis exploratorio de datos
  • Mapa de correlaciones
  • Modelos estadísticos
  • Bondad de ajuste
  • Análisis de Componentes Principales (PCA)
    • Plano principal
    • Relación entre variables
    • Calidad de la representación
    • Reducción de la dimensionalidad con el PCA
  • Identificación de conglomerados
    • La Inercia y el teorema de Fisher
    • Cálculo de la distancia
    • Estimación del número de grupos
    • Arboles de Clasificación Jerárquica
    • Método de nubes dinámicas con K-medias
    • Paralelizando el método de K-medias

Métodos de clasificación. Calibración y selección de modelos.

  • Definiciones de clasificación
  • Problema de separabilidad
  • Uso de funciones Kernel
  • Entrenamiento y testing
  • Medidas de calidad
    • Cálculo de errores. Matriz de confusión
    • Curvas ROC
  • Métodos de clasificación
    • Análisis discriminante
    • Análisis discriminante cuadrático
    • Método Bayesiano ingenuo
    • Regresión logística
    • Método de K-vecinos más cercanos
    • Máquinas de Soporte Vectorial (SVM)
    • Arboles de decisión
    • Bosques aleatorios
    • Redes neuronales
  • Evaluación de los métodos
  • Problemas del uso de conjuntos de entrenamiento y testing
  • Sobre ajuste o especialización
  • Validación cruzada
  • Calibración de los métodos
    • Calibración del K-medias
    • Calibración del SVM

Formulación, diseño y ejecución de un proyecto de Minería de Datos, bajo en enfoque de Prueba de Conceptos en el cual se debe cubrir de manera integral todos los contenido ofrecidos en el programa.

  • Módulo I: Asignaciones/Quices. Valor: 15% (03) puntos.
  • Módulo II: Asignaciones/Quices. Valor: 15% (03) puntos.
  • Módulo III: Asignaciones/Quices. Valor: 20% (04) puntos.
  • Primer avance de proyecto. Valor: 10% (02) puntos.
  • Segundo avance de proyecto. Valor: 10% (02) puntos.
  • Proyecto final: 30%  (06) puntos.

Total: 20 puntos.

La plataforma de DiplomadosOnline.com permite definir y desarrollar una metodología de trabajo colaborativa y participativa, adaptada a las exigencias del mercado y la sociedad, la cual garantiza la misma calidad formativa que se obtiene en formato presencial, con un enfoque flexible e innovador que rompe con las barreras geográficas y la incompatibilidad de horarios, permitiendo una optimización del tiempo.

Los objetivos de aprendizaje se alcanzan mediante el desarrollo semanal de píldoras de conocimientos, asignaciones  y la interacción entre alumnos y profesores en un continuo flujo de comunicación que genera constantes estímulos en el transcurso del proceso formativo, por lo que nuestra metodología de trabajo facilita el aprendizaje de cada alumno, que avanza de forma planificada en un entorno de relaciones online.

Claves del éxito de nuestros programas online:

PILDORAS-DE-CONOCIMIENTO-150x150[1]Son recursos novedosos que instrumentan cada tópico del programa en un formato integrado de recursos didácticos audiovisuales, tales comos: videos formativos, demostraciones, guías de estudio, mapas conceptuales, publicaciones en blogs, casos de estudio, infografías, tutoriales, autoevaluaciones, entre otros. Estos recursos, fuertemente relacionados, se complementan y se planifican semanalmente para un desarrollo del aprendizaje significativo.

ACOMPAÑAMIENTO-CONTINUO_1-150x150[1] La metodología exige y fomenta un intercambio constante de información y comunicación entre los participantes y los docentes. Los profesores, especialistas en su área de actuación y en la metodología online, tienen un triple papel de educador, facilitador y tutor, trabajando activamente en la consecución de los objetivos de enseñanza-aprendizaje y motivación, propuestos en el programa. Los recursos técnicos y las actividades propuestas generan un entorno para que los alumnos se sientan libres de participar y compartir sus experiencias.

El desarrollo del programa responde a una rigurosa planificación, con la ventaja de que las relaciones son básicamente asíncronas, y cada alumno lo puede realizar en el momento del día que le resulte más conveniente.  El seguimiento de cada estudiante es constante, con el objeto de acompañar y sostener el éxito del proceso. Se realizan de manera constante casos prácticos que aportan al alumno, además de unos sólidos fundamentos teóricos, una comprensión práctica y una relación constante y dinámica con compañeros y los profesores.

Sesiones online con clases expositivas, sesiones de discusión en que el profesor actuará como moderador de los debates o interrogantes en los foros que se puedan generar, laboratorios online para utilizar las herramientas expuestas en el programa, Seminarios web de casos de aplicaciones reales, entre otros.

Cada alumno debe realizar un proyecto, con el objetivo de aplicar los conocimientos adquiridos durante el programa, liderado por un tutor, centrada en un caso de estudio dentro de tu organización. Nuestro equipo de profesionales te apoyará de manera continua, mediante un sistema integrado de recomendaciones, para lograr tus objetivos de manera satisfactoria.

“DiplomadosOnline.com, un método para aprender haciendo”.


Este programa está orientado al desarrollo de casos prácticos utilizando la herramienta RStudio y el lenguaje de programación R, abarcando todas las fases del ciclo de vida de un Proyecto de Data Mining.

¿Por que aprender R?

Las siguientes noticias y opiniones no muestran algunas de las razones por las que pensamos que aprender R, es la decisión correcta a la hora de seleccionar una herramienta para emprender proyectos en el área de la Ciencia de Datos:

  1. El Heartland Bank de Nueva Zelanda ha reemplazado su servidor SAS por un servidor R.
  2. SAS ya integra el lenguaje R dentro de su sistema SAS/IML® Studio.
  3. Las grandes casas de software incorporan R dentro de sus plataformas de procesamiento de datos masivos como motor de sus aplicaciones analíticas, como por ejemplo:
  4. R encabeza el grupos de las 10 herramientas más utilizadas para el análisis predictivo, software de minería de datos y Ciencia de datos según la encuesta de KDnuggets en 2015.
  5. R es el lenguaje con la mayor cantidad de herramientas y extensiones para el análisis de datos.
  6. R cuenta con más de 10000 paquetes o extensiones para todas las areas del análisis de datos.
  7. R es el lenguaje con las mayores capacidades en visualización gráfica.
  8. R es el lenguaje de más rápido crecimiento en Stack Overflow.
  9. R sobrepasa a SAS en su uso en artículos académicos.
  10. R sube al puesto 5 en el tercer ranking anual del 2016 de la IEEE Spectrum, solo por debajo de los principales lenguajes de propósito general.
  11. R sube al puesto 12 en el 2016 en el ranking general de lenguajes de programación según Redmonk.
  12. En 20152014 y 2013 R fue el lenguaje más utilizado para tareas de análisis de datos, la minería de datos y ciencia de datos según kdnuggets.com.
  13. R es la herramienta favorita utilizada por los participantes de las famosas competencias de Ciencia de datos de Kaggle.
  14. Aprender R es parte de las estrategias recomendadas para convertirse en un científico de datos.
  15. La demanda de cientificos de datos llegará a 4.4 millones en 2015 segun gartner. Latinoamerica tendrá casi un millon de dichos expertos.
  16. El ciencia de datos es uno de los trabajos mejor pagados en el sector TIC según la encuesta anual de KdNuggets del 2015.

“DiplomadosOnline.com, un método para aprender haciendo”.

JoseSosaBDMD[1]

Prof. Jose Rafael Sosa

Lic. en Computación, Universidad Central de Venezuela. Docente de Probabilidad y Estadística, Ciencia de Datos y Minería de datos, Universidad Central de Venezuela. Ocupó los cargos de Presidente del Centro Nacional de Tecnologías de Información (CNTI) y  Centro Nacional de Innovación Tecnológica (CENIT).

Avalado por la Universidad Central de Venezuela

Formulario de solicitud de información