Naïve Bayes MC BEATRIZ BELTRÁN MARTÍNEZ. Primavera 2016 MC BEATRIZ BELTRÁN MARTÍNEZ 78 Introducción Es un método que no sólo porque ofrece un análisis.

Slides:



Advertisements
Presentaciones similares
Elaborado por: MCE. Alejandra Vega. Después de haberse preguntado qué investigar se debe inquirir ahora ¿cuál es la solución probable a la pregunta planteada?
Advertisements

METODOLOGÍA DE INVESTIGACIÓN Titular: Agustín Salvia
Universidad de Puerto Rico en Humaco Departamento de Administración de Empresas Curso de Investigación CAPÍTULO I Introducción Paso 2 – Planteamiento del.
El Perceptrón  El psicólogo Frank Ronsenblant desarrolló un modelo simple de neurona basado en el modelo de McCulloch y Pitts que utilizaba.
Métodos gráficos de control
Tema 2: Métodos de ajuste
RECONOCIMIETO DE PATRONES
Tests de hipótesis Los tres pasos básicos para testear hipótesis son
INTELIGENCIA ARTIFICIAL.
Probabilidad Total Teorema de la probabilidad total
Matemáticas Acceso a CFGS
Apuntes 1º Bachillerato CT
Clases 4 Pruebas de Hipótesis
E Experimentos aleatorios. Espacio muestral
CONTRASTE Y VALIDACIÓN DE UN MODELO
Sesión 6: Campos de Markov
CLASE 3 - Probabilidad condicional Independencia de sucesos
Introducción La inferencia estadística es el procedimiento mediante el cual se llega a inferencias acerca de una población con base en los resultados obtenidos.
Universidad Nacional de Colombia Curso Análisis de Datos Cuantitativos.
A  Percentil al 68.3%,  :  P(x) dx =  
ANÁLISIS DE DATOS PROBABILIDAD Aplicación : Prueba diagnóstica Deseamos estudiar una prueba o test para diagnosticar una enfermedad (ej. Elisa): Sea los.
Razonamiento probabilistico
Capítulo 1. Conceptos básicos de la Estadística
Tomando decisiones sobre las unidades de análisis
CLASE 52. D D q q r r d d = = 4 4  r r D D = = q q  d d  r  d 0  r  d 5 5.
Aspectos generales de la investigación educativa en el SNIT

INFERENCIA ESTADÍSTICA
PROBABILIDAD CONDICIONAL Y TEOREMA DE BAYES
Instituto de Nivel Terciario Profesor: ¨Eduardo A. Fracchia¨ Integrantes: Marianela Ramírez. Uliambre Carlos. Farana Marisel. Integrantes: Marianela Ramírez.
Máster en Planificación Estratégica en Publicidad y RRPP TRABAJO FINAL DE MÁSTER TFM Estructura.
REGRECION LINEAL SIMPLE, MULTIPLE Y CORRELACION. REGRECION LINEAL SIMPLE.
Page 1 Ciclo de Estructuras de Repetición Carlos Bautista García Unidad VI PROG 2270L.
Un criterio para detectar outliers. Otro criterio para detectar errores groseros (outliers)
Danny Rafael Amaya Cotes Marcos Elías López Guerra.
TEORÍA DEL MUESTREO El muestreo implica seleccionar a un grupo de personas, acontecimientos u otros elementos que usamos para dirigir un estudio. Se espera.
DISEÑOS CUASI EXPERIMENTALES
Clasificación Clasificadores Bayesianos. Modela relaciones probabilisticas entre el conjunto de atributos y el atributo clase Probabilidad condicional:
Robótica Móvil CC5316 Clase 13: EKF y UKF Semestre Primavera 2012 Profesor: Pablo Guerrero.
VERIFICACIÓN DEL SUPUESTO: DE IGUALDAD DE VARIANZAS: OBSERVACIÓN GRÁFICA Y PRUEBA DE BARTLETT.
Cristina. Derivada del término en latín variabilis, variable es una palabra que representa a aquello que varía o que está.
La estadística descriptiva es la ciencia de analizar y comprar datos por medio de tablas las cuales después se grafican lo que permite realizar una descripción.

Diagramas de control CONSIDERACIONES BÁSICAS. DIAGRAMAS DE CONTROL  El Control Estadístico de Proceso (Statistical Process Control SPC) es la herramienta.
Qué es una variable Una variable es cualquier entidad que puede tomar diferentes valores. Es decir, una variable es una característica de un individuo.
Concepto La Criminología trabaja con comunicaciones orales o escritas (discursos, entrevistas, artículos de periódicos, emisiones, etc.) Para que el investigador.
HIPOTESIS DE INVESTIGACIÓN
ESTUDIOS TRANSVERSALES CORRELACIONALES LINDA BARRAZA FABIAN BELEÑO WILLIAM MORENO DANIELA NÚÑEZ JOHANN PERRET GENTIL DIEGO VASQUEZ.
Carlos A. Andújar Rojas, Ph.D. 1. Razonamiento estadístico  Es el proceso por el que se utiliza la lógica para tratar de describir, explicar, predecir.
LA METODOLOGIA BOX-JENKINS
UNIVERSIDAD CATOLICA DEL TACHIRA FACULTAD DE CIENCIAS ECONOMICAS Y SOCIALES ESCUELA DE ADMINISTRACION Y CONTADURIA PUBLICA GERENCIA DE RECURSOS HUMANOS.
Rodrigo Ferrer Urbina Universidad de Tarapacá.  ¿Qué es? ◦ Un conjunto de procedimientos.  ¿Qué hacen? ◦ Resumir y organizar información.  ¿Para que?
Tema 5: Interpolación Indice Introducción.
Métodos para determinar la demanda Método cualitativo este se basa más en técnicas subjetivas basadas en juicios de la persona que realiza la estimación.
MSc. Daisy Espallargas Ibarra

DISTRIBUCIONES DE PROBABILIDAD Por Jorge Sánchez.
CLARA ESPINO..  Representan los posibles resultados de un experimento aun no realizado, o los posibles valores de una cantidad cuyo valor actualmente.
LA INVESTIGACIÓN CUALITATIVA Dra. Maribel Urribarrí Vázquez Maracaibo, Mayo del 2014 Universidad Nacional Abierta Dirección de Investigaciones y Postgrado.
Marco Teórico Referencial
1.2 Obtención y análisis de requerimientos Requerimiento Atributo o característica que describe el comportamiento de un sistema. Los requerimientos especifican.
Se basa en el modo como el investigador utiliza su propia observación de la realidad social que quiere estudiar En criminología la observación es generalmente.
APLICACIONES TAI EN TELEFORMACIÓN. ¿Qué es la teleformación? La Teleformación o el e-learning permite realizar acciones formativas a través de Internet.
Taller introducción a los conceptos básicos de Estadística PRIMERA PARTE 2016 Propósito: Introducir algunos conceptos básicos de Estadística por medio.
Paola arias Estadística II.  Fue descrita en 1908 por William sealy gosset  Es una distribución de probabilidad que se emplea comúnmente cuando tenemos.
Alcance y Tipos de Investigación. Tipos de investigación De acuerdo al objetivo y al alcance que tenga una investigación es posible identificar y definir.
JUAN DANIEL TOVAR VILLALOBOS C.I V Universidad Nacional Abierta Especialización en Derechos Humanos Maracaibo, Estado Zulia.
Estadística y Biometría Modelación Estadística Regresión lineal.
La operación inversa de la derivación
Regresión y Correlación Múltiple: Prueba de hipótesis.
Transcripción de la presentación:

Naïve Bayes MC BEATRIZ BELTRÁN MARTÍNEZ

Primavera 2016 MC BEATRIZ BELTRÁN MARTÍNEZ 78 Introducción Es un método que no sólo porque ofrece un análisis cualitativo de las atributos y valores que pueden intervenir en el problema, sino porque da cuenta también de la importancia cuantitativa de esos atributos. En el aspecto cualitativo se puedes representar cómo se relacionan esos atributos ya sea en una forma causal, o señalando simplemente de la correlación que existe entre esas variables (o atributos).

Primavera 2016 MC BEATRIZ BELTRÁN MARTÍNEZ 79 Introducción Cuantitativamente (y ésta es la gran aportación de los métodos bayesianos), da una medida probabilística de la importancia de esas variables en el problema (y por lo tanto una probabilidad explícita de las hipótesis que se formulan).

Primavera 2016 MC BEATRIZ BELTRÁN MARTÍNEZ 80 Características Cada ejemplo observado va a modificar la probabilidad de que la hipótesis formulada sea correcta (aumentándola o disminuyéndola). Es decir, una hipótesis que no concuerda con un conjunto de ejemplos más o menos grande no es desechada por completo sino que lo que harán será disminuir esa probabilidad estimada para la hipótesis.

Primavera 2016 MC BEATRIZ BELTRÁN MARTÍNEZ 81 Características Estos métodos son robustos al posible ruido presentes en los ejemplos de entrenamiento y a la posibilidad de tener entre esos ejemplos de entrenamiento datos incompletos o posiblemente erróneos. Los métodos bayesianos permiten tener en cuenta en la predicción de la hipótesis el conocimiento a priori o conocimiento del dominio en forma de probabilidades. El problema puede surgir al tener que estimar ese conocimiento estadístico sin disponer de datos suficientes.

Primavera 2016 MC BEATRIZ BELTRÁN MARTÍNEZ 82 Clasificación de patrones Dado un conjunto de datos (divididos en dos conjuntos de entrenamiento y de test) representados por pares, el problema consiste en encontrar una función f(x) (llamada hipótesis) que clasifique dichos ejemplos. La idea de usar el teorema de Bayes en cualquier problema de aprendizaje automático, es que se puede estimar las probabilidades a posteriori de cualquier hipótesis consistente con el conjunto de datos de entrenamiento para así escoger la hipótesis más probable.

Primavera 2016 MC BEATRIZ BELTRÁN MARTÍNEZ 83 Clasificador basado en Naïve Bayes Dado un ejemplo x representado por k valores el clasificador Naïve Bayes se basa en encontrar la hipótesis más probable que describa a ese ejemplo. Si la descripción de ese ejemplo viene dada por los valores, la hipótesis más probable será aquella que cumpla:

Primavera 2016 MC BEATRIZ BELTRÁN MARTÍNEZ 84 Clasificador basado en Naïve Bayes

Primavera 2016 MC BEATRIZ BELTRÁN MARTÍNEZ 85 Clasificador basado en Naïve Bayes

Primavera 2016 MC BEATRIZ BELTRÁN MARTÍNEZ 86 Clasificador basado en Naïve Bayes

Primavera 2016 MC BEATRIZ BELTRÁN MARTÍNEZ 87 Teorema de Bayes Donde: ◦P(h) es la probabilidad a priori de la hipótesis h. ◦P(D) es la probabilidad de observar el conjunto de entrenamiento D. ◦P(D|h) es la probabilidad de observar el conjunto de entrenamiento D en un universo donde se verifica la hipótesis h. ◦P(h|D) es la probabilidad a posteriori de h, cuando se ha observado el conjunto de entrenamiento D.

Primavera 2016 MC BEATRIZ BELTRÁN MARTÍNEZ 88 Teorema de Bayes

Primavera 2016 MC BEATRIZ BELTRÁN MARTÍNEZ 89 Teorema de Bayes

Primavera 2016 MC BEATRIZ BELTRÁN MARTÍNEZ 90 Ejemplo Un test de laboratorio ha dado positivo. Cuando el paciente está enfermo el test lo detecta en un 98% de los casos. Si el paciente no tiene cáncer, el test da un 3% de falsos positivos. Sólo el 0.8% de las personas están enfermas. P(enfermo) = 0.008P(¬enfermo) = P(+|enfermo) = 0.98P(-|enfermo) = 0.02 P(+|¬enfermo) = 0.03P(-|¬enfermo) = 0.97

Primavera 2016 MC BEATRIZ BELTRÁN MARTÍNEZ 91 Ejemplo Aplicando MAP para ¬enfermo en caso de que el test sea positivo: P(+|enfermo) * P(enfermo) = 0.98 * = P(+|¬enfermo) * P(¬enfermo) = 0.03 * = Normalizando

Ejemplo X1X2X3Y P(Y= 0) = 3/7 P(Y = 1) = 4/7 A que clase será asignado el registro (X 1 =0,X 2 =0,X 3 =1)? P(X 1 =0,X 2 =0,X 3 =1|Y=0) = P(x 1 =0|Y=0)P(X 2 =0|Y=0)P(x 3 =1|Y=0) = (2/3)(1/3)(1/3) = 2/27 P(X 1 =0,X 2 =0,X 3 =1|Y=1) = P(x 1 =0|Y=1)P(X 2 =0|Y=1)P(x 3 =1|Y=1) = (2/4)(2/4)(3/4) = 12/64 = 6/32 = 3/16

Ejemplo Como (3/7)(2/27) < (4/7)(3/16) entonces (X 1 =0, X 2 =0, x 3 =1) será asignado a la clase 1. Si el objeto esta asignado a la clase 0 entonces NB comete un error.