Describiendo las reglas del Lenguaje

Slides:



Advertisements
Presentaciones similares
Introducción a la Estadística
Advertisements

Introducción al Teorema de Gödel Eduardo Alejandro Barrio UBA - CONICET 2do Cuatrimestre de 2009 Eduardo Alejandro Barrio UBA.
Introducción al Teorema de Gödel Eduardo Alejandro Barrio UBA - CONICET 2do Cuatrimestre de 2009 Eduardo Alejandro Barrio UBA.
Principio de organicidad
Lenguaje Unificado de Modelado
Probabilidades.
La Investigación Cuantitativa y Cualitativa
Instituto tecnológico de Villahermosa
Selección del modelo adecuado
Conocimiento de la escala de probabilidad
UNIDAD I MODELOS Y TOMA DE DECISIONES
Lanzamiento de un dado Supongamos que lanzamos un dado sobre la mesa.
Tests de permutaciones y tests de aleatorización
La estructura de la oración Sintaxix Luis Villaseñor Pineda Laboratorio de Tecnologías del Lenguaje Coordinación de Ciencias Computacionales, Instituto.
Muestra: Recolección de Datos: Análisis de Datos:
MUESTRA Implica DEFINIR la unidad de análisis (personas, situaciones, individuos, eventos, fenómeno, ensayo)
Representación del Conocimiento
Tests de hipótesis Los tres pasos básicos para testear hipótesis son
Evaluación de los proyectos Método general. Evaluación de proyectos de inversión Todos los proyectos de inversión tienen características estructurales.
1 Planteamiento del problema ¿Tenemos los humanos la capacidad de percibir si nos miran desde atrás? O, más exactamente: ¿Es defendible que existen otras.
E Experimentos aleatorios. Espacio muestral
Método Científico.
Representación del conocimiento
Sesión 2: Teoría de Probabilidad “Considero que la probabilidad representa el estado de la mente con respecto a una afirmación, evento u otra cosa para.
ANALISIS DE DATOS CATEGORICOS
Representando para Aprender
Modelos Ocultos de Markov
Dr. Abner A. Fonseca Livias
Sesión 6: Campos de Markov
ERROR EN LA MEDIDA.
Teoría de Probabilidad
Distribuciones derivadas del muestreo
TEMA 5 PROBABILIDAD.
Control Estadístico de Procesos Introducción a la Probabilidad.
Conceptos Básicos de Probabilidad
Teoría de Probabilidad
Análisis Cuantitativo de Datos (Básico)
Sesión 2: Teoría de Probabilidad
Razonamiento probabilistico
Capítulo 1. Conceptos básicos de la Estadística
María Macías Ramírez y David Marín Pérez
ESTADISTICA I CSH M. en C. Gal Vargas Neri.
CONTENIDO: Estadística Descriptiva e inferencial Muestreo estadístico
Probabilidad y Estadística
Un panorama de conceptos probabilísticos
Sesión 2: Teoría de Probabilidad “Considero que la probabilidad representa el estado de la mente con respecto a una afirmación, evento u otra cosa para.
Métodos Cuantitativos
Probabilidades Objetivos de la clase Construidas definiciones básicas
Argumentos Deductivos e Inductivos
1º BACHILLERATO | Matemáticas © Oxford University Press España, S.A Hacer clic en la pantalla para avanzar EXPERIENTO ALEATORIO. SUCESOS Un experimento.
Profesora Carolina Mora La Investigación NO experimental es la búsqueda empírica y sistemática en la que el científico no posee control directo de las.
Estimación y contraste de hipótesis
RIESGO, RENDIMIENTO Y VALOR
Laboratorio de Estadística administrativa
UNIDAD 2: “Características del Modelado UML” CONTENDIDO Elaborado por: Ingeniero Harold Cabrera Meza Actualizado por: Ingeniero Nilson Albeiro Ferreira.
DISTRIBUCIÓN DE PLANTAS.
1 2  La Teoría de la Probabilidad constituye la base o fundamento de la Estadística, ya que las ingerencias que hagamos sobre la población o poblaciones.
EVALUACION Y RESULTADOS DEL PROYECTO DE INVESTIGACION
TEMA 5 PROBABILIDAD.
Matemáticas, juego,...fortuna: ¿Jugamos?
Tema : Probabilidad.
Jugadores de cartas. Caravaggio.
{ PRINCIPIOS LOGICOS Y RAZONAMIENTO E INFERENCIA. Presentado por el alumno: Miguel Armando Soto Orozco. Centro Cultural Universitario de cd. Cuauhtémoc,
PROBABILIDAD Y COMBINATORIA OBJETIVO: Comprender el concepto de probabilidad y caracterizar situaciones de probabilidad utilizando permutaciones, variaciones.
Presentación De UML Lenguaje estándar para escribir planos de software Se usa para visualizar, especificar, construir y documentar los artefactos de un.
II Unidad: introducción a las Probabilidades y modelos de probabilidad
Intervalos de Confianza M. C. José Juan Rincón Pasaye UMSNH – FIE Mayo de 2003.
Fue un matemático inglés que vivió en el siglo XVIII. El teorema nombrado en su honor describe las alternativas para calcular la probabilidad de que.
 Son los fundamentos que determinan ciertas reglas a seguir, para lograr la coherencia y sistematicidad de los pensamientos en las formas y contenidos.
Transcripción de la presentación:

Describiendo las reglas del Lenguaje Gramáticas Probabilísticas Luis Villaseñor Pineda Laboratorio de Tecnologías del Lenguaje Coordinación de Ciencias Computacionales, Instituto Nacional de Astrofísica, Óptica y Electrónica

¿Cómo construimos las reglas de un lenguaje? ¿Cómo un ser humano construye/descubre las reglas a partir de las cuales es posible generar expresiones en un lenguaje? Dos posibles respuestas: Tenemos un mecanismo innato, es decir, estamos predispuestos para aprender esas reglas Las aprendemos por contacto con ellas, el ambiente nos condiciona

¿Cómo construimos las reglas de un lenguaje? ¿Cómo un ser humano construye/descubre las reglas a partir de las cuales es posible generar expresiones en un lenguaje? Dos posibles respuestas: Tenemos un mecanismo innato, es decir, estamos predispuestos para aprender esas reglas Las aprendemos por contacto con ellas, el ambiente nos condiciona Probablemente es una mezcla de ambos !!

¿y para una máquina? La creación cuidadosa de un conjunto de reglas completo cubriendo todas las posibilidades del lenguaje parece imposible!! Otro enfoque es la posibilidad de aprender las reglas, inducirlas, a partir de corpus (cuidadosamente anotados) trabajo arduo, lento y costoso

Lo mejor de los dos mundos Utilizando un formalismo como CFG y agregando elementos para la correcta asociación de los constituyentes a través de sus probabilidades Próximas diapositivas tomadas de Probabilistic Linguistics, R. Bod, J. Hay, S. Jannedy, MIT Press

Breve recordatorio … Dos interpretaciones de la probabilidad: Objetiva – la probabilidad de un fenómeno es una medida de su frecuencia relativa a través de un experimento Subjetiva – es el grado de creencia de un observador respecto a cierto fenómeno P(A) = |A| / |O| |A| = número de muestras del evento A |O| = espacio total del espacio de muestras

Ejemplo Tenemos un corpus de 50 palabras (no ambiguas), 25 nombres 20 verbos 5 adjetivos ¿Cuál es la probabilidad de seleccionar un verbo?

Frecuencia relativa La frecuencia relativa de un evento converge a su verdadera probabilidad cuando el número de experimentos se incrementa. Dado un documento ¿cuál es la probabilidad de que una palabra sea la palabra “de”?

Probabilidad condicional Joint probability ¿cuál sería la probabilidad de que al tomar dos palabras tomáramos una nombre y un verbo? P({nombre} ∩ {verbo}) = P({nombre}) * P({verbo}) Suponemos que se trata de de eventos independientes Conditonal probability ¿cuál es la probabilidad de que al tomar dos palabras consecutivas tomemos primero un nombre y luego un verbo? P(B|A) = P(A|B) / P(A)

Modelo de Markov Generalizando P(A,B,C) = P(A) x P(B|A) x P(C|A,B) Suponiendo que el evento sólo depende del evento inmediatamente anterior P(A1,A2,…,An) = P(A1) x P(A2|A1)x … x P(An|An-1) Tenemos un modelo de markov de primero orden

Gramática probabilística Necesitamos un corpus Treebank / anotando claramente las características que deseamos capturar Las reglas que deseamos aprender Entonces ¿las reglas están predeterminadas?

Treebank ejemplo

Conteo de reglas

Probabilidades de las reglas

Calculando las probabilidades de una derivación

Sin embargo… Suponer que las reglas son independientes no es del todo adecuado Buzzing bees Diferentes enfoques han sido propuestos History-based grammars Head-lexicalized probabilistic grammars Probabilistic lexicalized tree-adjoning grammars DOP Data-oriented parsing

DOP Tenemos una gramática de substitución de árboles probabilísticos No son reglas sino árboles los elementos básicos No existen restricciones sobre el tamaño o tipo de nodos en los árboles

Treebank ejemplo DOP

Árboles posibles

Operación de base Substitución de nodos

Probabilidad de una derivación A diferencia de otras gramáticas, en ésta existen muchas derivaciones posibles

Algunas derivaciones

La probabilidad de una derivación Es la suma de las probabilidades de todas las posibles derivaciones Mientras más evidencia tenemos de cómo se relacionan las palabras más probabilidad de obtener el árbol correcto No interesan los pasos intermedios, el árbol final es lo importante!!

Evidencia psicolingüística No únicamente orientamos nuestro léxico También las relaciones entre él “vete al …” El lenguaje no es estático se “mueve” según entramos en contacto con diferentes ambientes Entendemos mejor algunas cosas que otras Por el lenguaje (palabras y sus relaciones) que conocemos Por el lenguaje que escuchamos