Guillermo Jorge-Botana Ricardo Olmos Albacete José A. León

Slides:



Advertisements
Presentaciones similares
LOGARITMOS.
Advertisements

ANÁLISIS ESTADÍSTICO COMPUTARIZADO
ESTADISTICA A ESTADISTICA A UNMSM - FQIQ
Tasa de variación media de una función
EL ROBOTICA DE Y ARTIFICIAL DEL INTELIGENCIA
MOVIMIENTO JOVENES DE LA CALLE CIUDAD DE GUATEMALA la storia la historia lhistoire the history strada calle rue street.
DATSI, FI, UPM José M. Peña Programación en C DATSI, FI, UPM José M. Peña Programación en C.
Algoritmos y Programas
Vera Olivera, David Carlos Marín Rosales, Nicolae Harry
1 LA UTILIZACION DE LAS TIC EN LAS PYMES GALLEGAS AÑO Resumen. 24 de Junio de 2005.
Herramientas informáticas
Microsoft Office System Planificando la estructura de su información usando Microsoft SharePoint Portal Server 2003 José Alberca Acosta Consultor
Cuestiones y problemas
Ingeniería de Requerimientos. El Metodo VORD. Alvaro Ortas.
Resultado 1.3 con actividad 1.3.1
TECNICATURA UNIVERSITARIA EN INFORMATICA
Tema Algoritmos Universidad Politécnica de Nicaragua UPOLI.
Funciones: límites y continuidad
Otra forma es representando lo que hay de cada lado
COMUNICACIÓN: LENGUAJE Y COMUNICACIÓN
Unidad de competencia II Estadística descriptiva:
Evaluaciones de Sistemas de Administración de la Seguridad SMSA
Hermenéutica Y leían en el libro de la ley de Dios claramente, y ponían el sentido, de modo que entendiesen la lectura. --Nehemías 8:8.
EVALUACIÓN AUTÉNTICA.
Funciones Continuas. Contenidos Definición de Continuidad Funciones Discontinuas Teoremas Ejemplos.
Teoría del Conocimiento
DESCRIPCION DE SISTEMAS
Elaboración de Planes de trabajos para Proyectos Informáticos
Resolución de Problemas
La educación basada en competencias
Coincidencia de imagen a través de cadena de triángulos
TEORÍA DE CONJUNTOS.
INTEGRACIÓN.
Ontologías y Bases de Datos
Presentación del programa
Direcciones, Arreglos y Argumentos de Funciones
Propiedades textuales
Combinadores SK.
Control de un vehículo aéreo no tripulado
Comité Nacional de Información Bogotá, Mayo 30 de 2011 Consejo Nacional de Operación de Gas Natural 1 ESTADISTICAS NACIONALES DE OFERTA Y DEMANDA DE GAS.
Comité Nacional de Información Bogotá, Octubre 24 de 2011 Consejo Nacional de Operación de Gas Natural 1 ESTADISTICAS NACIONALES DE OFERTA Y DEMANDA DE.
Comité Nacional de Información Bogotá, Julio 21 de 2011 Consejo Nacional de Operación de Gas Natural 1 ESTADISTICAS NACIONALES DE OFERTA Y DEMANDA DE GAS.
Comité Nacional de Información Bogotá, Julio 27 de 2011 Consejo Nacional de Operación de Gas Natural 1 ESTADISTICAS NACIONALES DE OFERTA Y DEMANDA DE GAS.
Comité Nacional de Información Bogotá, Febrero 11 de 2011 Consejo Nacional de Operación de Gas Natural 1 ESTADISTICAS NACIONALES DE OFERTA Y DEMANDA DE.
1 UNIVERSIDAD NACIONAL AUTONOMA DE MEXICO FACULTAD DE QUIMICA COORDINACION DE ACTUALIZACION DOCENTE COLEGIO DE CIENCIAS Y HUMANIDADES PLANTEL AZCAPOTZALCO.
EXPRESIONES RACIONALES
¿QUÉ SE EVALUA EN EL AREA DE MATEMATICAS?
3. INTRODUCCIÓN A LA PROGRAMACIÓN
1 Alumno: Javier Insa Cabrera Director: José Hernández Orallo 23 de septiembre de 2010.
El lenguaje de los textos técnico-científicos
Números enteros.
Sistemas Basados en conocimientos
Observa detenidamente estas figuras , agrupándolas como prefieras anotando el número correspondiente
IV Seminario Nacional Investigación y Publicación Científica Resúmenes
BUSQUEDA EN JUEGOS DE ADVERSARIO Sección 1-4
Evaluaci ó n Modelizaci ó nTareas ClasesEvaluaci ó n Reflexi ó n.
DECISIONES GRUPALES.
Análisis Diseño y Desarrollo
Metodología Investigación Científica
ESTÁTICA II FUERZAS DISTRIBUIDAS: CENTROIDES Y CENTRO DE GRAVEDAD.
DIRECCIÓN GENERAL DE INVESTIGACIÓN E INFORMACIÓN AMBIENTAL - DGIIA
Desempeño escolar de los alumnos
La interdisciplinariedad.
PROF. HIPOLITO BELLO GARCIA
Isabel Edo del Moral Susana Fernández LLoria Patricia Moraga Barrero
APLICACIONES DE LA LINGÜÍSTICA COMPUTACIONAL (I)
LÓGICA DE PROGRAMACIÓN LSC. Susana Alejandra López Jiménez.
DIMENSIÓN SEMÁNTICA.
Introducción a UML DIAGRAMA DE CLASES Departamento de Informática
Ing. José David Ortiz Salas
Transcripción de la presentación:

VARIANTES A LA EXTRACCIÓN DE VECINOS SEMÁNTICOS Y AL ALGORITMO DE PREDICACIÓN EN CORPUS CIENTÍFICOS Guillermo Jorge-Botana Ricardo Olmos Albacete José A. León Francisco Molinero

1. ¿Qué hace LSA? LSA puede: +simular como puede estar representado el conocimiento

2. ¿Qué no hace LSA? Pero: +No es una teoría de procesamiento (Burguess, 2000) +Es una representación estática de cómo se distribuye el conocimiento +Para simular cualquier proceso: Como: Juicios de semejanzas Comprensión de estructuras textuales Constricciones del contexto +Es necesario formalizar algún tipo de operación sobre lo que LSA representa.

3. Objetivos +Extraer términos vecinos de algunas palabras aisladas (estructura simple) y grupos de palabras (estructura compleja). +Aplicar el algoritmo de predicación (Kintsch, 2001) a ciertas estructuras frecuentes en corpus científicos.

4. Extracción de contenidos Una forma: + Tomar el vector de una palabra y extraer una lista de sus n primeros vecinos semánticos. + Lista: se compara el vector de dicha palabra con todos los demás vectores-términos del espacio semántico. + Comparación: coseno del ángulo µ A Semejanza = Cos(A,I) I

5. Extracción de contenidos Un posible problema: + En ocasiones, los primeros términos de la lista son: Términos de poca relevancia Que sólo concurren con el término de referencia Ejemplo: (A)Ciudad (I)País (I)Transporte (I)Alcalde (A) Ciudad (I) Deportiva (I)Condal (I) Real Y quizás también queremos

6. Extracción de contenidos Una posible solución: + Ponderar el coseno del ángulo con la longitud de vector Longitud de Vector-término: puede denotar la importancia de un término dentro del dominio semántico. Semejanza = Cos(A,I) x log (1 + longitudVector(I))

Nuestro corpus: psicopatología.

7. Lista de “fobia” “Fobia” Coseno Coseno + long.vector Longitud de vector 21 primeros vecinos Semejanza con “fobia”

8. Lista de “tormentas” “Tormentas” Coseno Coseno + long.vector Longitud de vector Semejanza con “tormentas” 21 primeros vecinos

ESTRUCTURAS COMPLEJAS (estructuras de dos términos)

9. Extracción del sentido de estructuras complejas + Estructuras complejas: formadas por más de una palabra. + Estructuras predicativas: “Este partido es de centro” + Estructuras predicativas <<taxonómicas>>: “Este pájaro es un pelícano”

10. Extracción del sentido de estructuras complejas + Estructuras predicativas “taxonómicas” en corpus científicos: P(A) Fobia (Tormentas) “Fobia a las tormentas” “Personalidad de la pistola” Personalidad (Pistola)

11. Suma centroide Un forma: el centroide o la suma Vector Predicado(Fobia) + Vector Argumento (tormentas)

12. Suma centroide Problema: el centroide Gente Timidez Social Precipicios

13. Algoritmo de predicación Necesitamos

14. Algoritmo de predicación LSA + Algoritmo de predicación (Kintsch, 2001) El sentido final de la predicación se forma sumando el predicado, el argumento y los n primeros vecinos del predicado pertinentes para el argumento.

15. “Fobia a las tormentas” (LSA + Algoritmo de predicación + Corrección con la longitud de vector) “fobia a las tormentas”: un fenómeno natural designa una fobia específica Coseno Coseno + long.vector Sin Predicación Con Predicación Sin Predicación Con Predicación Social Precipicios Social Social Sociales Específica Público Timidez Serpientes Específica Serpientes 21 primeros vecinos Específica Subtipo Timidez

16. “Personalidad de la pistola” (LSA + Algoritmo de predicación + Corrección con la longitud de vector) “personalidad de la pistola”: un objeto designa personalidad antisocial Coseno Coseno + long.vector Sin Predicación Con Predicación Sin Predicación Con Predicación Disocial Esquizoide Disocial Antisocial Antisocial Antisocial Esquizotípico Esquizotípico Robos Navaja 21 primeros vecinos Límite evitación Violencia Esquizoide Narcisista

16. Conclusiones +LSA proporciona una representación objetiva y mensurable de conocimiento estático. +LSA es una buena base para simular procesos mediante algoritmos que tengan en cuenta las constricciones del contexto. +LSA y los algoritmos que provienen de la psicolingúística tiene muchas aplicaciones en el ámbito de la industria lingüística (buscadores, interpretadores de intenciones del usuario, web semántica, indexadores de información diagnóstica, visualización, etc) .

18. Muchas gracias

VARIANTES A LA EXTRACCIÓN DE VECINOS SEMÁNTICOS Y AL ALGORITMO DE PREDICACIÓN EN CORPUS CIENTÍFICOS Guillermo Jorge-Botana Ricardo Olmos Albacete José A. León

Aux. Listados vs. definiciones reales Comparación de los listados con textos reales Similitud de cada uno de los métodos con muestras de definiciones reales basados en DSM-IV ( Concepto general d fobia, Fobia social, Fobia específica Ansiedad generalizada)

Aux. Listados vs. definiciones reales Comparación de los listados con textos reales Similitud de cada uno de los métodos con muestras de definiciones reales basados en DSM-IV ( Concepto general d fobia, Fobia social, Fobia específica Ansiedad generalizada)