La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

VARIANTES A LA EXTRACCIÓN DE VECINOS SEMÁNTICOS Y AL ALGORITMO DE PREDICACIÓN EN CORPUS CIENTÍFICOS Guillermo Jorge-Botana Ricardo Olmos Albacete José

Presentaciones similares


Presentación del tema: "VARIANTES A LA EXTRACCIÓN DE VECINOS SEMÁNTICOS Y AL ALGORITMO DE PREDICACIÓN EN CORPUS CIENTÍFICOS Guillermo Jorge-Botana Ricardo Olmos Albacete José"— Transcripción de la presentación:

1 VARIANTES A LA EXTRACCIÓN DE VECINOS SEMÁNTICOS Y AL ALGORITMO DE PREDICACIÓN EN CORPUS CIENTÍFICOS Guillermo Jorge-Botana Ricardo Olmos Albacete José A. León Francisco Molinero

2 LSA puede: +simular como puede estar representado el conocimiento 1. ¿Qué hace LSA?

3 Pero: +No es una teoría de procesamiento (Burguess, 2000) +Es una representación estática de cómo se distribuye el conocimiento +Para simular cualquier proceso: Como: Juicios de semejanzas Comprensión de estructuras textuales Constricciones del contexto +Es necesario formalizar algún tipo de operación sobre lo que LSA representa. 2. ¿Qué no hace LSA?

4 3. Objetivos +Extraer términos vecinos de algunas palabras aisladas (estructura simple) y grupos de palabras (estructura compleja). +Aplicar el algoritmo de predicación (Kintsch, 2001) a ciertas estructuras frecuentes en corpus científicos.

5 Una forma: + Tomar el vector de una palabra y extraer una lista de sus n primeros vecinos semánticos. + Lista: se compara el vector de dicha palabra con todos los demás vectores-términos del espacio semántico. + Comparación: coseno del ángulo µ Semejanza = Cos(A,I) 4. Extracción de contenidos A I

6 Un posible problema: + En ocasiones, los primeros términos de la lista son: Términos de poca relevancia Que sólo concurren con el término de referencia Ejemplo: (A) Ciudad (I) Deportiva (I)Condal (I) Real (A)Ciudad (I)País (I)Transporte (I)Alcalde Y quizás también queremos 5. Extracción de contenidos

7 Una posible solución: + Ponderar el coseno del ángulo con la longitud de vector Semejanza = Cos(A,I) x log (1 + longitudVector(I)) Longitud de Vector-término: puede denotar la importancia de un término dentro del dominio semántico. 6. Extracción de contenidos

8 Nuestro corpus: psicopatología.

9 Fobia Longitud de vector Semejanza con fobia 7. Lista de fobia 21 primeros vecinos CosenoCoseno + long.vector

10 Longitud de vector Semejanza con tormentas 8. Lista de tormentas 21 primeros vecinos Tormentas CosenoCoseno + long.vector

11 ESTRUCTURAS COMPLEJAS (estructuras de dos términos)

12 + Estructuras complejas: formadas por más de una palabra. + Estructuras predicativas: Este partido es de centro + Estructuras predicativas >: Este pájaro es un pelícano 9. Extracción del sentido de estructuras complejas

13 Fobia a las tormentas Personalidad de la pistola + Estructuras predicativas taxonómicas en corpus científicos: 10. Extracción del sentido de estructuras complejas P(A) Personalidad (Pistola) Fobia (Tormentas)

14 Un forma: el centroide o la suma Vector Predicado(Fobia) + Vector Argumento (tormentas) 11. Suma centroide

15 Problema: el centroide Gente Social Timidez Precipicios 12. Suma centroide

16 Necesitamos 13. Algoritmo de predicación

17 LSA + Algoritmo de predicación (Kintsch, 2001) 14. Algoritmo de predicación El sentido final de la predicación se forma sumando el predicado, el argumento y los n primeros vecinos del predicado pertinentes para el argumento.

18 (LSA + Algoritmo de predicación + Corrección con la longitud de vector) 15. Fobia a las tormentas Coseno + long.vector Coseno Con PredicaciónSin Predicación Con Predicación 21 primeros vecinos fobia a las tormentas: un fenómeno natural designa una fobia específica Social Público Timidez Precipicios Serpientes Específica Social Sociales Específica Social Serpientes Subtipo Específica Timidez

19 personalidad de la pistola: un objeto designa personalidad antisocial 16. Personalidad de la pistola 21 primeros vecinos Con PredicaciónSin Predicación Con Predicación (LSA + Algoritmo de predicación + Corrección con la longitud de vector) Antisocial Disocial Navaja Esquizoide Esquizotípico Límite evitación Antisocial Esquizotípico Esquizoide Narcisista Antisocial Disocial Robos Violencia Coseno + long.vectorCoseno

20 +LSA proporciona una representación objetiva y mensurable de conocimiento estático. +LSA es una buena base para simular procesos mediante algoritmos que tengan en cuenta las constricciones del contexto. +LSA y los algoritmos que provienen de la psicolingúística tiene muchas aplicaciones en el ámbito de la industria lingüística (buscadores, interpretadores de intenciones del usuario, web semántica, indexadores de información diagnóstica, visualización, etc). 16. Conclusiones

21 18. Muchas gracias

22 VARIANTES A LA EXTRACCIÓN DE VECINOS SEMÁNTICOS Y AL ALGORITMO DE PREDICACIÓN EN CORPUS CIENTÍFICOS Guillermo Jorge-Botana Ricardo Olmos Albacete José A. León

23 Comparación de los listados con textos reales Similitud de cada uno de los métodos con muestras de definiciones reales basados en DSM-IV ( Concepto general d fobia, Fobia social, Fobia específica Ansiedad generalizada) Aux. Listados vs. definiciones reales

24 Comparación de los listados con textos reales Similitud de cada uno de los métodos con muestras de definiciones reales basados en DSM-IV ( Concepto general d fobia, Fobia social, Fobia específica Ansiedad generalizada) Aux. Listados vs. definiciones reales


Descargar ppt "VARIANTES A LA EXTRACCIÓN DE VECINOS SEMÁNTICOS Y AL ALGORITMO DE PREDICACIÓN EN CORPUS CIENTÍFICOS Guillermo Jorge-Botana Ricardo Olmos Albacete José"

Presentaciones similares


Anuncios Google