Análisis de textos por medio de herramientas estadísticas y de redes complejas 1. Pablo Medina, 2. Victor Bucheli, 3. Paulo Orozco, 4. Roberto Zarama CEIBA
Redes + estadística: Textos (Información estaísitca medible): Palabras frecuentes (Conceptos) Palabras frecuentes (Conceptos) Ubicación dentro de un texto Ubicación dentro de un texto etc etc Redes (Usa info. estad. para visualizar): Relaciones entre palabras Relaciones entre palabras Centralidad e influencia de palab. Centralidad e influencia de palab. Comunidades de palabras Comunidades de palabras Resultado: Mejor comprensión del texto Interpretación Conceptos inmersos dentro del texto empleados por autor Información más allá del hilo conductor Software y métodos comput. no (Filtrado de palabras no claves)
Análisis del output (Información estadística) Diadas (palabras continuas) más concurridas en un texto:
Análisis del output (Información estadística) Ubicación dentro de textos de una plabra dada y compararlos Fracción del texto Aparición en el texto Aparición concurrida Documento 1 Documento 2
Análisis del output (Redes): Entrada de Info. Estad. para construir la red del doc. MANE Medida Atributo Grado Nodal Tamaño nodo Comunidad Color Dirección red No dirigida Conexidad Disconexa Comunidad más grande Componente más grande conectado
Ejemplo Una clasificación de universidades con base en algunos resultados de su investigación* Scientometrics (2012) 91:369–382 DOI /s Growth of scientific production in Colombian universities: an intellectual capital-based approach Victor Bucheli Adriana Dıaz Juan Pablo Calderon Pablo Lemoine Juan Alejandro Valdivia Jose Luis Villaveces Roberto Zarama
Crecimiento ARWU
Crecimiento LA
Crecimiento Temprano Exponencial Colombia
Crecimiento Tardio Exponencial Colombia
Crecimiento Lineal Colombia
Crecimiento Exponencial Colombia
MUCHAS GRACIAS!!!!