Análisis de textos por medio de herramientas estadísticas y de redes complejas 1. Pablo Medina, 2. Victor Bucheli, 3. Paulo Orozco, 4. Roberto Zarama CEIBA.

Slides:



Advertisements
Presentaciones similares
Norman Vargas Chévez (presenter) Paul Johannesson Lazar Rusu
Advertisements

CALIDAD EN DESARROLLO DE SOFTWARE
Modelando aplicaciones
Complejidad Algorítmica: Análisis de algoritmos
UNIDAD III: CONTROL ESTADÍSTICO DE LOS PRODUCTOS
Tipos de Métricas.
MODELADO DE ANALISIS Y DISEÑO
PHD: Aracely Forero R SEPTIEMBRE (Ander Egg y Bunge) MÉTODICA: tiene procedimientos propios, es organizada y planificada. UNIVERSAL: en la medida.
Partes de la computadora
Estrategias de Aprendizaje Visuales
Contenido Crisis del Software Mitos del Software
Análisis de Universidades Pares Presentación al Staff del Rector 13 de agosto de 2007 Oficina de Investigación Institucional y Planificación Dr. Antonio.
HERRAMIENTAS PARA EL CONTROL ESTADÍSTICO DE CALIDAD.
 El termino OO, significa que el software es organizado como una colección de objetos. Un objeto es un paquete de software que contiene datos y procedimientos.
MAPAS CONCEPTUALES ¿Qué es?
MÉTODO DE INVESTIGACIÓN PARA SOLUCIONAR PROBLEMAS DE UNA INDUSTRIA Técnicas Estadísticas.
Estrategias de Aprendizaje Visuales
Informe del presupuesto y evaluación de alternativas de inversión.
Métodos y Herramientas Computacionales para el Análisis y la Visualización Informétrica Responsable: Dr. Humberto Carrillo Calvet.
Qué es CeCalCULA? Supercomputación Primer centro de de Venezuela.
Distribución de los datos
Prof. Ángela Mejía. La asignatura Informática cumple con un doble propósito: por una parte, introducir al docente en formación en el mundo de la tecnología.
Potencializando las microfinanzas Servicios en la nube: Mitos y realidades Marzo,2013.
GERENCIA POR PROCESOS Carmen Alicia Díaz Grajales Economista
Bases de Datos Modelamiento.
Escuela de Ingeniería Forestal.
Medición y Métricas del Software
Contexto Proyecto consolidado dentro de la línea de investigación de Sistemas de Información en el Dpto. de Ingeniería en Sistemas de Información de la.
Modelado y simulación en Ingeniería Química. Manuel Rodríguez Tema 3: Simulación estacionaria.
Análisis cualitativo de transcripciones
Proceso KDD MSc. Carlos Alberto Cobos Lozada
PONTIFICIA UNIVERSIDAD Católica MADRE Y MAESTRA
Construcción de gráficas: Forma manual y con programados
Metodología de la investigación Montiel, G. (2005). Estudio socioepistemológico de la función trigonométrica. Tesis de doctorado no publicada. CICATA-IPN.
Nombres: Julián López López Natalia Mora Gaitán
UNEXPO REPÚBLICA BOLIVARIANA DE VENEZUELA UNIVERSIDAD NACIONAL EXPERIMENTAL POLITÉCNICA “ANTONIO JOSÉ DE SUCRE” VICE-RECTORADO “LUÍS CABALLERO MEJÍAS”
¿Qué son las normas APA? La corporación universitaria adventista UNAC decidió adoptar las normas internacionales de la american psychological association.
Por: Andres Gonzalez Gonzalez Y Santiago Herrera Palma 11°A
Introducción a las computadoras I Prof. Ana C. González.
PEDAGOGA ELVIA BACA COLÍN LIC. LEYLANI GARCÍA BAÑUELOS LIC. ALEJANDRO RODRÍGUEZ ALLENDE Sesión 3 Cmaptools “Organizando ideas en el aula”
Construcción de Software
Realizado por: Alejandro Palacios Sánchez
INTRODUCCIÓN A LA ESTADÍSTICA
Software de Aplicación Ejecutivo
El verdadero recurso dominante y factor de producción absolutamente decisivo no es ya ni el capital, ni la tierra, ni el trabajo. ES EL CONOCIMIENTO.”
HISTORIAS DE VIDA Las historias de vida constituyen una metodología cualitativa en el campo de las ciencias sociales, que permiten percibir las relaciones.
Recuperación de Información La disponibilidad y correcta utilización de los contenidos digitales. Autor: Jhon Gonzalez Sitio Web
I. Aspectos Introductorios
Adriana Gastélum Román Orlando Vázquez Sánchez
INSTALACIÓN Y ADMINISTRACIÓN DE REDES DE ÁREA LOCAL
Navegadores web Tema 4 SRI Vicente Sánchez Patón I.E.S Gregorio Prieto.
MOTORES DE BUSQUEDA.
Estimación de proyectos de software
Por: Víctor Manuel Muñoz Arango Y Jesús David Mejía Meneses 11°A.
PRESENTADO POR: MARCELA MERICY LEON NEIRA JOSE ANTONIO RODRIGUEZ SANCHEZ.
MULTIMEDIA Colección de tecnologías centradas en el computador, que brindan al usuario la capacidad de acceder y manipular SONIDO, TEXTO, IMÁGENES Y VIDEO.
El hombre y su relación con las Tecnologías de la Información y la Conectividad L as tecnologías son parte importante en la vida de todo ser humano…
Maestría en Educación Aspectos psicopedagógicos y sociales de la educación y la docencia Título: Act. 2.4 Revisión de bibliografía en base de datos académicos.
¿Por qué y cómo medir la innovación?
HIPERTEXTO + MULTIMEDIA = HIPERMEDIA
UNIVERSIDAD DEL VALLE FACULTAD DE CIENCIAS DE LA ADMINISTRACIÓN PROGRAMA DE CONTADURÍA PÚBLICA CURSO: INTRODUCCIÓN A LA CONTADURÍA PÚBLICA DOCENTE: LUIS.
Marco de Trabajo para Indexación, Clasificación y Recopilación Automática de Documentos Digitales Javier Caicedo Espinoza Gonzalo Parra Chico.
SISTEMA DE INFORMACION GEOGRAFICO

REALIZADOS POR MAO ALBERT MAMANI PARI. Computadora La computadora es una máquina automática capaz de recibir un conjunto de instrucciones. Es una herramienta.
Estadística y probabilidad aplicada a los negocios
Gestión de la información y el conocimiento II Bibliometría Ángela Valderrama Muñoz Ingeniera de Sistemas (UdeA) Especialista en Alta Gerencia(UdeA) Magister.
IMPORTANCIA DE LAS MATEMÁTICAS
Clase 2 ADECUACIÓN DE MATERIALES PARA ENTORNOS VIRTUALES DE APRENDIZAJE.
ANÁLISIS DEL TEXTO.
Transcripción de la presentación:

Análisis de textos por medio de herramientas estadísticas y de redes complejas 1. Pablo Medina, 2. Victor Bucheli, 3. Paulo Orozco, 4. Roberto Zarama CEIBA

Redes + estadística: Textos (Información estaísitca medible): Palabras frecuentes (Conceptos) Palabras frecuentes (Conceptos) Ubicación dentro de un texto Ubicación dentro de un texto etc etc Redes (Usa info. estad. para visualizar): Relaciones entre palabras Relaciones entre palabras Centralidad e influencia de palab. Centralidad e influencia de palab. Comunidades de palabras Comunidades de palabras Resultado: Mejor comprensión del texto Interpretación Conceptos inmersos dentro del texto empleados por autor Información más allá del hilo conductor Software y métodos comput. no (Filtrado de palabras no claves)

Análisis del output (Información estadística) Diadas (palabras continuas) más concurridas en un texto:

Análisis del output (Información estadística) Ubicación dentro de textos de una plabra dada y compararlos Fracción del texto Aparición en el texto Aparición concurrida Documento 1 Documento 2

Análisis del output (Redes): Entrada de Info. Estad. para construir la red del doc. MANE Medida Atributo Grado Nodal Tamaño nodo Comunidad Color Dirección red No dirigida Conexidad Disconexa Comunidad más grande Componente más grande conectado

Ejemplo Una clasificación de universidades con base en algunos resultados de su investigación* Scientometrics (2012) 91:369–382 DOI /s Growth of scientific production in Colombian universities: an intellectual capital-based approach Victor Bucheli Adriana Dıaz Juan Pablo Calderon Pablo Lemoine Juan Alejandro Valdivia Jose Luis Villaveces Roberto Zarama

Crecimiento ARWU

Crecimiento LA

Crecimiento Temprano Exponencial Colombia

Crecimiento Tardio Exponencial Colombia

Crecimiento Lineal Colombia

Crecimiento Exponencial Colombia

MUCHAS GRACIAS!!!!