Autor: Henry Coral Director: Rodrigo Fonseca 2017

Slides:



Advertisements
Presentaciones similares
Clase 09.  Garantizar la calidad de software  La prueba nunca termina, del IS translada se translada al usuario  Las casas de software invierte del.
Advertisements

INTEGRANTES: NOVOA TAFUR, EINSTEIN MANUEL RODRÍGUEZ POSTIGO, JULIO CESAR.
CONCEPTO INGENIERÍA DE SOFTWARE  Analiza, diseña y desarrolla productos de sistemas software, proponiendo la plataforma tecnológica más apropiada. Domina.
UNIVERSIDAD REGIONAL AUTÓNOMA DE LOS ANDES UNIANDES IBARRA TEMA: METODOLOGÍA DE LA AUDITORÍA DE GESTIÓN DOCENTE: ING. WILMER ARIAS 1.
Curso de Aptitud Pedagógica 2006/2007 OpenOffice Base Introducción a las Bases de Datos.
UNIVERSIDAD DE LAS FUERZAS ARMADAS - ESPE DEPARTAMENTO DE CIENCIAS DE LA COMPUTACIÓN CARRERA: INGENIERÍA EN SISTEMAS E INFORMÁTICA “ESTUDIO DE LA NOTACIÓN.
Lcdo. Eddy Cortez Sistemas II. Ingeniería de Requisitos.
Capítulo IV: Análisis e Interpretación de los Datos Codificación y Tabulación de los Datos Técnicas de Presentación de los Datos Análisis Estadísticos.
TEMA: PSP (Personal Software Process) ANALISIS DE SISTEMAS I ING. EDGAR RAUL MOLINA INTEGRAMTES: HANNSEL E. CORDON AC JESSICA IDALMY KRESS FREDERIC HESTIB.
Simulación como Herramienta para la Mejora de los Procesos de Software Desarrollados con Metodologías Ágiles Utilizando Dinámica de Sistemas Objetivo.
Análisis de Proyecto de Software.
Herencia Multiple en Java
UNE “RAFAEL MARÍA BARALT” PROGRAMA DE INGENIERÍA Y TECNOLOGÍA
Hhhhhhhh Elementos del Diseño para la Planificación de Situaciones de Aprendizaje.
Gestión de Proyectos.
RiskyProject Presentado por: Andres Clavijo, Camilo Forero, Jhon Chacón y Brayan Valero.
Metodología de la Investigación Cualitativa
SWEBOK.
RART: REAL TIME SOCIAL DATA MINING
APRENDIZAJE BASADO EN PROYECTOS
Arquitectura de una Base de Datos
Auditoria Informática Unidad III
APRENDIZAJE BASADO EN PROYECTOS
MOPROSOFT.
TRABAJO DE TITULACIÓN “MANEJO BASICO DE INDICADORES DE PARTICIPACION CIUDADANA UTILIZANDO ALGORITMOS Y TECNICAS DE MINERIA DE DATOS COMO APOYO EN LA GESTION.
CARRERA DE INGENIERÍA EN SISTEMAS E INFORMÁTICA
DEFENSA DEL TRABAJO DE TITULACIÓN
Autor: Poma Japón Diana Ximena Director: DÍAZ ZUÑIGA MAGI PAÚL
TRABAJO DE TITULACIÓN, PREVIO A LA OBTENCIÓN DEL TITULO DE MAGISTER EN GESTIÓN DE SISTEMAS DE INFORMACIÓN E INTELIGENCIA DE NEGOCIOS “ANÁLISIS PARA PREDICCIÓN.
Presenta: TSU. Yuridia Luna Marcos Asesora de tesis:
UNIVERSIDAD NACIONAL DE LOJA Área de la Educación, el Arte y la Comunicación Informática Educativa IV INGENIERIA DE SOFTWARE Taller de Análisis y Diseño.
Pregunta del examen 1. Todas las siguientes acciones deben realizarse durante la iniciación del proyecto, EXCEPTO: a. Identificar y documentar las necesidades.
¿Qué es WebQuests? WebQuest es un modelo de aprendizaje para propiciar el uso educativo de Internet, basado en el aprendizaje cooperativo y enfocado en.
PROGRAMA DE INGENIERÍA DE SISTEMAS POR CICLOS PROPEDEUTICOS
Determinación de una Situación problema
Metodología de la Investigación
Universidad de Palermo
Metodología Merise Universidad Nororiental Privada
Ingeniería del Software
DEPARTAMENTO DE ELECTRICA Y ELECTRÓNICA
Ciclo de Vida del Software
APLICACIÓN DE NUEVAS TECNOLOGÍAS EN LA CONSERVACIÓN Y ANÁLISIS DEL PATRIMONIO CULTURAL Herramientas para la Investigación.
Metodología de la Investigación
Ciclo de vida del Software
Comprensión y obtención de los requerimientos
Auditoria de Tecnologías de Información PLANIFICACION Ing. Eder Gutiérrez Quispe.
Investigación educativa Integrantes Condori Alicia García patricia Pinell Gabriela Romero paúl Aguilar jhonny.
Creada por: Andres Rios M. Design ¿cómo evaluamos e Informe final? Presentado por: JENNY PINTO YERITZA ANDREA GODOY QUINTERO YULI ALEXANDRA ESTUPIÑAN QUINTERO.
 La minería de datos o exploración de datos (es la etapa de análisis de "Knowledge Discovery in Databases" o KDD) es un campo de la estadística y las.
La planeación y la organización de los procesos técnicos.
Aspectos Generales Todos los proyectos deben subir este documento como parte de la presentación, en la plataforma de postulación de proyectos. La presentación.
¿Cómo hacer una investigación?
Autores: Ñauñay Colcha Jorge Luis Bravo Maldonado Paulo Dennis
UNIVERSIDAD DE LAS FUERZAS ARMADAS-ESPE
NUEVAS TECNOLOGIAS DE INFORMACION Y COMUNICACIÓN.
Es el proceso de subdividir los entregables y el trabajo del proyecto en componentes más pequeños y más fáciles de manejar Se puede dar una visión estructurada.
Guía General del Modelo ASÍ de Medición de Indicadores
Universidad Nacional Experimental Francisco De Miranda Vice-rectorado Académico Municipalización Universitaria Morón Estado Carabobo MORÓN NOVIEMBRE 2018.
Vicerrectoría Académica Dirección de Formación General Programa de Emprendimiento PROTOTIPOS.
Br. Eduardo Jesús Araujo Parra V
1 ACTIVIDAD 1 María Isabel Sangrador flores Protocolo de Investigación.
MIDEPLAN. División de Planificación, Estudios e Inversión CICLO DE VIDA DE LOS PROYECTOS Curso de Preparación de Proyectos División de Planificación, Estudios.
INTEGRACIÓN DE SISTEMAS DE GESTIÓN MTO. LUIS EDUARDO ROCHA MAGAÑA Integración de Sistemas de Gestión.
Desarrollo de Sistemas de Información Contable - Sis USB 1 METODOLOGIAS DE DESARROLLO DE SOFTWARE.
Prof: Javier Serrano Pérez Ingeniero Mecánico Métodos Numéricos, Mecánica de Materiales, Dibujo Mecánico, Incorporación de materiales Proyectos de Investigación.
GESTIÓN DE PROYECTOS La gestión de proyectos está conformada por todas aquellas acciones que debes realizar para cumplir con una objetivo definido dentro.
Desarrollo de Sistemas de Información Contable - Sis USB 1 METODOLOGIAS DE DESARROLLO DE SOFTWARE.
TRABAJO DE TITULACIÓN PREVIO A LA OBTENCIÓN DEL TÍTULO DE MAGÍSTER EN GERENCIA DE SISTEMAS TEMA: “DISEÑO DE UNA GUÍA CORPORATIVA PARA IMPLEMENTAR APLICACIONES.
Base de datos años  En la década de los años 80’, se desarrolló el SQL, un lenguaje de consultas que permite consultar, valga la redundancia,
Inversiones, Proyectos y Control de Gestión Docente: José Luis Núñez Guerra Ingeniero Comercial Licenciado en Ciencias Económicas y Administrativas.
Transcripción de la presentación:

Autor: Henry Coral Director: Rodrigo Fonseca 2017 PLANTEAMIENTO DE UN MODELO DE ESTIMACIÓN DE PROYECTOS DE SOFTWARE EN ETAPAS TEMPRANAS BASADO EN REDES NEURONALES ARTIFICIALES Autor: Henry Coral Director: Rodrigo Fonseca 2017

Agenda El Problema Objetivos Marco Teórico Metodología Desarrollo del Proyecto de Investigación Análisis de Resultados Conclusiones Preguntas

Quién soy yo Henry Coral, 38 años, un hijo.  En el año 2002 obtuve el título de Ing. En Sistemas e Informática, en este misma universidad.  He acumulado 17 años de experiencia en desarrollo de software y 14 años como docente universitario.  En mi experiencia laboral he pasado por todos los roles en proyectos de software, muchas veces trabajé en jornadas de más de 12 horas para compensar estimaciones iniciales demasiado optimistas.    En la actualidad me dedico a la investigación tecnológica y al desarrollo de nuevos productos, enfocado en la inteligencia artificial. 

El Problema Las empresas desarrolladoras de software no cuentan con una descripción detallada de los requisitos al momento de realizar la oferta económica de un proyecto. Las estimaciones del esfuerzo requerido para desarrollar una aplicación se basan en documentos de alto nivel. Muchas empresas guardan información referente a sus procesos de desarrollo de software; sin embargo, muy pocas la utilizan.

RFP Requerimientos Software

Objetivo Definir un modelo de estimación del esfuerzo en etapas tempranas para Proyectos de Software basado en Redes Neuronales Artificiales.

Estimación Esfuerzo Modelo Red Minería de Datos Neuronal Artificial Información de Proyectos

Objetivos Específicos Utilizar la información historíca de los proyectos de implantación de la empresa Gestor en la construcción del modelo de estimación. Validar la calidad de la información que la empresa Gestor mantiene y verificar su uso en la construcción del modelo de estimación. Evaluar el nivel de fiabilidad del modelo de estimación planteado utilizando un subconjunto de los registros históricos que dispone la empresa Gestor.

Marco Teórico

Red de Categorías

Marco Teórico Descubrimiento del Conocimiento en BD Se extrae patrones en forma de reglas o funciones, a partir de los datos, para que el usuario los analice. Esta tarea implica pre-procesar los datos, hacer minería de datos y presentar resultados.

Marco Teórico Minería de Datos Es el proceso de dar sentido a los datos descubriendo patrones y formulando teorías que pueden usarse para predecir lo que sucederá en situaciones nuevas. Es un medio para producir información predictiva a partir de grandes cantidades de datos.

Marco Teórico Redes Neuronales Artificiales Son algoritmos computacionales que aprenden de un conjunto de datos y tienen la capacidad de resolver nuevos problemas. El aprendizaje se da como resultado de un proceso de entrenamiento. Tienen la capacidad de predecir, clasificar y segmentar datos.

Marco Teórico Estimación Esfuerzo en Proyectos Software La estimación del esfuerzo para un proyecto es uno de los procesos de la “Gestión del Tiempo” definido por el PMI. “La estimación de recursos, costos y programación para un esfuerzo de ingeniería de software requiere experiencia, acceso a buena información histórica y el coraje de comprometerse a predicciones cuantitativas cuando la información cualitativa es todo lo que existe.”

Marco Teórico Estimación del Tamaño del Producto Juicio de Expertos.- Se guía en la información histórica y puede proporcionar información sobre la estimación de la duración recomendada en base a proyectos anteriores. El Juicio de Expertos, es la técnica más utilizada en la industria local; al solo contar con información de alto nivel en etapas tempranas de un proyecto.

Metodología

Metodología CRISP-DM, creada en el año 2000 por un grupo de empresas en base a la experiencia previa de los participantes en proyectos de minería de datos. Utilizada en el 43% de los proyectos de minería de datos a nivel mundial. Comprende seis fases: Comprensión del negocio, Comprensión de los datos, Preparación de los datos, Modelado, Evaluación e Implantación. Las fases están compuestas por varias tareas y sub- tareas; que son las que definen las actividades a ser realizadas Es iterativa.

Metodología – CRISP-DM

Desarrollo del Proyecto

Desarrollo del Proyecto Antecedentes Gestor cuenta con información del esfuerzo real en el desarrollo de requisitos de software de su producto “Gestor Web Fiducia Fondos”, de los últimos 8 años. Gestor no ha realizado análisis a sus datos, ni los ha utilizado una vez que un proyecto finaliza. En ninguno de los proyectos de Gestor en sus 20 años de vida ha contado con la descripción detallada de los requisitos para estimar el tiempo y costo de sus proyectos. Gestor utiliza actualmente el método de Juicio Experto, para la estimación del esfuerzo.

Desarrollo del Proyecto Comprensión de los Datos La información de los proyectos de la empresa está almacenada en una base de datos relacional. La empresa desarrolló su propio sistema para la gestión de proyectos hace 8 años. Se trabajará solo con los datos de los últimos 5 años

Desarrollo del Proyecto Comprensión de los Datos

Desarrollo del Proyecto Preparación de los Datos Se tomó solo la información de los proyectos relacionados con el producto “Gestor Web Fiducia Fondos”, obteniendo 13524 registros. Al ejecutar la tarea de limpieza de los datos este número se redujo a 4324 registros. Se eliminó columnas de información no necesaria y al final se creo una estructura final para proceder al modelado.

Desarrollo del Proyecto Preparación de los Datos Campo Descripción COD_DIFICULTAD Parámetro que indica la dificultad del desarrollo del requerimiento evaluada por el experto en el sistema. Toma los siguientes valores: 1. Baja, 2. Media, 3. Alta, 4. Muy Alta NRO_FORMAS Especifica el número de pantallas que se debe crear o modificar para cumplir con la funcionalidad del requerimiento NRO_OBJ_BD Especifica el número de: tablas, paquetes, procedimientos almacenados, funciones o disparadores; que deben ser desarrollados o modificados. NRO_REPORTES Especifica el número de reportes que se necesita modificar o desarrollar como parte del requerimiento. TIEMPO_FINAL Tiempo final real que tomó el desarrollo del requerimiento. Este tiempo incluye: tiempo de desarrollo, tiempo de pruebas y tiempo de re-proceso.

Desarrollo del Proyecto Modelado Técnica: Red Neuronal, tipo Perceptron Algoritmo Aprendizaje: Back Propagation Herramienta: RapidMiner Datos Entrenamiento: Registros del 2011 al 2015 Datos de Prueba: Registros de proyectos del 2016 Variable Dependiente: Tiempo Real Variables Independientes: Dificultad, # pantallas, # objetos de BD, # de reportes

Desarrollo del Proyecto Modelado

Desarrollo del Proyecto Modelado

Desarrollo del Proyecto Evaluación de Resultados

Desarrollo del Proyecto Evaluación de Resultados Iteración 2, 500 ciclos de aprendizaje Error Absoluto 6.243 +/- 1.816 Error Relativo 94.97% +/- 56.73% Raiz Error Cuadratico Medio 10.170 +/- 1.760 Promedio de Predicción 16.006 % Iteración 3, 900 ciclos de aprendizaje Error Absoluto 6.083 +/- 1.753 Error Relativo 92.66% +/- 54.36% Raiz Error Cuadratico Medio 10.024 +/- 1.745 Promedio de Predicción 16.006 %

Desarrollo del Proyecto Análisis de Errores en la Predicción Rango Error Relativo Registros Porcentaje 0%-10% 173 24% 10%-25% 186 26% 25%-50% 153 21% 50%-100% 108 15% Mayores 100% 100 14% El 50% de los casos tiene un error relativo menor al 25%

Desarrollo del Proyecto Análisis de Errores en la Predicción Rango Error Relativo Registros Porcentaje 0%-10% 173 24% 10%-25% 186 26% 25%-50% 153 21% 50%-100% 108 15% Mayores 100% 100 14% El 50% de los casos tiene un error relativo menor al 25%

Desarrollo del Proyecto Análisis de Errores en la Predicción Total objetos Requerimientos Error Relativo > 25% Porcentaje 2 199 55% 4 56 16% 6 25 7% Total: 78% La mayoría de casos erróneos y con un alto valor en error relativo esta en desarrollos pequeños que tienen hasta 6 objetos.

Desarrollo del Proyecto Análisis de Errores en la Predicción Tiempo Desarrollo Casos Porcentaje Menor a 2 horas 82 29.3% De 2 a 4 horas 85 30.4% De 4 a 8 horas 41 14.6% De 8 a 16 horas 43 15.4% Mayores a 16 horas 29 10.4% La mayoría de casos erróneos (90%) se da en desarrollos que duran menos de dos días (16 horas).

Desarrollo del Proyecto Evaluación de Resultados Juicio Experto Error Absoluto 4,95 Error Relativo 53,22% Raiz Error Cuadratico Medio 7,29 La estimación por el método de Juicio Experto es mejor que la del modelo generado.

Conclusiones

Conclusiones En base a la información que posee la empresa Gestor de sus proyectos; no se ha podido construir un modelo de predicción que mejore el porcentaje de fiabilidad en la estimación en comparación a los resultados obtenidos por el método de Juicio Experto, La mayor cantidad de casos fallidos de estimación se encuentra en requerimientos pequeños; es decir requerimientos de menos de un día de desarrollo. Gracias al proceso de minería de datos, se descubrió que muchos registros presentaban inconsistencias en base a lo que se debía realizar y al tiempo registrado por los desarrolladores; es decir, se llego a detectar que muchos desarrolladores registraban más tiempo del que realmente debían haber empleado

Preguntas

AGRADECIMIENTOS y DEDICATORIA Dennys Guzmán, Gerente de Sistemas de Gestor; y experto en SQL Rodrigo Fonseca, director de la tesis Germán Ñacato, director de la maestría. Matías Sebastián, Gloria Esperanza y Andrea Estefanía. Banda Sonora: Rockeros de los 80’s y 90’s del Río de la Plata.