La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

ANTIPLAGIUM Experimentación Numérica. Integrantes Piere Cordero Patricia Natividad Gustavo Barrenechea Renzo Gómez Kim Alvarado.

Presentaciones similares


Presentación del tema: "ANTIPLAGIUM Experimentación Numérica. Integrantes Piere Cordero Patricia Natividad Gustavo Barrenechea Renzo Gómez Kim Alvarado."— Transcripción de la presentación:

1 ANTIPLAGIUM Experimentación Numérica

2 Integrantes Piere Cordero Patricia Natividad Gustavo Barrenechea Renzo Gómez Kim Alvarado

3 Agenda 1. Objetivo de la Experimentación 2. Selección del Método Experimental 3. Hipótesis 4. Ejecución del Experimento 5. Resultados 6. Conclusiones

4 Objetivo de la Experimentación

5 Objetivo Encontrar el algoritmo más eficiente para la detección de plagio de documentos. Comparar dos algoritmos según tiempo de ejecución y porcentaje de plagio.

6 Algoritmos a Comparar Secuencia de Maximales Lenguaje Natural

7 Factores Experimentales Los factores elegidos para el análisis son: El número de comparaciones entre documentos. El tamaño de los documentos

8 Variables de Respuesta El porcentaje de plagio de un documento contra los documentos de la base de datos. El tiempo de ejecución del algoritmo de detección de plagio.

9 Selección del Método Experimental

10 Método Experimental Se utilizará el estadístico T-Student. Análisis con la distribución Normal. Análisis de las medias con desviación estándar conocidas

11 Criterios de evaluación Media muestral µ Varianza muestral δ 2

12 T-student Sirve para comparar medias de muestras independientes. Su objetivo es demostrar por hipótesis una muestra es mejor que otra. Trabaja con la media y la varianza. Requiere saber si las varianzas son iguales o no.

13 T-student Alpha: Grado de confianza o de certeza. Utilizaremos 95% como grado de certeza. C: Punto crítico que separa la región a rechazar y la región de aceptación.

14 T-student Sean: Si: Varianza muestral del algoritmo i g.l.: Grados de libertad (n1+n2-2) y la fórmula para hallar el estadístico t:

15 Hipótesis

16 Hipótesis para el tiempo de ejecución H0: X1 < X2 : "Secuencia de Maximales requiere un mayor tiempo de ejecución que Lenguaje Natural H1: X1 >= X2: " Lenguaje Natural requiere un mayor tiempo de ejecución que Secuencia Maximales Siendo: X1: Media de tiempo de ejecución de Lenguaje Natural. X2: Media de tiempo de ejecución de Secuencia Maximales.

17 Hipótesis para el porcentaje de plagio H0: X1 < X2 : "Secuencia de Maximales detecta mayor porcentaje de plagio que Lenguaje Natural H1: X1 >= X2: " Lenguaje Natural detecta mayor porcentaje de plagio que Secuencia Maximales Siendo: X1: Media de porcentaje de Lenguaje Natural. X2: Media de porcentaje de plagio de Secuencia Maximales.

18 Ejecución del Experimento

19 Muestra de ejecución Datos Utilizados. Ejecución del algoritmo Secuencia Maximales. Ejecución del algoritmo Lenguaje Natural.

20 Datos utilizados 50 documentos de extensión.txt que serán comparados cada uno contra la los 49 restantes.

21 Ejecución del Experimento

22 Para los tiempo de ejecución Secuencia MaximalesLenguaje Natural Item Nro. Documento a comparar contra la BDTiempo proceso (ms) 1algoritmos.TXT Arte evaluacion.txt Articulo PLN V0.txt Articulo PLN V1.txt Articulo SRI internet.txt Articulo SRI REVISTA.txt Articulo SRI V1.txt Articulo SRI V2.txt Articulo SRI V3.txt Articulo SRI.txt Biometria wikipedia.txt Biometria.TXT CLEI 2007.txt Compresion internet.txt CompresionV0.txt CompresionV1.txt CompresionV2.txt CompresionV3.txt CompresionV4.txt CompresionV5.txt Cuadro de Mando Integral.TXT Desenredadndo la madeja V1.txt Desenredadndo la madeja V2.txt Diagnostico tuberculosis Procesamiento.TXT Espacio vectorial V0.txt

23 Para los tiempo de ejecución Secuencia MaximalesLenguaje Natural Item Nro.Documento a comparar contra la BDTiempo proceso (ms) 26Espacio vectorial V1.txt Espacio vectorial V2.txt Espacio vectorial V3.txt Espacio vectorial V4.txt Espacio vectorial V6.txt Evaluacion VAN RIJSBERGEN.txt Formato articulos CLEI.txt Informe final SRI.txt introducci¢n a los sistemas de recuperaci¢n de informaci¢n.txt Motor de B£squeda 1.TXT Motores de busqueda 2.TXT Reconocimiento de voz 1.TXT Reconocimiento de voz 2.TXT Reconocimiento de voz wikipedia.txt Reconocimiento de voz.TXT Recuperacion de informacion.txt SegmentacionV1.txt SegmentacionV2.txt SegmentacionV3.txt SegmentacionV4.txt SegmentacionV5.txt SegmentacionV6.txt SegmentacionV7.txt SegmentacionV8.txt Sistema Experto.TXT

24 Comparación de tiempo de ejecución

25 Para el porcentaje de detección de plagio Secuencia Maximales Lenguaje Natural Item Nro.Documento a comparar contra la BD Porcentaje de plagio (%) 1algoritmos.TXT415 2Arte evaluacion.txt7191 3Articulo PLN V0.txt7053 4Articulo PLN V1.txt Articulo SRI internet.txt Articulo SRI REVISTA.txt5586 7Articulo SRI V1.txt9892 8Articulo SRI V2.txt9996 9Articulo SRI V3.txt Articulo SRI.txt Biometria wikipedia.txt418 12Biometria.TXT396 13CLEI 2007.txt537 14Compresion internet.txt396 15CompresionV0.txt100 16CompresionV1.txt100 17CompresionV2.txt100 18CompresionV3.txt CompresionV4.txt CompresionV5.txt Cuadro de Mando Integral.TXT340 22Desenredadndo la madeja V1.txt460 23Desenredadndo la madeja V2.txt Diagnostico tuberculosis Procesamiento.TXT315 25Espacio vectorial V0.txt564

26 Para el porcentaje de detección de plagio Secuencia MaximalesLenguaje Natural Item Nro.Documento a comparar contra la BD Porcentaje de plagio (%) 26Espacio vectorial V1.txt Espacio vectorial V2.txt Espacio vectorial V3.txt Espacio vectorial V4.txt Espacio vectorial V6.txt Evaluacion VAN RIJSBERGEN.txt130 32Formato articulos CLEI.txt230 33Informe final SRI.txt introducci¢n a los sistemas de recuperaci¢n de informaci¢n.txt Motor de B£squeda 1.TXT Motores de busqueda 2.TXT403 37Reconocimiento de voz 1.TXT Reconocimiento de voz 2.TXT Reconocimiento de voz wikipedia.txt560 40Reconocimiento de voz.TXT Recuperacion de informacion.txt SegmentacionV1.txt SegmentacionV2.txt96 44SegmentacionV3.txt SegmentacionV4.txt SegmentacionV5.txt SegmentacionV6.txt SegmentacionV7.txt SegmentacionV8.txt Sistema Experto.TXT381

27 Comparación de porcentaje de detección de plagio

28 Resultados

29 Resultados para el tiempo de ejecución SECUENCIA MAXIMALESLENGUAJE NATURALgl n Media S t = Rechazo Ho Si t > "Como t = < se acepta Ho"

30 Resultados para porcentaje de plagio SECUENCIA MAXIMALESLENGUAJE NATURALgl n Media S t = Rechazo Ho Si t > "Como t = < se acepta Ho"

31 Conclusiones

32 Se acepta la Hipótesis nula para el tiempo de ejecución, es decir el algoritmo de Secuencias Maximales requiere de un mayor tiempo de ejecución que el algoritmo Lenguaje Natural Se acepta la Hipótesis nula para el porcentaje de detección de plagio, es decir el algoritmo de Secuencias Maximales detecta mayor porcentaje de plagio frente al algoritmo de Lenguaje Natural.

33 Bibliografía

34 Estadística Descriptiva e Inferencial Córdova Zamora, Manuel (2003)


Descargar ppt "ANTIPLAGIUM Experimentación Numérica. Integrantes Piere Cordero Patricia Natividad Gustavo Barrenechea Renzo Gómez Kim Alvarado."

Presentaciones similares


Anuncios Google