La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Experimentación Numérica

Presentaciones similares


Presentación del tema: "Experimentación Numérica"— Transcripción de la presentación:

1 Experimentación Numérica
Antiplagium

2 Integrantes Piere Cordero Patricia Natividad Gustavo Barrenechea
Renzo Gómez Kim Alvarado

3 Agenda Objetivo de la Experimentación
Selección del Método Experimental Hipótesis Ejecución del Experimento Resultados Conclusiones

4 Objetivo de la Experimentación

5 Objetivo Encontrar el algoritmo más eficiente para la detección de plagio de documentos. Comparar dos algoritmos según tiempo de ejecución y porcentaje de plagio.

6 Algoritmos a Comparar Secuencia de Maximales Lenguaje Natural

7 Factores Experimentales
Los factores elegidos para el análisis son: El número de comparaciones entre documentos. El tamaño de los documentos

8 Variables de Respuesta
El porcentaje de plagio de un documento contra los documentos de la base de datos. El tiempo de ejecución del algoritmo de detección de plagio.

9 Selección del Método Experimental

10 Método Experimental Se utilizará el estadístico T-Student.
Análisis con la distribución Normal. Análisis de las medias con desviación estándar conocidas

11 Criterios de evaluación
Media muestral µ Varianza muestral δ2

12 T-student Sirve para comparar medias de muestras independientes.
Su objetivo es demostrar por hipótesis una muestra es mejor que otra. Trabaja con la media y la varianza. Requiere saber si las varianzas son iguales o no.

13 T-student Alpha: Grado de confianza o de certeza.
Utilizaremos 95% como grado de certeza. C: Punto crítico que separa la región a rechazar y la región de aceptación.

14 T-student Sean: Si: Varianza muestral del algoritmo i
g.l.: Grados de libertad (n1+n2-2) y la fórmula para hallar el estadístico t:

15 Hipótesis

16 Hipótesis para el tiempo de ejecución
H0: X1 < X2 : "Secuencia de Maximales requiere un mayor tiempo de ejecución que Lenguaje Natural“ H1: X1 >= X2: " Lenguaje Natural requiere un mayor tiempo de ejecución que Secuencia Maximales ” Siendo: X1: Media de tiempo de ejecución de Lenguaje Natural. X2: Media de tiempo de ejecución de Secuencia Maximales.

17 Hipótesis para el porcentaje de plagio
H0: X1 < X2 : "Secuencia de Maximales detecta mayor porcentaje de plagio que Lenguaje Natural“ H1: X1 >= X2: " Lenguaje Natural detecta mayor porcentaje de plagio que Secuencia Maximales ” Siendo: X1: Media de porcentaje de Lenguaje Natural. X2: Media de porcentaje de plagio de Secuencia Maximales.

18 Ejecución del Experimento

19 Muestra de ejecución Datos Utilizados.
Ejecución del algoritmo Secuencia Maximales. Ejecución del algoritmo Lenguaje Natural.

20 Datos utilizados 50 documentos de extensión .txt que serán comparados cada uno contra la los 49 restantes.

21 Ejecución del Experimento

22 Para los tiempo de ejecución
Secuencia Maximales Lenguaje Natural Item Nro. Documento a comparar contra la BD Tiempo proceso (ms) 1 algoritmos.TXT 19262 686 2 Arte evaluacion.txt 1592 186 3 Articulo PLN V0.txt 44828 3617 4 Articulo PLN V1.txt 35136 1560 5 Articulo SRI internet.txt 82660 265 6 Articulo SRI REVISTA.txt 7943 366 7 Articulo SRI V1.txt 76794 3853 8 Articulo SRI V2.txt 92471 2231 9 Articulo SRI V3.txt 33925 2980 10 Articulo SRI.txt 52088 11 Biometria wikipedia.txt 14351 297 12 Biometria.TXT 14066 328 13 CLEI 2007.txt 46217 2855 14 Compresion internet.txt 38987 608 15 CompresionV0.txt 24530 468 16 CompresionV1.txt 24048 920 17 CompresionV2.txt 45116 967 18 CompresionV3.txt 78221 2278 19 CompresionV4.txt 107678 3370 20 CompresionV5.txt 86935 2558 21 Cuadro de Mando Integral.TXT 6938 531 22 Desenredadndo la madeja V1.txt 1829 23 Desenredadndo la madeja V2.txt 4243 1716 24 Diagnostico tuberculosis Procesamiento.TXT 32074 25 Espacio vectorial V0.txt 56375 1263

23 Para los tiempo de ejecución
Secuencia Maximales Lenguaje Natural Item Nro. Documento a comparar contra la BD Tiempo proceso (ms) 26 Espacio vectorial V1.txt 14266 968 27 Espacio vectorial V2.txt 31406 702 28 Espacio vectorial V3.txt 17531 171 29 Espacio vectorial V4.txt 14485 156 30 Espacio vectorial V6.txt 16015 31 Evaluacion VAN RIJSBERGEN.txt 12594 686 32 Formato articulos CLEI.txt 7125 94 33 Informe final SRI.txt 138969 2496 34 introducci¢n a los sistemas de recuperaci¢n de informaci¢n.txt 24906 6162 35 Motor de B£squeda 1.TXT 50172 1872 36 Motores de busqueda 2.TXT 34891 749 37 Reconocimiento de voz 1.TXT 4187 796 38 Reconocimiento de voz 2.TXT 3219 1653 39 Reconocimiento de voz wikipedia.txt 31164 234 40 Reconocimiento de voz.TXT 16359 1295 41 Recuperacion de informacion.txt 24812 4290 42 SegmentacionV1.txt 58796 43 SegmentacionV2.txt 52422 1326 44 SegmentacionV3.txt 42063 1202 45 SegmentacionV4.txt 56578 1358 46 SegmentacionV5.txt 62375 1606 47 SegmentacionV6.txt 78219 2777 48 SegmentacionV7.txt 94219 2667 49 SegmentacionV8.txt 97938 2621 50 Sistema Experto.TXT 45234 1497

24 Comparación de tiempo de ejecución

25 Para el porcentaje de detección de plagio
Secuencia Maximales Lenguaje Natural Item Nro. Documento a comparar contra la BD Porcentaje de plagio (%) 1 algoritmos.TXT 41 5 2 Arte evaluacion.txt 71 91 3 Articulo PLN V0.txt 70 53 4 Articulo PLN V1.txt 100 97 Articulo SRI internet.txt 31 6 Articulo SRI REVISTA.txt 55 86 7 Articulo SRI V1.txt 98 92 8 Articulo SRI V2.txt 99 96 9 Articulo SRI V3.txt 10 Articulo SRI.txt 11 Biometria wikipedia.txt 12 Biometria.TXT 39 13 CLEI 2007.txt 14 Compresion internet.txt 15 CompresionV0.txt 16 CompresionV1.txt 17 CompresionV2.txt 18 CompresionV3.txt 19 CompresionV4.txt 81 66 20 CompresionV5.txt 85 21 Cuadro de Mando Integral.TXT 34 22 Desenredadndo la madeja V1.txt 46 23 Desenredadndo la madeja V2.txt 24 Diagnostico tuberculosis Procesamiento.TXT 25 Espacio vectorial V0.txt 56

26 Para el porcentaje de detección de plagio
Secuencia Maximales Lenguaje Natural Item Nro. Documento a comparar contra la BD Porcentaje de plagio (%) 26 Espacio vectorial V1.txt 68 65 27 Espacio vectorial V2.txt 22 28 Espacio vectorial V3.txt 96 72 29 Espacio vectorial V4.txt 75 34 30 Espacio vectorial V6.txt 60 33 31 Evaluacion VAN RIJSBERGEN.txt 13 32 Formato articulos CLEI.txt 23 Informe final SRI.txt 44 4 introducci¢n a los sistemas de recuperaci¢n de informaci¢n.txt 57 35 Motor de B£squeda 1.TXT 36 Motores de busqueda 2.TXT 40 3 37 Reconocimiento de voz 1.TXT 69 86 38 Reconocimiento de voz 2.TXT 90 11 39 Reconocimiento de voz wikipedia.txt 56 Reconocimiento de voz.TXT 71 41 Recuperacion de informacion.txt 98 42 SegmentacionV1.txt 99 91 43 SegmentacionV2.txt SegmentacionV3.txt 97 45 SegmentacionV4.txt 46 SegmentacionV5.txt 94 47 SegmentacionV6.txt 92 48 SegmentacionV7.txt 100 49 SegmentacionV8.txt 95 50 Sistema Experto.TXT 1

27 Comparación de porcentaje de detección de plagio

28 Resultados

29 Resultados para el tiempo de ejecución
SECUENCIA MAXIMALES LENGUAJE NATURAL gl n 50 98 Media S t = Rechazo Ho Si t > "Como t = < se acepta Ho"

30 Resultados para porcentaje de plagio
SECUENCIA MAXIMALES LENGUAJE NATURAL gl n 50 98 Media 72 52.96 S t = Rechazo Ho Si t > "Como t = < se acepta Ho"

31 Conclusiones

32 Conclusiones Se acepta la Hipótesis nula para el tiempo de ejecución, es decir el algoritmo de Secuencias Maximales requiere de un mayor tiempo de ejecución que el algoritmo Lenguaje Natural Se acepta la Hipótesis nula para el porcentaje de detección de plagio, es decir el algoritmo de Secuencias Maximales detecta mayor porcentaje de plagio frente al algoritmo de Lenguaje Natural.

33 Bibliografía

34 Bibliografía Estadística Descriptiva e Inferencial
Córdova Zamora, Manuel (2003)


Descargar ppt "Experimentación Numérica"

Presentaciones similares


Anuncios Google