Descargar la presentación
La descarga está en progreso. Por favor, espere
Publicada porRenato Vilaverde Custódio Modificado hace 5 años
1
Una Aplicación del Software R en el Análisis de Bases de Datos
Celaya 2017 Dr. Manuel Jesús Reyes Méndez Instituto Tecnológico de Cd. Juárez
2
Objetivo General: acceder, clasificar y predecir la pertenencia de datos
En medicina se ligan los síntomas con las enfermedades Los sistemas expertos han apoyado en los diagnósticos del cáncer con la clasificación de datos mediante: El procesamiento de imágenes El aprendizaje de máquina El método automático de clasificación logra una mayor exactitud al distinguir entre células malignas y benignas.
3
La capacidad para diagnosticar correctamente el cáncer
Algunos cánceres de seno son detectados como un tumor, la mayoría son benignos Hay tres métodos para el diagnóstico de cáncer de mama: La mamografía La Aspiración con Aguja Fina (FNA) La biopsia quirúrgica Mediante mamografía varía de 68% a 79% Con FNA de 65% a 98% Con biopsia quirúrgica cerca del 100% La capacidad para diagnosticar correctamente el cáncer
4
Base de Datos de cáncer de mama de la Universidad de Wisconsin.
Base de Datos creada por el Dr. William H. Wolberg en los hospitales de la Universidad de Wisconsin en Madison En los 90s se generó la Base de Datos con de muestras de FNA La Base consiste en: 458 casos benignos (65.5%) y 241 casos malignos (34.5%)
5
Las Variables o Atributos
6
1. Importación de los datos a Excel
En el ayudante para importar texto de Excel. Declarar que los datos se encuentran separados mediante comas
7
2. Excel: Asignación de variables
3. Excel: Grabar como archivo delimitado por comas CSV
8
4. R: Leer archivo delimitado por comas CSV
9
5. R: Datos de la variable V10
> V10G1<-G1$V10 Dispersión de la variable V10 > boxplot(V10G1,V10G2,V10G3,V10G4,V10G5,V10G6,V10G7,V10G8)
10
6. Registros cuando la clase de cáncer =10
> Sel<-V10G1==10 > as.data.frame(Sel) > V10G1M<-G1[Sel,]
11
7. Ordenación de datos > Ord<- order(V10G1M$V2)
> V10G1M[Ord, ]
12
8. Análisis de frecuencias
> F1<-table(V10G1) > F1 V10G1 > T1<-sum(F1) > FR1<-F1/T1 > FA1<-cumsum(FR1) > plot(FA1,xlab = "Indicador de gravedad", main = "Frecuencias Acumuladas V10G1",type = "l")
13
Conclusiones Mediante este ejercicio se obtuvo la información de una página web El análisis realizado a los datos de cáncer de mama es básico e ilustrativo El propósito de este trabajo fue mostrar el procedimiento de importación de datos de la web a R Se concluye que R es de gran utilidad para fomentar el conocimiento y la investigación aplicada
14
Trabajos Futuros BayesiaLab R: bnlearn
Presentaciones similares
© 2024 SlidePlayer.es Inc.
All rights reserved.