Tópicos en Bioinformática Elmer A. Fernández (PhD, Bioing) CONICET-UCC elmer.fernandez@ucc.edu.ar http://www.uccor.edu.ar/modelo.php?param=3.8.5.15 Fac. de Ingeniería – UNC - 2010
Pregunta? Qué es Bioinformática Bioinformatics is the application of information technology to the field of molecular biology. Bioinformatics entails the creation and advancement of databases, algorithms, computational and statistical techniques, and theory to solve formal and practical problems arising from the management and analysis of biological data. …. It is the name given to these mathematical and computing approaches used to glean understanding of biological processes. Common activities in Bioinformatics include mapping and analyzing DNA and protein sequences, aligning different DNA and protein sequences to compare them and creating and viewing 3-D models of protein structures. Qué es Bioinformática Bioinformatics is that branch of life science,which deals with the study of application of information technology to the field of molecular biology. The primary goal of bioinformatics is to increase our understanding of biological processes. What sets it apart from other approaches, however, is its focus on developing and applying computationally intensive techniques (e.g., data mining, and machine learning algorithms) to achieve this goal. Major research efforts in the field include sequence alignment, gene finding, genome assembly, protein structure alignment, protein structure prediction, prediction of gene expression and protein-protein interactions, and the modeling of evolution.
Qué es para mi? Biología ….. Tecnología Medicina …. Agronomia Biología Molecular Bases de datos Bioingeniero Estadística Apnredizaje Automático …. Informática Sistemas de Información Tecnología Modelos Bioinformático Equipamiento …..
Un mejor modelo Biología ….. Tecnología Medicina …. Agronomia Biología Molecular …. Tecnología Modelos Bases de datos Equipamiento Estadística Apnredizaje Automático Informática Sistemas de Información …..
Con qué objetivo?
Bioinformático-Bioingeniero No son antagónicos sino complementarios Capacidades diferenciadas Deben actuar como nexo entre las necesidades en el ámbito de la Biología y las tecnologías asistentes.
Porqué surge la bioinformática Las planillas de MS Excel ya no alcanzan. Globalización de la información y de los recursos. Necesidades de cálculo intensivo Necesidades de modelado intensivo Contrastar por modelos lo observado en la realidad Tecnologías de alto rendimiento, un nuevo paradigma ….
Resumiendo… DATOSSSSS reporte Dato datito Datum Data Planilla excel Calculo DATO Variables Atributos Archivo congreso presentación Imagen Perfil Expresión génica Datos Base de datos Servidor Laboratorio ATRIBUTOS Proteinas DATOS DATITITO DATOSSSSS
Cuál es el rol fundamental del BioIn…loquesea Instaurar un lenguaje común entre el mundo de la biología y el de la tecnología. Ejemplos IA-Estadística Proyecto Bélgica. Diseño stent US-Latin American Cancer Research Network
Cómo es el entorno de trabajo Multidisciplinar Biólogos Médicos Bioingenieros Estadísticos Físicos Matemáticos Técnicos Informáticos Etc.
Algunos títulos LIMS Chemometrics Biometrics Genomics Proteomics Technology BD Data Mining
LIMS Laboratory Information Management Systems Administrar la información Biotecnológica Proveer herramientas de comunicación Proveer herramientas de análisis y búsqueda Conectar los distintos sistemas y equipos. Proveer capacidades de seguimiento Importante para las facilities ¿Capacidades?
Chemometrics Modelado molecular Interacción de moléculas con el medio Modelos moleculares LIMS NIR Desarrollo de Drogas
Biometrics Diseño de experimentos Modelos estadísticos en biología Inferencia Técnicas estadísticas para resumen y visualización de datos. ¿Capacidades?
Genomics Secuenciamiento (Biosidus) Microarreglos de ADN (Biosidus, INTA, Leloir, UBA) (ETC international, Agilent) Ontologías Curado de bases de datos TextMining Cáncer, etc.. ¿Capacidades?
Tecnologías asociadas: Microarreglos de ADN
Proteomics Folding, predicción estructural Secuenciamiento Interacción con el agua Modelado 3D (Homologías) Ontologías Curado de bases de datos Vías Metabólicas M/Z Geles bidimensionales ¿Capacidades?
Tecnologías asociadas: MALDI-TOF LIMS?
Tecnologías asociadas: Expresión diferencial de proteínas
Tecnologías asociadas: Modelado de moléculas
Bases de Datos No existen en Argentina bases de datos preparadas para ámbitos de biología Las bases de datos solo están pensadas con el propósito de almacenar No hay consenso en Argentina Flexibilidad insuficiente (sharing) Estructuras inadecuadas (Data Mining) Curado ¿Capacidades?
Data Mining Knowledge Discovery in Databases es el proceso no trivial de identificación de patrones sobre los datos. Estos deberán resultar ser válidos, novedosos, potencialmente útiles y entendibles.
Data Mining Knowledge Discovery Sistemas de adquisición y Monitorización Estadística Inteligencia Artificial Reconocimiento de patrones Computación avanzada Visualización Tecnologías de Bases de datos
Y casi al final…Ontologías
La estrella del momento Secuenciadores de “próxima” generación 454 Roche: Pirosecuenciador (Arg) De novo sequencing Metagenomica Solexa ILLUMINA Solid ABI
Next? Generation Sequencing
Nuestro grupo Grupo de Minería de Bio-Datos (BioData Mining) Dr. Elmer Fernández, Bioing. Cristobal Fresno Universidad Católica de Córdoba CONICET Campus-Camino Alta Gracia km 7 ½ 5000 – Cba.
Con quien trabajamos? Dra.Mónica Balzarini (Dpto. Biometria- UNC) Dr. Osvaldo Podhajcer (Terapia Celular y Molecular- Inst. Leloir) Dra. Andrea Llera (Terapia Celular y Molecular- Inst. Leloir) Adivisor: Dr. Terence Speed (WHEI- Australia & UC Berkeley-USA)
Nuestro grupo en la UCC http://sites.google.com/site/biologicaldatamininggroup/Home/
Historia en la UCC Comienzos en 2004 2006 post-doc visitante @ islab, Antwerp, Belgica 2006-2008 Master en App. Stat. 2009 candidato Doctorado
Líneas de interés en investigación KDD en ciencias biomédicas a través de técnicas estadístico-computacionales Aprendizaje Maquinal Artificial Neural Networks Support Vector Machines Clustering Estadística Generalized Linear Mixed Models Partial Least Squares
Líneas de interés en investigación Proceso Unificado de Análisis para DM en Bio-ciencias (PUA-DMB) Administración de datos biológicos Desarrollo de técnicas basadas en aprendizaje computacional para Clustering and Classificación Desarrollo de estrategias estadísticas para análisis de datos bajo diferentes supuestos distribucionales con efectos aleatorios y estructuras de correlación Procesamiento de señales/datos Biomédicos
Historia en la UCC Comienzos en 2004 2006 post-doc visitante @ islab, Antwerp, Belgica 2006-2008 Master en App. Stat. 2009 candidato Doctorado
Líneas de interés en investigación KDD en ciencias biomédicas a través de técnicas estadístico-computacionales Aprendizaje Maquinal Artificial Neural Networks Support Vector Machines Clustering Estadística Generalized Linear Mixed Models Partial Least Squares
Líneas de interés en investigación Proceso Unificado de Análisis para DM en Bio-ciencias (PUA-DMB) Administración de datos biológicos Desarrollo de técnicas basadas en aprendizaje computacional para Clustering and Classificación Desarrollo de estrategias estadísticas para análisis de datos bajo diferentes supuestos distribucionales con efectos aleatorios y estructuras de correlación Procesamiento de señales/datos Biomédicos
Líneas de interés en investigación Proceso Unificado de Análisis para DM en Bio-ciencias (PUA-DMB) PUA-DMB es un entorno ordenado para el análisis de estudios biológicos Control Cardiovascular Genómica y Proteómica Funcional Hemodialisis …… PUA-DMB
Líneas de interés en investigación PUA-DMB en Hemodialisis Desarrollo de técnicas analíticas para monitoreo molecular-antropométrico en pacientes en tratamiento: Diagnóstico de la eficiencia Evaluación de biomarcadores Caracterización de pacientes en pos de tratamientos sujeto-específico
Líneas de interés en investigación PUA-DMB en Control Cardiovascular Abordaje estadístico del control Cardiovascular mediante supuestos no- normales Estudios del balance en el sistema nervioso central Análisis del ECG para detección de apnea Desórdenes eléctricos y Mechano-Electrical Feedback.
Líneas de interés en investigación PUA-DMB en Genómica y Proteómica Funcaional Métodos estadísticos y de Aprendizaje maquinal para análisis patrones de genes y proeínas DNA Microarray data analysis (INSPECTOR,SOM) Agriculture, cancer, etc. Gel based protein analysis (2D-DIGE technology) Modelos estadísticos para análisis de invación celular.
Líneas de interés en investigación Optimización y diagnóstico de clasificadores y regresores no- paramétricos (aprendizaje maquinal) Selección de características Validación, evaluación y selección de modelos Aprendizaje Maquinal en contextos estadísticos: Comportamiento de técnicas computacionales de reconocimiento de patrones bajo hipótesis distribucionales conocidas.
El mapa de colaboraciones M. Balzarini (PhD) Biometrics Dept. UNC BDMG UCC J. Lopez del Olmo (PhD) CNIC - Spain Estudios moleculares y funcionales de la transición epitelio mesenquimal y su impacto en el aumento de la agresividad tumoral. PICT-2008 Statistical Models for protein pattern analysis. MinCyt –cba 2008 Llera (PhD) Moll. And Cell therapy Lab. Leloir Inst. - Argentina Somewhere in the world: Terry Speed Functional Genomics and Proteomics
El mapa de colaboraciones M. Balzarini (PhD) Biometrics Dept. UNC P. Willshaw (PhD) School of Health Sciences Swansea Univ. - UK BDMG UCC R. Valtuille (Phys) Fresenius Medical Care Arg. Hemodialysis
El mapa de colaboraciones M. Balzarini (PhD) Biometrics Dept. UNC BDMG UCC P. Abry (PhD) Ecole Normal Superieur de Lyon - France Cardiovascular Control and Signal Processing
Experiencias en empresas/centros de I+D GALIX (Holter de ECG) Fresenius Medical Care Aeromedical (Stent Coronario) INTA INTI UBA Ledesma
Hasta la próxima Make everything as simple as possible, but not simpler (A. Enstain) Si uno hace lo que todo el mundo hace, obtiene lo que todo el mundo obtiene. (¿?) El atroz encanto de ser argentinos, M. Aguinis
Muchas Gracias