Representación De La Información. Solo para principiantes.

Slides:



Advertisements
Presentaciones similares
Tipos de datos Numéricos: Constan de números y puntos decimales, así como de signos positivos y negativos con los cuales es posible efectuar operaciones.
Advertisements

Arreglos Unidimensionales y Bidimensionales ESTRUCTURAS DE DATOS I
Álgebra de Boole El álgebra booleana es un sistema matemático deductivo centrado en los valores cero y uno (falso y verdadero). Un operador binario " º.
Curso de java básico (scjp)
Capítulo 1 Algebra de Boole.
Representación de la información
La aritmetización de la sintaxis
Conceptos básicos Def. Un símbolo es cualquier carácter imprimible.
Aritmética del Computador Introducción a la Tecnología de la Información.
CLASE 1 SISTEMAS NUMÉRICOS Y CÓDIGOS
Máquinas de estado Máquinas de estados :
funciones Por: Carlos Alberto García Acosta
APLICACIONES DE ALGEBRA BOOLEANA
CIRCUITOS ELECTRICOS Y ELECTRONICOS
CLASE 3.
Estructuras de Datos (ARRAYS)
Las estructuras de arreglos fueron usadas en las primeras computadoras digitales, cuando la programación se hacía todavía en lenguaje máquina, para tablas.
Unidad 2 Algoritmos y resolución de problemas
Tipo de Dato Abstracto Tipos de datos:
ALGORÍTMICA Dpto. Ingeniería de Sistemas y Automática
INTRODUCCIÓN AL ALGEBRA
Arreglos Ing. Nahiby Castillo.
Estructuras de datos M.I.A Daniel Alejandro García López.
Unidad 3 Punteros.
Manipulación de caracteres e hileras de texto
Universidad Autónoma San Francisco

Tema 6: Clases Antonio J. Sierra.
TÉCNICO EN PROGRAMACIÓN DE SOFTWARE Instructor: Ingeniero Adrián Guerrero Taborda
Teoría de Grafos.
UNIVERSIDAD DE MANAGUA I CUATRIMESTRE INTRODUCCION A LA PROGRAMACION
EXPONENTES Y RADICALES
LENGUAJE “C” Programación.
Representación de Números en un Registro Binario
Material de apoyo Unidad 1 Estructura de datos
Matrices Es una estructura homogénea, compuesta por varios elementos, todos del mismo tipo y almacenados consecutivamente en memoria A cada elemento se.
CARACTERÍSTICAS DE LOS PROGRAMAS
TIPOS Y ESTRUCTURAS BÁSICAS DE DATOS
ESTRUCTURAS DE DATOS I Conocer, comprender y analizar algunos de los principales tipos de estructuras de datos.
Índice. Revisando conceptos acerca de la memoria.
ESTRUCTURA DE DATOS EN JAVA
Clase 10: Estructuras de datos y arreglos.
Programación IMC José Andrés Vázquez Flores. Definición Un arreglo es un conjunto finito e indexado de elementos homogéneos, que se referencian por un.
Sistemas de numeración
COMPONENTES DE UN ALGORITMOS
Aplicación de estructuras de datos
Fundamentos de Programación
Programación en C para electrónicos
Unidad 1: FUNDAMENTOS DE COMPUTACIÓN Y PSEUDOLENGUAJE
Ordenación El ordenamiento por inserción (insertion sort en inglés) es una manera muy natural de ordenar para un ser humano, y puede usarse fácilmente.
Organización del Computador I Verano 2007
Términos algoritmo diseñar algoritmo implementar algoritmo
VALOR ABSOLUTO Y LOS NÚMEROS REALES
ELEMENTOS DE COMPUTACIÓN Profesor: Guillermo Figueroa
Estructura de datos I CIS - UABJB.
UNIVERSIDAD TECNICA PERTICULAR DE LOJA
Teoría de lenguajes y compiladores
MATEMÁTICA 2013 Unidad I Raices.
TIPOS DE DATOS.
Presente un cuestionario con los aspectos mas importantes sobre los
Fundamentos de Programación
Computación I. CI-2125 Tema VII
Algoritmos y Desarrollo de Programas I
MIA - Grupo 5 Unidad 2.
ARREGLOS BIDIMENSIONALES MATRICES Son un espacio de almacenamiento continuo, que contiene una serie de elementos del mismo tipo de datos. Desde el punto.
Sistema Binario
EL TIPO DE DATO LOGICO y constantes.
Visual Basic Prof.: Carol Briones García. Uso de Archivos  Definición  Es un conjunto de información que se almacena en algún medio de escritura que.
UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MÉXICO FACULTAD DE INGENIERÍA COORDINACIÓN DE MATERIAS PROPEDÉUTICAS INGENIERÍA EN SISTEMAS ENERGÉTICOS SUSTENTABLES.
Transcripción de la presentación:

Representación De La Información. Solo para principiantes.

¿Qué Es Información?

Bit, Como Unidad Mínima De Información. Es la forma básica de representar información. Con un conjunto de bits se puede representar información más compleja como: Números, caracteres, imágenes, etc.

Representación De Números La representación de números se basa en el álgebra de bool. La mísma es capaz de representar, con un número (n) finito de dígitos booleanos, un número finito de números naturales (2 n ). N = 2: 00 = 0, 01 = 1, 10 = 2, 11 = 3.

Números Enteros Si existen 2 n números en n dígitos binarios, entonces podemos representar 2 n-1 -1 números enteros positivos y 2 n-1 -1 negativos. 000 = 0, 001 = 1, 010 = 2, 011 = = 0, 101 = -1, 110 = -2, 111 = -3.

Números Reales Si tenemos números enteros podemos representar a los números reales con la fórmula M.2 n, donde M y n son números enteros. (¡Notación exponente, pero en base 2!)

Enumerados Si a cada número entero lo asociamos a un valor en especial, estos valores especiales los llamamos enumerados. 0 = calor, 1 = frío, 2 = cómodo.

Caracteres Ahora si asignamos a cada valor natural un símbolo tenemos un enumerado de símbolos: caracteres. Existen varias normas para determinar esa asociación de símbolos con números, la más conocida es ASCII.

Secuencias De Caracteres. La secuencia de caracteres es una lista de símbolos seguidas una de otra. Tienen orden y las operaciones más comunes son: S[i] : referencia el carácter que está en la posición i de la secuencia S. S.a : agregamos el carácter a al final de la secuencia S. HOLA

Vectores Es una secuencia de elementos (números, enumerados, referencias, etc.) Donde la referencia a uno de esos elementos es instantánea. Al igual que una secuencia una referencia es instantánea. Podemos decir que una cadena de caracteres es un vector de caracteres, la mayor diferencia existe que en un vector no es común insertar y eliminar datos. V[i]: referencia al i-ésimo elemento del vector V

Matrices Un vector de vector es una matriz. M[i][j]: referencia el elemento (i,j) de la matriz M

Referencias Las referencias son elementos que identifican elementos. Los elementos podemos copiarlos, con lo que cualquier modificación a la copia no modifica al original. O referenciarlo, con lo que si modificamos la referencia modificamos el origina. 5

Listas Una lista, a diferencia de una secuencia de caracteres, hay que recorrerla secuencialmente para poder llegar a algún elemento de la misma. HOLA

Árboles Un árbol es una estructura donde se almacenan nodos y referencia a los nodos. La cantidad de referencias de un nodo determina la topología de un árbol. H O L A L

Redes Al igual que un árbol, cada nodo tiene un número determinado de referencia. Pero las referencias puede generar ciclos. BsAs Córdoba S. Fe

Clases vs. Instancias La clase refiere a la descripción de la estructura. Una instancia refiere a la estructura.

Programación

Expresiones Las expresiones devuelven un valor, tanto de verdad como numérico o estructura ´HOLA´[i].'c' a = b

Asignación Los valores devueltos en las expresiones se les puede recordar o almacenar para luego usar nuevamente. Agrega la noción de variable. A < B, C <-- S[i], S[i+1] A, B <-- B, A

Condiciones Las condiciones usan las expresiones booleanas tomar decisiones durante un proceso. Si 5 > a entonces imprimir Verdadero.

Ciclos Un proceso repetitivo necesita un ciclo. El mismo se detiene cuando cumple alguna condición lógica. A <-- 5 B <-- 2 Mientras A > 0 hacer M <-- M + B A <-- A – 1 Fin Mientras.

Formalidad y pseudocódigo. Para poder entender un algoritmo hay que entender el lenguaje en que esta descripto. Cómo la formalidad molesta a la hora de entender un algoritmo, se decidió que la mejor manera es describirlos un código pseudo formal: el pseudocódigo.

Descanso...

Aprendizaje Automático y Datamining En Biología Molecular.

¿Qué significa AA? Decimos que un agente o un programa de computación aprende de la experiencia E con respecto a cierta clase de tareas T con la medida de performance P, si su performance en la tarea T, medida por P, mejora con respecto a la experiencia E.

Por ejemplo... Un programa de computación que aprende a jugar al ajedrez debería mejorar su performance, medida por su habilidad de ganar en la clase de tareas correspondientes a jugar partidas de ajedrez, a través de la experiencia obtenida jugando partidas.

Algunos ejemplos en Biología Molecular Análisis inductivo de la estructura super- secundaria de proteínas. Inducción simbólica en secuencias de DNA y proteínas. Regulación molecular. Codificación basada en conocimiento de la topología de proteínas.

Algunos ejemplos en Biología Molecular Predicción de la topología proteica a través de satisfacción de restricciones. Diseño de drogas. Predicción de alfa-hélices. Etc.

Datamining Análisis y exploración automática de grandes bases de datos para extraer información útil y no evidente.

Visualización Junto con las técnicas de AA, la visualización es esencial para el datamining.

Entrada Conceptos, Instancias y Atributos.

¿Qué es un concepto? Clasificación: Conocer todos los posibles ejemplos, conocidos o no, que existan para una clase. Asociación: Conocer asociaciones entre atributos que nos permita predecir un valor.

¿Qué es un concepto? Clustering: Grupos de ejemplos que tengan alguna asociación. Predicción numérica: Igual que la asociación, pero el valor que se desea predecir no es discreto sino numérico.

Conclusiones sobre conceptos. El concepto varía según lo que queremos aprender. El conjunto de ejemplos que elijamos determinará el concepto que aprenderá el algoritmo de aprendizaje automático.

¿Qué es un ejemplo? La entrada en una esquema de aprendizaje automático es un conjunto de instancias. Las instancias son cosas que queremos clasificar, asociar o clusterizar. Una instancia es un ejemplo individual e independiente de un concepto a aprender.

Ejemplos de Ejemplos Apariencia, Temperatura, Humedad, Ventoso, Jugar SoleadoCalienteAltaNoNo SoleadoCalienteAltaSiNo NubladoCalienteAltaNoSi LluviosoMedioAltaNoSi LluviosoFrioNormalNoSi LluviosoFrioNormalSiNo

Ejemplos de Ejemplos NubladoFrioNormalSiSi SoleadoMedioAltaNoNo SoleadoFrioNormalNoSi LluviosoMedioNormalNoSi SoleadoMedioNormalSiSi NubladoMedioAltaSiSi NubladoCalienteNormalNoSi LluviosoMedioAltaSiNo

¿Qué es un atributo? Cada instancia individual e independiente que es entrada de un algoritmo de aprendizaje automático esta caracterizado por valores fijos ó atributos.

Salida Representación del Conocimiento

Tablas de decisión Si apariencia = soleado y humedad = alta entonces jugar. Si apariencia = lluvioso y vientoso entonces no jugar. Si apariencia = nublado entonces jugar. Si humedad = normal entonces jugar. Otro estado entonces jugar.

Árboles de decisión. Apariencia Ventoso Humedad NoSi No Si

Reglas de Clasificación A C B C D D X X X Ejemplos: Si A y B entonces X Si C y D entonces X

Reglas de asociación Si ventoso y no juego entonces. apariencia = soleado y humedad = alta.

Otras formas...

Espacio de Búsqueda Una muestra con todos los ejemplos.

Sesgo Sesgo del lenguaje. Sesgo de la búsqueda. Sesgo para el sobre-aprendizaje.

Credibilidad Evaluando lo aprendido.

Entrenando y probando. Espacio de prueba vs. Muestra: Error. Porcentaje de errores cometidos en la prueba. Tamaño de la muestra con respecto al tamaño del espacio de prueba. ¡Comparar algoritmos!

Validación cruzada Objetivo: Conocer el error y sesgo del algoritmo a partir de una muestra. De un conjunto de ejemplo, dividir aleatoriamente en dos conjuntos: Prueba y Test. Obtener el error del algoritmo.

Validación cruzada Realizar los dos pasos anteriores varias veces. Cuando exista una suficiente cantidad de pruebas realizadas (>30 ?) se puede calcular el error medio y el sesgo que tiene el algoritmo para ese tipo de prueba.

¿Preguntas?

Referencias Programación A Method of Programming Autor: Edsger Dijkstra y W.H.J. Feijen Editorial: Addison-Wesley Lógica para Computación Autor: Francisco Naishtat Editorial: EUDEBA

Referencias AA y Datamining Mitchell, T. M. Machine learning, Boston, McGraw-Hill, Datamining, practical machine learning tools and techniques with JAVA implementatios. IAN H. WITTEN, EIBE FRANK. Mourgan Kaufmann