La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Introducción a la gestión de datos

Presentaciones similares


Presentación del tema: "Introducción a la gestión de datos"— Transcripción de la presentación:

1 Introducción a la gestión de datos
Tema 1

2 1.1.- INTRODUCCIÓN AL Procesamiento de datos
Información: Es la comunicación o adquisición de conocimientos que permiten ampliar o precisar los que se poseen sobre una materia determinada, ya sea mediante la observación, la escucha o el análisis. Datos: Cuando recibimos información, pasamos a “catalogarla o almacenarla” en forma de datos. Los datos son representaciones de la información usando medios conocidos. (Hasta que no hemos elegido unas reglas, no podemos decir si unos ojos son grandes, pequeños, azules, verdes, están alegres o muestran enfado). Es decir, los datos son la forma en la que representamos y almacenamos la información.

3 MUNDO REAL INFORMACIÓN DATOS OBSERVACIÓN El ser humano observa el mundo real mediante sus sentidos, le aplica conocimientos anteriores y extrae conocimientos nuevos. Si estos nuevos conocimientos se pueden concretar y transmitir constituyen información. Los símbolos y conceptos usados para concretar dicha información son los datos.

4 La informática es la ciencia que estudia el tratamiento automático de la información.
Un ordenador permite manejar y procesar gran cantidad de información en poco tiempo por lo que, en determinadas tareas, un ordenador puede resolver en pocos segundos problemas que llevaría años resolver a una persona mediante los medios tradicionales. Para poder conseguir que el ordenador maneje “nuestros” conceptos necesitamos una forma de representarlos mediante datos en la memoria del ordenador, de esta forma podremos trabajar con números decimales, con datos económicos, con imágenes, etc…

5 Para el manejo de la información mediante ordenadores hay que tener en cuenta que:
El ordenador debe tener toda la información necesaria para realizar sus tareas, de otro modo no sabrá realizarlas. Esa información debe serle proporcionada de forma que el ordenador pueda “entenderla”. Para sintetizar la información que se quiere almacenar o procesar en el ordenador se debe concretar y definir en forma de datos. El procesamiento de datos se hace mediante programas que indican al ordenador qué hacer exactamente en cada momento y situación concretos.

6 Para el almacenamiento de la información, los ordenadores disponen de varios dispositivos con distintas funciones: La memoria principal se encarga de almacenar la información que se está procesando en un momento dado y sus resultados. Esta memoria sólo almacena datos si recibe un suministro de energía continuo. La memoria secundaria se usa para almacenar los datos de forma permanente. Tiene una capacidad muy superior a la memoria principal pero una velocidad mucho más lenta.

7 1.2.- SISTEMAS DE INFORMACIÓN
Cualquier agrupación humana (empresas, instituciones, familias,…) trata continuamente con datos, este tratamiento produce información que la agrupación usa para tomar decisiones que afectan a su funcionamiento o su entorno (cuenta de gastos, datos del personal, una receta de cocina…). Definimos sistema de información como un conjunto de herramientas de trabajo, reglas de uso, datos y relaciones entre estos elementos que sirve para generar una información de salida nueva a partir de los elementos mencionados.

8 Las funciones básicas de un sistema de información son las siguientes:
Recogida de datos: El sistema usa datos y éstos deben ser suministrados de alguna manera. Almacenamiento: Los datos suministrados deben guardarse si no se van a usar de forma inmediata. Procesamiento: Es la principal utilidad del sistema de información, estudia los datos proporcionados para generar conclusiones en forma de datos nuevos o modificados. Presentación: La información de salida del sistema debe ser suministrada a las personas correctas de una forma que el destinatario pueda interpretar.

9 Los sistemas de información grandes manejan grandes cantidades de datos y por tanto las operaciones que se pueden realizar sobre ellos son muy numerosas y pueden ser muy complejas (Ministerios, hospitales, bancos…). Para poder gestionarla con efectividad son necesarios los sistemas informáticos, que automatizan las tareas mediante ordenadores y programas informáticos ahorrando tiempo y ganando en precisión.

10 Los componentes de cualquier sistema informático son:
Equipo físico: Ordenadores, periféricos y elementos de interconexión. Equipo lógico: Los componentes software de los equipos, es decir, sistemas operativos, sistemas de gestión de datos, aplicaciones… Usuarios: Cada usuario tiene una tarea concreta dentro del sistema de información, recoger datos, introducirlos, controlar el funcionamiento, etc…

11 1.3.- Organización de la INFORMACIÓN
Para ser de utilidad, los datos deben estar organizados de forma que resulten útiles y accesibles en todo momento. Para ello, se utiliza una forma de clasificar los datos que tiene mucho que ver con la percepción mental que las personas tienen de la realidad. Esta clasificación incluye los términos: Entidad. Atributo. Valor. Dominio.

12 Entidad: Es cualquier cosa real que se pueda identificar y distinguir
Entidad: Es cualquier cosa real que se pueda identificar y distinguir. (Un perro, una mesa, un pueblo,…) Atributo: Son cualidades o propiedades de una entidad. (Un perro puede tener como atributos la raza, el peso, la edad…) Valor: Los atributos son los mismos para todos los elementos de una entidad, pero es el valor de los atributos lo que diferencia a dos elementos distintos de la misma entidad. (Todos los perros tienen raza, peso y edad, aunque no todos tienen el mismo) Dominio: Es el conjunto de valores que puede tomar un atributo. (El atributo raza puede tomar el valor “labrador”, pero no “bosquimano”).

13 Para diferenciar correctamente dos elementos correspondientes a un mismo tipo de entidad, necesitamos conocer el valor de todos sus atributos, aunque no siempre es necesario puesto que puede haber unos atributos más determinantes que otros. En este sentido, deducimos que si tenemos un atributo que identifique unívocamente una instancia de una entidad, agilizaremos el proceso de identificarlo. Para ello utilizaremos el atributo identificador o clave, que puede ser real o ficticio. Una persona se identifica por su DNI o un coche por su matrícula. Puede haber muchas personas con el mismo nombre e incluso con el mismo nombre y apellidos, pero no con el mismo DNI. Si no existe el atributo clave lo podemos crear, como se hace en los supermercados para identificar productos mediante la numeración del código de barras.

14 En términos informáticos usamos los siguientes términos:
Una vez que tenemos decidida la organización la información, debemos representarla adecuadamente en el sistema informático. En términos informáticos usamos los siguientes términos: Archivo: a la representación de las entidades. En cada archivo se almacena generalmente la información correspondiente a una de las entidades que definimos. En un archivo tenemos todos los datos de la entidad alumnos. Registro: Contiene los valores concretos de cada elemento de la entidad. En un registro tenemos todos los datos del alumno Luis. Campo: Se corresponden con los atributos de la entidad. En un registro tendremos varios campos y cada uno de ellos almacena un dato sobre Luis.

15 1.4.- sistemas gestores de ficheros
Fichero es sinónimo de archivo. Los ficheros que tratamos en este módulo son ficheros destinados a almacenar información permanentemente, por lo que se guardan en la memoria secundaria. Sin embargo, al trabajar con los ficheros, utilizamos unas estructuras de datos similares a ellos, pero que se encuentran en la memoria principal. Son lo que llamamos ficheros internos o temporales.

16 Según el uso que se le vaya a dar al fichero, distinguiremos los siguientes tipos:
De constantes: para almacenar la información que no sufre apenas modificaciones o las sufre cada mucho tiempo. (códigos postales, provincias,…) Maestros: contienen la información que necesita actualizaciones frecuentes y que suele ser la más relacionada con el objetivo del sistema de información. Históricos: contienen información sobre hechos pasados, con el objeto de realizar consultas y estadísticas.

17 Según la forma de acceso a la información dentro del archivo, podemos distinguir varios tipos de archivos: Acceso secuencial por posición: el archivo se lee desde el primer registro, secuencialmente hasta llegar al que se busca. Acceso directo por posición: se debe conocer la posición del registro buscado y se accede directamente. Acceso secuencial por valor: se lee secuencialmente pero no todo el registro sino alguno de los campos. Acceso directo por valor: se accede directamente a un registro dando el valor de un campo clave.

18 Los datos se almacenarán en ficheros, pero para poder trabajar con estos ficheros de datos necesitamos un programa que conozca qué ficheros son los que contienen los datos, dónde están ubicados, de qué forma se accede a cada uno de ellos o qué datos concretos contiene cada uno de ellos. Estos programas son los sistemas gestores de ficheros que usualmente incluyen todos los sistemas operativos. Además existen los programas que se dedican a trabajar concretamente con los ficheros de datos y sus relaciones, estos son los Sistemas de Gestión de Bases de Datos (SGBD o DBMS, Data Base Management System).

19 1.5.- relaciones, integridad y compartición de datos
Una base de datos se distingue de un conjunto de ficheros por las relaciones que se establecen entre los ficheros que la forman. Definimos base de datos como un conjunto de ficheros relacionados entre sí, cuyo contenido pueden compartir los usuarios con características de integridad máxima y redundancia mínima. Decimos que existe una relación entre dos ficheros si los registros de un fichero hacen referencia a los registros de otro fichero. Si tenemos un fichero de alumnos y otro de módulos, un alumno puede estar matriculado en uno o varios módulos, existe una relación.

20 Hemos dicho al definir “base de datos” que tiene integridad, esto quiere decir que debe cumplir los siguientes requisitos: No se puede relacionar un registro de un fichero con un registro inexistente. En el diseño de la base de datos se deciden las cardinalidades (cuantos elementos de cada entidad participan en la relación) y esta decisión debe respetarse para conseguir integridad. Los cambios que se realicen en uno u otro fichero, deben tener en cuenta las anteriores reglas, de forma que no podemos eliminar un registro si existen registros en una entidad que mantengan una relación con él.

21 También hemos dicho al definir “base de datos” que debe tener redundancia mínima, esto quiere decir que los datos deben repetirse lo mínimo posible entre todos los ficheros. Debemos saber que si tratamos de relacionar ficheros, la repetición de datos será inevitable, ya que necesitamos un dato repetido para relacionar dos ficheros. No obstante, un buen diseño de base de datos debe garantizar que los datos repetidos son los imprescindibles para mantener las relaciones.

22 ALUMNOS CÓDIGO NOMBRE DIRECCIÓN EDAD MÓDULOS CÓDIGO NOMBRE MATRÍCULAS CÓDIGO_A NOMBRE_A CODIGO_M NOMBRE_M Si tenemos una base de datos integrada por estos tres ficheros, podemos ver que los datos “nombre de alumno” y “nombre de módulo” se repetirán en dos tablas de forma innecesaria, ya que tanto el alumno como el módulo pueden ser identificados en la tabla matrículas mediante sus respectivos códigos, que además sirven para relacionar los ficheros.

23 En la mayoría de los casos el contenido de una base de datos debe poder ser compartido por los usuarios, incluso por varios usuarios al mismo tiempo. Por ello los SGBD deben controlar correctamente: La gestión de permisos: de forma que un usuario sólo pueda acceder a la información para la que está autorizado y realizar con ella únicamente las operaciones que le estén permitidas. La gestión de concurrencia: de forma que cuando dos usuarios intenten realizar operaciones que afecten a los mismos datos, se impida que la incorrecta realización de las operaciones cause pérdida o inconsistencia de datos. Por ejemplo, la técnica del “bloqueo” consiste en bloquear uno de los dos procesos concurrentes hasta que el otro ha terminado.

24 Tipos de relaciones: Hemos dicho ya que las relaciones entre los ficheros que conforman una base de datos son un elemento imprescindible de ellas. En función de los ficheros o entidades involucrados, las relaciones más frecuentes son: Reflexivas: si algún campo del fichero está relacionado con otro campo del mismo fichero. Binarias: si involucran a dos ficheros. Ternarias: si involucran a ternarias.

25 MÓDULOS ALUMNOS PROFESORES Relación ternaria Relación binaria
Relación reflexiva

26 En función de los registros de uno u otro fichero que intervienen en la relación, estas pueden ser:
Uno a uno (1:1): si un registro del fichero A sólo se relaciona con un registro del fichero B. Un instituto tiene un solo director. Uno a muchos (1:N): si un registro del fichero A puede relacionarse con varios del fichero B, pero no al revés. Un ciclo posee varios módulos, pero un módulo sólo pertenece a un ciclo. Muchos a muchos (N:M): si un registro del fichero A puede relacionarse con varios del fichero B y viceversa. Un alumno puede estar matriculado en varios módulos y en un módulo puede haber varios alumnos.

27 1.6.- sgbd El uso de los ficheros independientes para almacenar datos y crear relaciones entre ellos ha evolucionado en lo que hoy llamamos Sistemas gestores de bases de datos. Hoy día un SGBD puede dar servicio a aplicaciones distintas. (De la misma forma que una aplicación se programa para funcionar en un SO concreto, también se programaba para usar unos determinados ficheros de datos.) Forman pues una capa intermedia entre las aplicaciones y los datos que usan. Base de datos Aplicaciones SO SGBD

28 Facilitar el acceso a los datos de una forma sencilla.
Funciones del SGBD Un SGBD consiste en una serie de programas que facilitan la labor de gestionar la base de datos en su conjunto. Cada SGBD tiene unas características similares pero no idénticas, cada uno puede ofrecer sus propias mejoras o ideas, pero en general cumplen una serie de funciones: Facilitar el acceso a los datos de una forma sencilla. Controlar la consistencia y la integridad de los datos, haciendo que se cumplan las restricciones impuestas por el diseñador de la BD.

29 Controlar la seguridad de la BD, facilitando la realización de copias de seguridad y permitiendo la gestión de los permisos de los usuarios. Controlar la concurrencia, gestionando el acceso simultáneo a los datos, de forma que ninguna petición quede desatendida. Facilitar la administración de la BD y del propio SGBD, permitiendo modificar el diseño de la BD y el funcionamiento del SGBD. Son conocidos SGBDs como MySQL, ORACLE, Microsoft Access, PostgreSQL o Informix.

30 Niveles del SGBD Todo SGBD cumple funciones en tres niveles distintos interrelacionados entre sí. Estos son: Nivel interno o físico: Es el nivel que se relaciona directamente con el almacenamiento físico de los datos. Debe incorporar las funciones que se encargan de realizar lecturas y escrituras en los dispositivos físicos donde se almacenan los datos. Nivel conceptual o lógico: Es el nivel donde se define el diseño de la BD, se establecen cuáles son las entidades a controlar, las relaciones entre ellas, las autorizaciones y restricciones a los usuarios, etc…

31 Nivel externo o de vistas de usuario: Es el nivel que maneja directamente el usuario de la BD (el usuario final, no el diseñador). En este nivel se definen vistas de usuario, es decir, la parte de la información de la BD a la que puede acceder un determinado usuario y las funciones puede realizar. Algunos usuarios podrán acceder a todos los datos y todas las funciones mientras que otros tendrán un acceso restringido a los datos y podrán realizar algunas funciones con esos datos pero no todas. Nivel interno Nivel conceptual Nivel externo Base de datos Aplicaciones SO

32 Componentes del SGBD Cada nivel está especializado en un tipo de acciones, y el SGBD necesita componentes que permitan realizarlas, los principales son: Herramientas de gestión: Son las que permiten crear, manipular y eliminar tanto BBDD como usuarios y permisos. Suelen estar disponibles únicamente para los administradores de la BD. (Los administradores son usuarios especializados en el mantenimiento de BBDD). Herramientas de programación: Son las que permiten crear aplicaciones que tengan un acceso directo a los datos cuando los usuarios no pueden acceder directamente a ellos.

33 Lenguajes: Permiten acceso a los datos de un modo similar al de las herramientas de programación pero se limitan al acceso a los datos y alguna tarea de gestión de la BD. Pueden ser: Para crear o modificar la estructura de la BD. (LDD, Lenguaje de Definición de Datos). Para realizar la gestión de usuarios y seguridad (LCD, Lenguaje de Control de Datos). Para trabajar con los datos realizando consultas, altas, bajas o modificaciones (LMD, Lenguaje de Manipulación de Datos).

34 Diccionario de datos: Permite llevar un cierto control de la información que se maneja en la BD y de su gestión. En él se almacena toda la información relativa a usuarios, permisos, estructura de los ficheros, relaciones entre ellos y en general toda la información necesaria para la gestión de la BD salvo los propios datos. Hay que especificar que todos estos componentes no son accesibles por todos los usuarios de una BD, la mayoría de ellos están reservados a usuarios informáticos (diseñadores o programadores) que se encargan del buen funcionamiento de la misma. La mayoría de los usuarios de una BD son usuarios no expertos o usuarios finales.

35 Podemos clasificar los SGBD en función de distintos criterios.
Tipos de SGBD Podemos clasificar los SGBD en función de distintos criterios. Si atendemos al modelo de datos utilizado distinguimos: SGBD jerárquicos y en red. Son SGBD basados en dos modelos obsoletos. SGBD relacionales. Son los más empleados en este momento. Los datos se estructuran en tablas (equivalen a los ficheros), formadas por filas (registros) y columnas (atributos). SGBD orientados a objetos. Surgidos para atender la creciente corriente de “orientación a objetos” en la programación hoy día. Está empezando a competir con el relacional.

36 Si atendemos a la distribución de sus componentes:
SGBD centralizado. El SGBD está concentrado en un solo ordenador (aunque pueda servir datos a varias máquinas y usuarios). En este caso el servidor asume toda la carga de trabajo. SGBD distribuido. El SGBD se divide en partes y cada una puede estar instalada en una máquina diferente. De esta forma la carga de trabajo de los servidores estará dividida en varias máquinas. Generalmente se usa la arquitectura cliente/servidor y si la estructura del sistema distribuido es muy grande, se usa a varios niveles (servidor primario-servidores secundarios y servidores secundarios-clientes).

37 En el caso de los SGBD distribuidos, cabe la posibilidad de distribuir los datos también entre varias máquinas, es lo que llamamos una base de datos distribuida, y en este caso es necesario que la máquina que contenga unos datos, contenga también la parte necesaria del SGBD para gestionarlos. Las BBDD distribuidas pueden tener: - Toda la BD replicada, es decir, la información está duplicada para ofrecer mejor servicio. - Toda la información distribuida sin replicación, cada máquina almacena parte de la BD. - Combinar distribución y replicación. Un servidor contiene la BD completa y existen otros con la información que más se usa.

38 1.7.- aspectos legales del tratamiento de información
LOPD Ley Orgánica de Protección de Datos


Descargar ppt "Introducción a la gestión de datos"

Presentaciones similares


Anuncios Google