T.F.C. - Almacenes de Datos Alumno: JORGE MORALES LARA

Slides:



Advertisements
Presentaciones similares
Estructura de una aplicación móvil
Advertisements

SQL Sigla del nombre “Structured Query Language”.
Ejercicios Solemne 2 Parte 1
Rocio Contreras Aguila Primer Semestre Para poder ejecutar esto SQL Server nos permite definir datos y nos entrega herramientas para poder exigir.
LENGUAJE ESTRUCTURADO DE CONSULTA “SQL”
BASE DE DATOS OBJETO RELACIONAL
Implementación de la integridad de datos
SQL BAJO EL ENTORNO PHP/MYSQL MI JUAN PABLO TORRES HERRERA UNIVERSIDAD AUTÓNOMA DE BAJA CALIFORNIA FACULTAD DE INGENIERÍA ENSENADA Mayo de 2005.
Diseño y Construcción de una
Convenio para realizar la
Por: Ronald Toscano Pretelt
Unidad 3 Lenguaje de manipulación de datos(DML).
DISEÑO Y GESTIÓN DE BASES DE DATOS Luciano H. Tamargo Depto. de Ciencias e Ingeniería de la Computación Universidad Nacional del Sur, Bahía Blanca INTRODUCCIÓN.
Maestría en Bioinformática Bases de Datos y Sistemas de Información SQL: DML Ing. Alfonso Vicente, PMP
Informe caso de estudio Implementación de un Datawarehouse
Proyecto Fin de Carrera E.T.S. Ingeniería Informática 26 de Septiembre de 2006 DESARROLLO DE UN COMPONENTE TECLADO ALUMNO: Fco. Javier Sánchez Ramos TUTORES:
EL LENGUAJE ESTÁNDAR SQL
Características Objeto Relacionales en Oracle
Tema: Las Consultas (y II) Tipos de uniones
Características Objeto Relacionales en Oracle
FERRETERIA J&H HERMANOS
Base de Datos Relacional.
On Line Analytical Processing
RESOLVIENDO RELACIONES MUCHOS A MUCHOS
PL/SQL Francisco Moreno Universidad Nacional.
Contenido de la sesión 1 Bases de Datos Relacionales Lenguaje SQL
Características Objeto Relacionales en Oracle Francisco Moreno Universidad Nacional.
MySQL M.C. Pedro Bello López.
UNIDAD I Conceptos Básicos.
Mini curso: Inteligencia de negocios (Bodega y Minería de Datos) aplicación práctica Mauro Callejas Cuervo Ecuador, Mayo 2014 Sesión 2 – TALLER 2 Grupo.
…Tablas DDL.
SQL Lenguaje de consulta estructurado
Integridad Referencial 1. Integridad referencial 2.
tipo de datos uniqueidentifier
John Freddy Duitama M.U.de.A. Facultad de Ingeniería. Creación del esquema de Una Base de Datos. John Freddy Duitama Muñoz. Facultad de Ingeniería. U.de.A.
SQL: DDL Francisco Moreno & Carlos Mario Zapata. SQL:DDL DDL: Lenguaje de Definición de Datos Permite crear objetos en la Base de Datos Tipos de Objetos:
Relacionando tablas. Restricción FOREIGN KEY.. Constraint Foreign key Genera una restricción a partir de la relación de dos tablas. En la figura siguiente.
ESCUELA TECNOLÓGICA INSTITUTO TÉCNICO CENTRAL Ing. Johanna Vargas Esp. Gerencia de proyectos.
Tema 2: Base de datos relacionales
 Archivos de base de datos de Access  Por medio de Microsoft Access, se puede administrar gran cantidad de información en un único archivo de base de.
Base de datos Francisco Castro. Creación de una tabla drop table TABLA cascade constraints; /*==============================================================*/
Llaves Primarias. PRIMARY KEY.
Structured Query Language (Lenguaje Estructurado de Consultas)
SQL: DDL Francisco Moreno. SQL: DDL DDL: Lenguaje de Definición de Datos Permite crear objetos en la BD Tipos de objetos: - Tablas: corresponden a las.
Eugenio Andrés Giraldo Bedoya Luisa Fernanda Gómez Correa 11-1.
Instrucciones para crear tablas My SQL. A nivel teórico, existen dos lenguajes para el manejo de bases de datos: DDL (Data Definition Language) Lenguaje.
Microsoft Access Microsoft Access, es la base de datos relacional más popular, además forma parte de la aplicación de Microsoft Office. Permite crear.
BASES DE DATOS MySQL. BASE DE DATOS Estructuras o contenedores donde se almacena información siguiendo determinadas pautas de disposición y ordenación.
INSTRUCCIONES Elaboración de la Presentación:
MODELOS DE DATOS RELACIONAL
Especialización en Gerencia de Servicios de Información Seminario de Investigación II.
Base de datos Francisco Castro. Creación de una tabla drop table TABLA cascade constraints; /*==============================================================*/
Creación de Bases de Datos
(Lenguaje de consulta estructurado)
Modificando la estructura de tablas
SQL Lenguaje Estructurado de Consultas. Structured Query Lenguaje (SQL). Lenguaje de acceso a bases de datos. Proyecto de Investigación de IBM. La mayoria.
Bases de Datos SQL.
DISEÑO DE BASES DE DATOS (modelos para el diseño)
VOROLLOYD Dirigido por: Cristina Rubio Escudero Luis M. Escudero Cuadrado Realizado por: Carmen Cruz Ramos Molinero.
Ing. Ernesto Sierraalta Fundamentos de Desarrollo de Proyectos de Inteligencia de Negocios ( Decision Support Systems & Data Warehousing.
Roles de los diferentes análisis de sistemas de información Fonseca Nava Angélica.
Departamento de Lenguajes y Sistemas Informáticos escuela técnica superior de ingeniería informática Diseño de Bases de Datos Tema 4: Integridad.
Departamento de Lenguajes y Sistemas Informáticos escuela técnica superior de ingeniería informática Diseño de Bases de Datos Tema 4: Integridad.
SQL: DDL.
DLM Transact SQL Sesión I Introducción al SQL Server Uso de las herramientas de consultas del Transact SQL.
1 Oficina de Servicios, O+Iker FUNDANET: MÓDULO DE CONVOCATORIAS.
ALTER TABLE MODIFICAR LA ESTRUCTURA DE LOS OBJETOS DE UNA BASE DE DATOS.
Lenguaje MySQL, DDL (Lenguaje de definición de datos) Ing. Linda Masias Morales.
Sentencias DDL.
1. 2 create table DEPARTAMENTO( numero integer primary key, nombre text, director integer not null, F_inic_Director date, CONSTRAINT director_FK FOREIGN.
Transcripción de la presentación:

CONSTRUCCION Y EXPLOTACION DE UN ALMACEN DE DATOS PARA EL ANALISIS DE INFORMACION INMOBILIARIA T.F.C. - Almacenes de Datos Alumno: JORGE MORALES LARA Ingeniería Técnica en Informática de Sistemas Buenos días, mi nombre es Jorge morales Lara, curso ingeniería tecnica en informática de sistemas en la universidad oberta de cataluña, voy a presentarles mi trabajo fin de carrera, basado en almacenes de datos, en concreto en la gestión de información inmobiliaria. Consultor : Pere Juanola Juanola Enero 2012

Análisis, diseño e implementación Presentación Virtual Introducción Datos de Partida Análisis, diseño e implementación Consultas e Informes Esta presentación VIRTUAL se compone de 5 puntos, -primero haremos una breve introducción del contexto en el que desarrollamos el trabajo fin de carrera. -segundo estudiaremos los datos de partida con los que hemos desarrollado el trabajo -despues seguiremos con el análisis, diseño e implementación del proyecto -describiremos los informes realizados -y por ultimo haremos unas conclusiones finales. Conclusiones JORGE MORALES LARA T.F.C. - Almacenes de Datos

Introducción Inmobiliaria Un Techo Para Todos Proporciona los datos en un único fichero de texto Automatizar recogida de datos Creación de mejores modelos predictivos Alto rendimiento en el acceso a los datos Introducción, la inmobiliaria un techo para todos tiene un intenso catalogo de inmuebles en España y andorra, considera que le sería muy útil disponer de un sistema de información que le permitiera comparar diferentes zonas, tipologías de pisos y precios por intentar ajustar la oferta y la demanda, obteniendo así una ventaja competitiva respeto otras empresas del sector. Nos proporciona un fichero de texto con su catalogo y nosotros deberemos automatizar la recogida de datos, crear mejores modelos predictivos y obtener un alto rendimiento en el acceso a los datos. JORGE MORALES LARA T.F.C. - Almacenes de Datos

Aplicaciones Analíticas Introducción(DataWarehouse) Meta Data Integración Datos Entrega Información Warehouse Datos ERP Externos Datos Operativos Aplicaciones Analíticas Analizar Consultar Informar Para esto se ha creado un almacen de datos o datawerhaus, que va permitir la integracion de todos los datos en un cubo multidimensional olap, el cual va ofrecer una vision sencilla y ordenada del negocio que permita un acceso a la informacion rapido y eficiente. JORGE MORALES LARA T.F.C. - Almacenes de Datos

Datos de Partida Errores en datos de origen zona: longitud máxima de los elementos, 15 caracteres.   tipus: hay 4 elementos diferentes. planta: máximo 60 plantas. dormitoris: máximo 24. metres: máximos y mínimos dependiendo del tipo de inmueble. NULL: todos los campos vacios se han puesto a NULL. Datos de Partida, La empresa inmobiliaria nos ha mandado un unico fichero de texto, realizado con la concatenacion de varias hojas de calculo, ademas nos hace saber que pueden existir errores, ya que los datos no los han revisado exacustivamente. lo que hemos hecho es la preparación de los datos desde el programa Microsoft Excell, convirtiendo el archivo de texto a una hoja excell, aquí hemos realizado las restricciones siguientes: -zona: las zonas las hemos optado por dejarlas con 4 niveles, que son, países, autonomías, provincias y comarcas. Los demas niveles los hemos desestimado. -tipus: hay 4 tipos diferentes de inmuebles que son áticos, chalets, dúplex, estudios y pisos, cada inmueble debe pertenecer a uno de estos tipos. -planta: las hemos puesto todas numéricamente, es decir, si una planta tenia como dato bj, la hemos puesto a 0, o si tenia st, la hemos puesto a -2, y así con las demás plantas. Por otro lado las plantas mayores de 60 las hemos puesto a 0.   -dormitoris: los inmuebles con dormitorios mayores de 24, las ponemos a 10 para todos, además los Dúplex, Pisos, Chalets, Áticos con 0 habitaciones las hemos puesto a 1. Solamente hemos dejado a 0 los estudios. También algún estudio con más de 0 habitaciones las hemos puesto a 0.  -metres: Los Metros Cuadrados se han puesto mínimos y máximos según cada tipo de inmueble. Por ejemplo un ático o un chalet mínimo será de 60m2 y maximo de 500 o 2000 m2 respectivamente. Por ultimo decir que todos los campos vacios se han puesto a NULL, para un correcto procesado de los mismos. JORGE MORALES LARA T.F.C. - Almacenes de Datos

Análisis, Diseño e implementación Pasamos ahora al analisis, diseño e implementacion del proyecto: Analisando los requerimientos de la inmobiliaria llegamos a la conclusion de que el hecho fundamental es la oferta de inmuebles, esto sera la tabla de hechos, las dimensiones que necesitaremos seran: -immuebles, donde se guardara todos los immuebles y sus caracteristicas. -tipos: se almacena los diferentes tipos de immuebles existentes, actualmente 4. -las zonas donde se encuentra cada immueble las hemos divido en 4 dimensiones, paises, comunidades, provincias y comarcas. -una dimension fechas para saber temporalemente cuando se realiza la oferta. -finalmente una dimension catalogo, donde se almacenara el historico de los immuebles para saber por cada immueble que precio tuvo en los diferentes meses en los que estuvo a la venta. JORGE MORALES LARA T.F.C. - Almacenes de Datos

Análisis, Diseño e implementación Creación de las tablas OFERTAS: CREATE TABLE OFERTAS( CODIGO_IMMUEBLE VARCHAR2(15) NOT NULL, ID_FECHA NUMBER(10) NULL, PRECIO_VENTA NUMBER(10), VENDIDO NUMBER(1) NOT NULL, CONSTRAINT OFERTAS_CODIGO_IMMUEBLE_FK FOREIGN KEY (CODIGO_IMMUEBLE) REFERENCES IMMUEBLES (CODIGO), CONSTRAINT OFERTAS_ID_FECHA_FK FOREIGN KEY (ID_FECHA) REFERENCES FECHAS (ID), CONSTRAINT OFERTAS_PRIMARY_KEY PRIMARY KEY (CODIGO_IMMUEBLE));   IMMUEBLES: CREATE TABLE IMMUEBLES( ID NUMBER(10) NOT NULL AUTO_INCREMENT, CODIGO NUMBER(15) NOT NULL, ID_TIPO NUMBER(2), PLANTA NUMBER(2) NOT NULL, HABITACIONES NUMBER(3) NOT NULL, METROS NUMBER(10) NOT NULL, PRECIO_INICIO NUMBER(20) NOT NULL, ID_COMARCA NUMBER(10) NOT NULL, CONSTRAINT IMMUEBLES_ID_COMARCA_FK FOREIGN KEY (ID_COMARCA) REFERENCES COMARCAS (ID), CONSTRAINT IMMUEBLES_ID_TIPO_FK FOREIGN KEY (ID_TIPO) REFERENCES TIPOS (ID), CONSTRAINT IMMUEBLES_PRIMARY_KEY PRIMARY KEY (ID)); FECHAS: CREATE TABLE FECHAS( ID NUMBER(20) NOT NULL AUTO_INCREMENT, MES NUMBER(2) NOT NULL, ANIO NUMBER(4) NOT NULL, CONSTRAINT FECHAS_PRIMARY_KEY PRIMARY KEY (ID)); Después para proceder a la carga de los ficheros resultantes de la ETL, se ha decidido aprovechar la inserción de la misma mediante la aplicación sqlplus. Desde la línea de comandos accedemos a la aplicación y conectamos con nuestra base de datos.    Después se ejecuta el archivo DESTRUCTOR.CSV el cual borrara todas las tablas de nuestra B.D.; posteriormente cargaremos el archivo CONSTRUCTOR.CSV donde crearemos todas las tablas e insertaremos todos los registros de las tablas. JORGE MORALES LARA T.F.C. - Almacenes de Datos

Análisis, Diseño e implementación Creación de las tablas  TIPOS: CREATE TABLE TIPOS ( ID NUMBER(3) NOT NULL AUTO_INCREMENT, NOMBRE VARCHAR2(50), CONSTRAINT TIPOS_PRIMARY_KEY PRIMARY KEY (ID));   PAISES: CREATE TABLE PAISES ( ID NUMBER(10) NOT NULL AUTO_INCREMENT, CONSTRAINT PAISES_PRIMARY_KEY PRIMARY KEY (ID)); COMUNIDADES: CREATE TABLE COMUNIDADES ( NOMBRE VARCHAR2(50) DEFAULT NULL, ID_PAIS NUMBER(10) NOT NULL, CONSTRAINT COMUNIDADES_ID_PAIS_FK FOREIGN KEY (ID_PAIS) REFERENCES PAISES (ID), CONSTRAINT COMUNIDADES_PRIMARY_KEY PRIMARY KEY (ID)); PROVINCIAS: CREATE TABLE PROVINCIAS ( ID_COMUNIDAD NUMBER(10), CONSTRAINT PROVINCIAS_ID_COMUNIDAD_FK FOREIGN KEY (ID_COMUNIDAD) REFERENCES COMUNIDADES (ID), CONSTRAINT PROVINCIAS_PRIMARY_KEY PRIMARY KEY (ID)); COMARCAS: CREATE TABLE COMARCAS ( NOMBRE VARCHAR2(200) NOT NULL, ID_PROVINCIA NUMBER(10) DEFAULT NULL, CONSTRAINT COMARCAS_ID_PROVINCIA_FK FOREIGN KEY (ID_PROVINCIA) REFERENCES PROVINCIAS (ID), CONSTRAINT COMARCAS_PRIMARY_KEY PRIMARY KEY (ID)); Se crean las diferentes tablas y dentro de cada una se insertan los datos correspondientes. JORGE MORALES LARA T.F.C. - Almacenes de Datos

Análisis, Diseño e implementación Creación de las tablas CATALOGO: CREATE TABLE CATALOGO( CODIGO_IMMUEBLE VARCHAR2(15) NOT NULL, P_ENERO2006 NUMBER(20), P_FEBRERO2006 NUMBER(20), P_MARZO2006 NUMBER(20), P_ABRIL2006 NUMBER(20), P_MAYO2006 NUMBER(20), P_JUNIO2006 NUMBER(20), P_JULIO2006 NUMBER(20), P_AGOSTO2006 NUMBER(20), P_SEPTIEMBRE2006 NUMBER(20), P_OCTUBRE2006 NUMBER(20), P_NOVIEMBRE2006 NUMBER(20), P_DICEMBRE2006 NUMBER(20), P_ENERO2007 NUMBER(20), P_FEBRERO2007 NUMBER(20), P_MARZO2007 NUMBER(20), P_ABRIL2007 NUMBER(20), P_MAYO2007 NUMBER(20), P_JUNIO2007 NUMBER(20), P_JULIO2007 NUMBER(20), P_AGOSTO2007 NUMBER(20), P_SEPTIEMBRE2007 NUMBER(20), P_OCTUBRE2007 NUMBER(20), P_NOVIEMBRE2007 NUMBER(20), P_DICEMBRE2007 NUMBER(20), P_ENERO2008 NUMBER(20), CONSTRAINT CATALOGO_CODIGO_IMMUEBLE_FK FOREIGN KEY (CODIGO_IMMUEBLE) REFERENCES IMMUEBLES (CODIGO), CONSTRAINT CATALOGO_PRIMARY_KEY PRIMARY KEY (CODIGO_IMMUEBLE)); Por ultimo creamos la tabla catalogo la cual contendrá los datos de cada inmueble durante los meses que este en venta. JORGE MORALES LARA T.F.C. - Almacenes de Datos

Consultas e Informes Informes a realizar: 1. Inmuebles por zona, tipología y características 2. Lista de Inmuebles que han bajado de precio por zona, tipología y características 3. Precios ofrecidos máximos, mínimos y medios por zona, tipología y características 4. Precios de Venta Real máximos, mínimos y medios por zona, tipología y características 5. Diferencia entre los precios ofrecidos y de venta real 6. Metros Cuadrados máximos, mínimos y medios por zona y tipología 7. Distribución(número de pisos) por número de habitaciones, por zona y tipología 8. Tiempo medio de venta por zona y tipología 9. Inmuebles vendidos y existentes por zona y tipología Los informes realizados en nuestro proyecto LOS hemos hecho utilizando la herramienta oracle discoverer desktop y son los siguientes: 1. Inmuebles por zona, tipología y características, cuantos inmuebles existen en las diferentes comarcas. 2. Lista de Inmuebles que han bajado de precio por zona, tipología y características, comparamos el precio que tiene el inmueble en cada vez que este en venta y vemos si ha bajado de precio. 3. Precios ofrecidos máximos, mínimos y medios por zona, tipología y características. PRECIO DE OFERTA. 4. Precios de Venta Real máximos, mínimos y medios por zona, tipología y características, PRECIO DE VENTA. 5. Diferencia entre los precios ofrecidos y de venta real 6. Metros Cuadrados máximos, mínimos y medios por zona y tipología 7. Distribución(número de pisos) por número de habitaciones, por zona y tipología 8. Tiempo medio de venta por zona y tipología 9. Inmuebles vendidos y existentes por zona y tipología : JORGE MORALES LARA T.F.C. - Almacenes de Datos

Conclusiones Objetivos cumplidos Alto rendimiento de la información Apoyo a la toma de decisiones Experiencia en DataWarehouse AL TERMINO DE ESTE PROYECTO SE HA ALCANZADO LOS OBJETIVOS FIJADOS EN EL MISMO. SE HA OBTENIDO UN ALTO RENDIMIENTO DE LA INFORMACION, CON LA CUAL SABEMOS EXACTAMENTE TODO LO RELACIONADO A CADA IMMUEBLE. TODO ESTE PROYECTO AYUDA A LA TOMA DE DECISIONES. POR ULTIMO HACER REFERENCIA A LA GRAN EXPERIENCIA ADQUIRIDA EN DATAWAREHOUSE. JORGE MORALES LARA T.F.C. - Almacenes de Datos

Muchas Gracias JORGE MORALES LARA T.F.C. - Almacenes de Datos Muchas gracias por su atención, espero haberme expresado con claridad y pido perdón si la calidad del video no ha sido buena. JORGE MORALES LARA T.F.C. - Almacenes de Datos