La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

T.F.C. - Almacenes de Datos Alumno: JORGE MORALES LARA

Presentaciones similares


Presentación del tema: "T.F.C. - Almacenes de Datos Alumno: JORGE MORALES LARA"— Transcripción de la presentación:

1 CONSTRUCCION Y EXPLOTACION DE UN ALMACEN DE DATOS PARA EL ANALISIS DE INFORMACION INMOBILIARIA
T.F.C. - Almacenes de Datos Alumno: JORGE MORALES LARA Ingeniería Técnica en Informática de Sistemas Buenos días, mi nombre es Jorge morales Lara, curso ingeniería tecnica en informática de sistemas en la universidad oberta de cataluña, voy a presentarles mi trabajo fin de carrera, basado en almacenes de datos, en concreto en la gestión de información inmobiliaria. Consultor : Pere Juanola Juanola Enero 2012

2 Análisis, diseño e implementación
Presentación Virtual Introducción Datos de Partida Análisis, diseño e implementación Consultas e Informes Esta presentación VIRTUAL se compone de 5 puntos, -primero haremos una breve introducción del contexto en el que desarrollamos el trabajo fin de carrera. -segundo estudiaremos los datos de partida con los que hemos desarrollado el trabajo -despues seguiremos con el análisis, diseño e implementación del proyecto -describiremos los informes realizados -y por ultimo haremos unas conclusiones finales. Conclusiones JORGE MORALES LARA T.F.C. - Almacenes de Datos

3 Introducción Inmobiliaria Un Techo Para Todos
Proporciona los datos en un único fichero de texto Automatizar recogida de datos Creación de mejores modelos predictivos Alto rendimiento en el acceso a los datos Introducción, la inmobiliaria un techo para todos tiene un intenso catalogo de inmuebles en España y andorra, considera que le sería muy útil disponer de un sistema de información que le permitiera comparar diferentes zonas, tipologías de pisos y precios por intentar ajustar la oferta y la demanda, obteniendo así una ventaja competitiva respeto otras empresas del sector. Nos proporciona un fichero de texto con su catalogo y nosotros deberemos automatizar la recogida de datos, crear mejores modelos predictivos y obtener un alto rendimiento en el acceso a los datos. JORGE MORALES LARA T.F.C. - Almacenes de Datos

4 Aplicaciones Analíticas
Introducción(DataWarehouse) Meta Data Integración Datos Entrega Información Warehouse Datos ERP Externos Datos Operativos Aplicaciones Analíticas Analizar Consultar Informar Para esto se ha creado un almacen de datos o datawerhaus, que va permitir la integracion de todos los datos en un cubo multidimensional olap, el cual va ofrecer una vision sencilla y ordenada del negocio que permita un acceso a la informacion rapido y eficiente. JORGE MORALES LARA T.F.C. - Almacenes de Datos

5 Datos de Partida Errores en datos de origen
zona: longitud máxima de los elementos, 15 caracteres. tipus: hay 4 elementos diferentes. planta: máximo 60 plantas. dormitoris: máximo 24. metres: máximos y mínimos dependiendo del tipo de inmueble. NULL: todos los campos vacios se han puesto a NULL. Datos de Partida, La empresa inmobiliaria nos ha mandado un unico fichero de texto, realizado con la concatenacion de varias hojas de calculo, ademas nos hace saber que pueden existir errores, ya que los datos no los han revisado exacustivamente. lo que hemos hecho es la preparación de los datos desde el programa Microsoft Excell, convirtiendo el archivo de texto a una hoja excell, aquí hemos realizado las restricciones siguientes: -zona: las zonas las hemos optado por dejarlas con 4 niveles, que son, países, autonomías, provincias y comarcas. Los demas niveles los hemos desestimado. -tipus: hay 4 tipos diferentes de inmuebles que son áticos, chalets, dúplex, estudios y pisos, cada inmueble debe pertenecer a uno de estos tipos. -planta: las hemos puesto todas numéricamente, es decir, si una planta tenia como dato bj, la hemos puesto a 0, o si tenia st, la hemos puesto a -2, y así con las demás plantas. Por otro lado las plantas mayores de 60 las hemos puesto a 0. -dormitoris: los inmuebles con dormitorios mayores de 24, las ponemos a 10 para todos, además los Dúplex, Pisos, Chalets, Áticos con 0 habitaciones las hemos puesto a 1. Solamente hemos dejado a 0 los estudios. También algún estudio con más de 0 habitaciones las hemos puesto a 0.  -metres: Los Metros Cuadrados se han puesto mínimos y máximos según cada tipo de inmueble. Por ejemplo un ático o un chalet mínimo será de 60m2 y maximo de 500 o 2000 m2 respectivamente. Por ultimo decir que todos los campos vacios se han puesto a NULL, para un correcto procesado de los mismos. JORGE MORALES LARA T.F.C. - Almacenes de Datos

6 Análisis, Diseño e implementación
Pasamos ahora al analisis, diseño e implementacion del proyecto: Analisando los requerimientos de la inmobiliaria llegamos a la conclusion de que el hecho fundamental es la oferta de inmuebles, esto sera la tabla de hechos, las dimensiones que necesitaremos seran: -immuebles, donde se guardara todos los immuebles y sus caracteristicas. -tipos: se almacena los diferentes tipos de immuebles existentes, actualmente 4. -las zonas donde se encuentra cada immueble las hemos divido en 4 dimensiones, paises, comunidades, provincias y comarcas. -una dimension fechas para saber temporalemente cuando se realiza la oferta. -finalmente una dimension catalogo, donde se almacenara el historico de los immuebles para saber por cada immueble que precio tuvo en los diferentes meses en los que estuvo a la venta. JORGE MORALES LARA T.F.C. - Almacenes de Datos

7 Análisis, Diseño e implementación
Creación de las tablas OFERTAS: CREATE TABLE OFERTAS( CODIGO_IMMUEBLE VARCHAR2(15) NOT NULL, ID_FECHA NUMBER(10) NULL, PRECIO_VENTA NUMBER(10), VENDIDO NUMBER(1) NOT NULL, CONSTRAINT OFERTAS_CODIGO_IMMUEBLE_FK FOREIGN KEY (CODIGO_IMMUEBLE) REFERENCES IMMUEBLES (CODIGO), CONSTRAINT OFERTAS_ID_FECHA_FK FOREIGN KEY (ID_FECHA) REFERENCES FECHAS (ID), CONSTRAINT OFERTAS_PRIMARY_KEY PRIMARY KEY (CODIGO_IMMUEBLE)); IMMUEBLES: CREATE TABLE IMMUEBLES( ID NUMBER(10) NOT NULL AUTO_INCREMENT, CODIGO NUMBER(15) NOT NULL, ID_TIPO NUMBER(2), PLANTA NUMBER(2) NOT NULL, HABITACIONES NUMBER(3) NOT NULL, METROS NUMBER(10) NOT NULL, PRECIO_INICIO NUMBER(20) NOT NULL, ID_COMARCA NUMBER(10) NOT NULL, CONSTRAINT IMMUEBLES_ID_COMARCA_FK FOREIGN KEY (ID_COMARCA) REFERENCES COMARCAS (ID), CONSTRAINT IMMUEBLES_ID_TIPO_FK FOREIGN KEY (ID_TIPO) REFERENCES TIPOS (ID), CONSTRAINT IMMUEBLES_PRIMARY_KEY PRIMARY KEY (ID)); FECHAS: CREATE TABLE FECHAS( ID NUMBER(20) NOT NULL AUTO_INCREMENT, MES NUMBER(2) NOT NULL, ANIO NUMBER(4) NOT NULL, CONSTRAINT FECHAS_PRIMARY_KEY PRIMARY KEY (ID)); Después para proceder a la carga de los ficheros resultantes de la ETL, se ha decidido aprovechar la inserción de la misma mediante la aplicación sqlplus. Desde la línea de comandos accedemos a la aplicación y conectamos con nuestra base de datos.    Después se ejecuta el archivo DESTRUCTOR.CSV el cual borrara todas las tablas de nuestra B.D.; posteriormente cargaremos el archivo CONSTRUCTOR.CSV donde crearemos todas las tablas e insertaremos todos los registros de las tablas. JORGE MORALES LARA T.F.C. - Almacenes de Datos

8 Análisis, Diseño e implementación
Creación de las tablas  TIPOS: CREATE TABLE TIPOS ( ID NUMBER(3) NOT NULL AUTO_INCREMENT, NOMBRE VARCHAR2(50), CONSTRAINT TIPOS_PRIMARY_KEY PRIMARY KEY (ID)); PAISES: CREATE TABLE PAISES ( ID NUMBER(10) NOT NULL AUTO_INCREMENT, CONSTRAINT PAISES_PRIMARY_KEY PRIMARY KEY (ID)); COMUNIDADES: CREATE TABLE COMUNIDADES ( NOMBRE VARCHAR2(50) DEFAULT NULL, ID_PAIS NUMBER(10) NOT NULL, CONSTRAINT COMUNIDADES_ID_PAIS_FK FOREIGN KEY (ID_PAIS) REFERENCES PAISES (ID), CONSTRAINT COMUNIDADES_PRIMARY_KEY PRIMARY KEY (ID)); PROVINCIAS: CREATE TABLE PROVINCIAS ( ID_COMUNIDAD NUMBER(10), CONSTRAINT PROVINCIAS_ID_COMUNIDAD_FK FOREIGN KEY (ID_COMUNIDAD) REFERENCES COMUNIDADES (ID), CONSTRAINT PROVINCIAS_PRIMARY_KEY PRIMARY KEY (ID)); COMARCAS: CREATE TABLE COMARCAS ( NOMBRE VARCHAR2(200) NOT NULL, ID_PROVINCIA NUMBER(10) DEFAULT NULL, CONSTRAINT COMARCAS_ID_PROVINCIA_FK FOREIGN KEY (ID_PROVINCIA) REFERENCES PROVINCIAS (ID), CONSTRAINT COMARCAS_PRIMARY_KEY PRIMARY KEY (ID)); Se crean las diferentes tablas y dentro de cada una se insertan los datos correspondientes. JORGE MORALES LARA T.F.C. - Almacenes de Datos

9 Análisis, Diseño e implementación
Creación de las tablas CATALOGO: CREATE TABLE CATALOGO( CODIGO_IMMUEBLE VARCHAR2(15) NOT NULL, P_ENERO2006 NUMBER(20), P_FEBRERO2006 NUMBER(20), P_MARZO2006 NUMBER(20), P_ABRIL2006 NUMBER(20), P_MAYO2006 NUMBER(20), P_JUNIO2006 NUMBER(20), P_JULIO2006 NUMBER(20), P_AGOSTO2006 NUMBER(20), P_SEPTIEMBRE2006 NUMBER(20), P_OCTUBRE2006 NUMBER(20), P_NOVIEMBRE2006 NUMBER(20), P_DICEMBRE2006 NUMBER(20), P_ENERO2007 NUMBER(20), P_FEBRERO2007 NUMBER(20), P_MARZO2007 NUMBER(20), P_ABRIL2007 NUMBER(20), P_MAYO2007 NUMBER(20), P_JUNIO2007 NUMBER(20), P_JULIO2007 NUMBER(20), P_AGOSTO2007 NUMBER(20), P_SEPTIEMBRE2007 NUMBER(20), P_OCTUBRE2007 NUMBER(20), P_NOVIEMBRE2007 NUMBER(20), P_DICEMBRE2007 NUMBER(20), P_ENERO2008 NUMBER(20), CONSTRAINT CATALOGO_CODIGO_IMMUEBLE_FK FOREIGN KEY (CODIGO_IMMUEBLE) REFERENCES IMMUEBLES (CODIGO), CONSTRAINT CATALOGO_PRIMARY_KEY PRIMARY KEY (CODIGO_IMMUEBLE)); Por ultimo creamos la tabla catalogo la cual contendrá los datos de cada inmueble durante los meses que este en venta. JORGE MORALES LARA T.F.C. - Almacenes de Datos

10 Consultas e Informes Informes a realizar:
1. Inmuebles por zona, tipología y características 2. Lista de Inmuebles que han bajado de precio por zona, tipología y características 3. Precios ofrecidos máximos, mínimos y medios por zona, tipología y características 4. Precios de Venta Real máximos, mínimos y medios por zona, tipología y características 5. Diferencia entre los precios ofrecidos y de venta real 6. Metros Cuadrados máximos, mínimos y medios por zona y tipología 7. Distribución(número de pisos) por número de habitaciones, por zona y tipología 8. Tiempo medio de venta por zona y tipología 9. Inmuebles vendidos y existentes por zona y tipología Los informes realizados en nuestro proyecto LOS hemos hecho utilizando la herramienta oracle discoverer desktop y son los siguientes: 1. Inmuebles por zona, tipología y características, cuantos inmuebles existen en las diferentes comarcas. 2. Lista de Inmuebles que han bajado de precio por zona, tipología y características, comparamos el precio que tiene el inmueble en cada vez que este en venta y vemos si ha bajado de precio. 3. Precios ofrecidos máximos, mínimos y medios por zona, tipología y características. PRECIO DE OFERTA. 4. Precios de Venta Real máximos, mínimos y medios por zona, tipología y características, PRECIO DE VENTA. 5. Diferencia entre los precios ofrecidos y de venta real 6. Metros Cuadrados máximos, mínimos y medios por zona y tipología 7. Distribución(número de pisos) por número de habitaciones, por zona y tipología 8. Tiempo medio de venta por zona y tipología 9. Inmuebles vendidos y existentes por zona y tipología : JORGE MORALES LARA T.F.C. - Almacenes de Datos

11 Conclusiones Objetivos cumplidos Alto rendimiento de la información
Apoyo a la toma de decisiones Experiencia en DataWarehouse AL TERMINO DE ESTE PROYECTO SE HA ALCANZADO LOS OBJETIVOS FIJADOS EN EL MISMO. SE HA OBTENIDO UN ALTO RENDIMIENTO DE LA INFORMACION, CON LA CUAL SABEMOS EXACTAMENTE TODO LO RELACIONADO A CADA IMMUEBLE. TODO ESTE PROYECTO AYUDA A LA TOMA DE DECISIONES. POR ULTIMO HACER REFERENCIA A LA GRAN EXPERIENCIA ADQUIRIDA EN DATAWAREHOUSE. JORGE MORALES LARA T.F.C. - Almacenes de Datos

12 Muchas Gracias JORGE MORALES LARA T.F.C. - Almacenes de Datos
Muchas gracias por su atención, espero haberme expresado con claridad y pido perdón si la calidad del video no ha sido buena. JORGE MORALES LARA T.F.C. - Almacenes de Datos


Descargar ppt "T.F.C. - Almacenes de Datos Alumno: JORGE MORALES LARA"

Presentaciones similares


Anuncios Google