La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Propuesta de Tesis Seminario de Tesis I Pronóstico diario de la tasa de cambio usando minería de datos como apoyo a la toma de decisiones 4 Noviembre 2006.

Presentaciones similares


Presentación del tema: "Propuesta de Tesis Seminario de Tesis I Pronóstico diario de la tasa de cambio usando minería de datos como apoyo a la toma de decisiones 4 Noviembre 2006."— Transcripción de la presentación:

1 Propuesta de Tesis Seminario de Tesis I Pronóstico diario de la tasa de cambio usando minería de datos como apoyo a la toma de decisiones 4 Noviembre 2006

2 2/31 Tesista César O. Pérez Pinche Ingeniería de Sistemas Universidad Nacional de Ingeniería 9 no Ciclo cesaruni24@ yahoo.com.mx

3 3/31 PROPUESTA

4 4/31 Título Pronóstico diario de la tasa de cambio usando minería de datos como apoyo a la toma de decisiones Problema: Pronóstico de la tasa de cambio. Técnica: Minería de Datos

5 5/31 Justificación del Problema Tanto para el sector privado, financiero, como para la autoridad monetaria es útil tener información sobre la evolución futura del tipo de cambio ya que con esta sirve para establecer adecuadamente políticas al sector financiero, de inversión (sector privado-empresarial) y de regulación monetaria (BCR).

6 6/31 AMBITO DE LA INVESTIGACION El trabajo abarca realizar el pronóstico diario de la tasa de cambio de la moneda peruana respecto al dólar americano (por ser la moneda que más influye en nuestra economía).

7 7/31 El Problema La tasa de cambio se ve afectado por variables macroeconómicas (que varían en el tiempo) y otros factores haciendo difícil su pronóstico y determinación afectando de esta manera las decisiones sobre políticas de regulación monetaria del Banco Central de Reserva y a las políticas del sector financiero y sector empresarial.

8 8/31 Objetivo GENERAL: Realizar un pronóstico diario de la tasa de cambio con una tasa de error ( MAPE ) menos del 2% usando dos algoritmos de minería de datos (la red neuronal de retropropagación y la máquina de vector soporte) y comparar los resultados con los obtenidos por el modelo econométrico ARIMA.

9 9/31 Objetivo ESPECIFICOS: Recolectar datos históricos diarios de la tasa de cambio (periodo 2001-2005), así como de variables macroeconómicas( tasas de interés, inflación, nivel de precios, producción relativa y valores acumulados de balanzas comerciales del país local y extranjero ) Realizar una exploración de los datos recolectados, detectando y corrigiendo anomalías en la data recolectada (valores extremos, ruidosos, inconsistentes). Realizar un proceso de selección de variables relevantes que expliquen mejor el comportamiento de la tasa de cambio. Construir modelos basados en dos técnicas de Minería de Datos: Red Neuronal de Retropropagación y la Máquina de Vector Soporte para Regresión. Hallar los valores de las medidas de desempeño para ambos modelos y compararlos con los obtenidos por el modelo ARIMA.

10 10/31 Antecedentes Usando Máquinas de Vector Soporte: Joarder Kamruzzaman, Ruhul A. Sarker y Iftekhar Ahmad (III - ICDM 2003). SVM Based Models for Predicting Foreign Currency Exchange Rates. –Realiza un pronóstico semanal del tipo de cambio australiano frente a cinco monedas extranjeras usando SVM. –Resalta la importancia de encontrar los parámetros óptimos de la SVM. –Utiliza los variables MA5 (promedio móvil de los 5 días de la semana anterior), MA10, MA20, MA60, MA120 para el pronóstico. –Concluye que las funciones de base polinomial se ajustan mejor para el pronóstico del dólar australiano frente al dólar americano

11 11/31 Antecedentes Usando redes neuronales: Hu Minghui, Saratchaniran P.y Narasimhan Sundararajan (2003).A Sequential Learning Neural Network for Foreign Exchange Rate Forecasting. –Usa una modificación del algoritmo de entrenamiento de una red neuronal llamado MRAM para el pronostico mensual del tipo de cambio del dólar americano en relación al marco alemán, la libra esterlina y el dólar canadiense. –Las variables que considera para la determinación del tipo de cambio se basan en modelos monetarios y de balance del portafolio. –Los resultados muestran un mejor desempeño de MRAM frente a red Multiplayer Perceptron y dos modificaciones de la técnica estadística "la camina aleatoria".

12 12/31 Antecedentes Usando redes neuronales: Joarder Kamrwzaman y Ruhul A Sarkeg (2003) "FORECASTING OF CURRENCY EXCHANGE RATES USING ANN: A CASE STUDY. –Hace uso de redes neuronales basadas en tres tipos de algoritmos de entrenamiento: Retropropagación Simple, Gradiente Escalar Conjugado y la Retropropagación con Regularización Bayesiana. –Realiza el pronóstico semanal de la tasa de cambio del dólar australiano. –Utiliza 5 indicadores de performance: promedio normalizado del error cuadrático, error cuadrático absoluto, dirección simétrica, tendencia superior e inferior correcta. –Los resultados de las tres redes son comparadas con el método econométrico ARIMA y muestran tener un mejor desempeño en función a cada de los 5 indicadores.

13 13/31 METODOLOGIA DE LA INVESTIGACION

14 14/31 Tipo de Investigación Tipo de Investigación: –Correlacional Tipo de Diseño Experimental –Experimental

15 15/31 DISEÑO DEL EXPERIMENTO

16 16/31 OBJETO DE LA INVESTIGACION Individuo # Registros = T*h (entrenamiento) # Registros = T*(1-h) ( prueba ) T = T(n) =2347-n T: tamaño de la muestra n dias anteriores para predecir dia siguiente a predecir

17 17/31 Población Se recolectaran 3077 valores diarios de la tasa de cambio (Enero 1995-Diciembre 2005). En función a este dato el tamaño de la población a considerar P(n)=3077-n (n es el número de dias necesarios para predecir) Como n min = 2 entonces el tamaño de la población necesario a considerar será 3075 individuos. Los datos serán obtenidos de fuentes como: BCR, MEF, SBS, INEI, Banco Federal de New York (*). (*) http://www.newyorkfed.org/research/global_economy/usecon_charts.html http://www.newyorkfed.org/research/global_economy/usecon_charts.html

18 18/31 Muestra Considerando el 75% del tamaño de la población necesaria entonces el tamaño de la muestra necesario será T =2345 individuos para n min = 2 Como n varia en el rango [2, 9] entonces el tamaño de muestra para los experimentos dependerá del número de dias necesarios para predecir (n). T(n)= 2347-n

19 19/31 Variables Variables independientes (VI): -número de dias predictores (n). - porcentaje de muestra de entrenamiento (h). -modelo económico de determinación de la ta sa de cambio (M). -algoritmo de minería de datos (A). EXPERIMENTOEXPERIMENTO Variables dependientes (VD): - error absoluto promedio (MAPE). - simetría direccional (SD). - porcentaje de predicciones correctas superiores (CU). - porcentaje predicciones correctas inferiores (CD). Instrumento de medición: -Los datos se extraen por observación de una base de datos. Instrumento de medición: -Se diseña los algoritmos para extraer el valor de cada indicador de desempeño de un experimento.

20 20/31 Diseño Experimental MODELO DE SOLUCION n h individuo M A VI MAPE SD CU CD VD

21 21/31 Diseño Experimental Se realizarán 10 experimentos tanto para la red de retropropagación como de la máquina de vector soporte. El valor en cada una de las celdas será el promedio de los 10 experimentos de ambos algoritmos (red neuronal y máquina de vector soporte) Se evaluará cada indicador de desempeño (MAPE, SD, CU, CD).

22 22/31 Tabla de Experimentos Promedio de 10 experimentos Por cada indicador de desempeño (MAPE, SD, CU, CD)

23 23/31 HIPOTESIS

24 24/31 Hipótesis (general) La red neuronal de retropropagación y la máquina de vector soporte obtienen una tasa de error de pronóstico (MAPE) de menos del 2% y menor en comparación del modelo econométrico ARIMA para el pronóstico diario de la tasa de cambio.

25 25/31 Hipótesis (específica) La simetría direccional (SD) obtenido por las red neuronal de retropropagación y la máquina de vector soporte es superior a la técnica ARIMA. El porcentaje de predicciones correctas superiores (CU) obtenido por las red neuronal de retropropagación y la máquina de vector soporte es superior a la técnica ARIMA. El porcentaje de predicciones correctas inferiores (CD) obtenido por las red neuronal de retropropagación y la máquina de vector soporte es superior a la técnica ARIMA.

26 26/31 MODELO DE SOLUCION

27 27/31 Modelo de Solución

28 28/31 Los datos serán recolectados serán diarios. En la fase de exploración de datos se trataran los valores nulos o faltantes de las variables (eliminación). Se usará la técnica de los rangos interquatiles para detectar valores extremos y proceder a eliminarlos.

29 29/31 Modelo de Solución R1 Función de Distribución de Datos Q1 Q3 R2. Valor extremo. Q1,Q3: Representan el 25 y 75% de los datos IQR = Q3- Q1 R1= Q1 -1.5(IQR) R2 = Q3 + 1.5(IQR)

30 30/31 MODELO DE SOLUCIÓN Los datos serán normalizados entre el rango de 0 a 1. Sea X una variable de entrada al modelo. –X : Es una variable de entrada –X*: Es una variable normalizada –min(X): mínimo valor de la variable X –max(X): máximo valor de la variable X

31 31/31 MODELO DE SOLUCION Los algoritmos de la red neuronal de retropropagación y de la máquina de vector soporte se usarán para el pronóstico y se calculara el valor y* k. Se medirán 4 indicadores de desempeño : Sea: –y* k : el valor del día k-ésimo pronosticado de la red –y k : el valor del día k-ésimo real. –N : tamaño de la muestra de prueba es igual a : N = T(n)*(1-h) –T : tamaño de la muestra a considerar es igual a: T(n)= 2347-n –n : número de dias predictores 1.-MAPE:

32 32/31 Modelo de Solución 2.-SD:

33 33/31 Modelo de Solución 3.- CU:

34 34/31 Modelo de Solución 4.-CD:

35 35/31 ANÁLISIS DE FACTIBILIDAD

36 36/31 DATOS Y EXPERIMENTOS Los datos serán obtenidos de fuentes como: BCR, MEF, SBS, INEI, Banco Federal de New York (*). Se realizaran 10 experimentos por cada indicador de desempeño. (*) http://www.newyorkfed.org/research/global_economy/usecon_charts.html http://www.newyorkfed.org/research/global_economy/usecon_charts.html

37 37/31 HERRAMIENTAS

38 38/31 Herramientas Los algoritmos de la red neuronal de retropropagación y de la máquina de vector soporte serán programados usando el software matemático Matlab. Se usará el software estadístico SPSS para simular el modelo econométrico ARIMA.

39 39/31 CRONOGRAMA

40 40/31 CRONOGRAMA DE ACTIVIDADES

41 41/31 COSTOS ($)

42 42/31 COSTOS

43 43/31 MARCO TEORICO

44 44/31 MODELOS ECONOMICOS DE DETERMINACION DE LA TASA DE CAMBIO MODELO ECONOMICO GENERAL Es una combinación del los modelos económicos monetarios y los de balance del portafolio y se describen por la sgte ecuación:

45 45/31 MODELOS ECONOMICOS DE DETERMINACION DE LA TASA DE CAMBIO MODELO DE BALANCE DE PORTAFOLIO (MBP) MODELO MONETARIO DE PRECIOS FLEXIBLES (MMPF) MODELO MONETARIO DE PRECIOS AJUSTADOS (MMPA)

46 46/31 Red Neuronal de Retropropagación Es usada muy frecuente para tareas de clasificación de patrones y tareas de predicción por su capacidad de aprendizaje y generalización a partir de datos históricos.

47 47/31 Máquina de Vector Soporte Presentadas en 1992. Vapnik y Chervonenkis. Crea nuevas características linealmente separables. Busca un hiperplano que puede separar el espacio en dos partes.

48 48/31 CONCLUSIONES

49 49/31 El presente trabajo pretende servir como apoyo a la toma de decisiones del sector financiero y para políticas de regulación monetaria. Mediante el uso de técnicas de minería de datos se pretende obtener un mejor desempeño que el modelo econométrico ARIMA para la tarea de pronóstico. Se podrá determinar que variables son las determinantes de la tasa de cambio.


Descargar ppt "Propuesta de Tesis Seminario de Tesis I Pronóstico diario de la tasa de cambio usando minería de datos como apoyo a la toma de decisiones 4 Noviembre 2006."

Presentaciones similares


Anuncios Google