ESTADÍSTICA Y ECONOMETRÍA PARA AVALUADORES Por Jorge Iván Duque Botero Economista Avaluador - Docente
ESTADÍSTICA La estadística es la ciencia que estudia la recolección, análisis e interpretación de datos de una muestra representativa, ya sea para ayudar en la toma de decisiones o para explicar condiciones regulares o irregulares de algún fenómeno o estudio aplicado, de ocurrencia en forma aleatoria o condicional.
DISTRIBUCION DE PROBABILIDAD La asignación de probabilidades se puede hacer de dos maneras: En forma objetiva, cuyo método consiste en calcular la probabilidad mediante estadísticas, por ejemplo si el experimento consiste en lanzar al aire una moneda 10 veces y supongamos que al caer mostró cara 6 veces y en las otras 4 mostró sello, entonces la probabilidad de obtener una cara en el próximo lanzamiento será de 6/10 lo que equivale a decir que hay una probabilidad de obtener una cara en el próximo lanzamiento del 60%; y la segunda, en forma subjetiva, en el cual no hay estadísticas porque no se realizaron experimentos previos o porque el número de experimentos es insuficiente para elaborar una estadística, bajo estas circunstancias, se les solicita a varias personas que tengan un sano criterio y además sean expertas en la materia para que den su concepto sobre el posible resultado futuro de un determinado evento. Cuando vamos a tomar una decisión sobre inversión de dineros, vamos a pronosticar el futuro y este pronóstico puede hacerse en muchas formas por ejemplo tomando como base la economía del medio, en tales circunstancias, la estimación podría ser hecha en diferentes condiciones como depresión, recesión, normales, buenas y prosperas, también podría haberse hecho en una forma más sencilla tomando como base el criterio, el cual puede ser optimista, realista o pesimista.
La probabilidad de los ingresos futuros de un proyecto es posible asignarlos en forma objetiva cuando se trata de proyectos de inversión en activos financieros, aunque hay que tener en cuenta que las estadísticas fueron hechas con unas condiciones financieras y técnicas diferentes a las que se presentarán cuando se efectúe el nuevo experimento. Cuando se trata de proyectos de ingeniería en casi todos los casos la asignación de probabilidades debe hacerse en forma subjetiva por expertos en la materia, como puede ser el caso de los ingresos que se obtendrán en una máquina prototipo (única máquina en su género en el mundo). Cuando evaluamos un proyecto asignando probabilidades en forma objetiva decimos que hacemos la evaluación en condiciones de riesgo, pero si la asignación de probabilidades se realiza en forma subjetiva se dice que la evaluación se hace en condiciones de incertidumbre.
DESVIACION ESTANDAR RESPECTO A PROBABILIDAD Cuando los expertos no coinciden en la predicción, debemos trabajar con el Valor Esperado (valor promedio probabilístico). Si la predicción de los expertos coincidiera o al menos sus variaciones fueran mínimas tendríamos confianza en el resultado de las predicciones, pero mientras más alejados están los resultados, tendremos menos confianza en éstas predicciones. En estas condiciones parece ser que la medida más adecuada de la confianza podría ser la desviación estándar. Según la estadística existe una probabilidad del 68.27% de encontrar un resultado que esté entre la media aritmética más una desviación estándar y el medio aritmético menos una desviación estándar, que existe una probabilidad del 95.44% de hallar un resultado dentro del margen comprendido entre la media aritmética y más o menos dos desviaciones estándar y que la probabilidad llega al 99.74% si se amplía el margen a tres desviaciones estándar a cada lado del medio aritmético como se puede apreciar en la gráfica:
DESVIACION ESTANDAR RESPECTO A LA CURVA NORMAL: DESVIACION ESTANDAR RESPECTO A LA CURVA NORMAL: La Desviación Estándar, indica sí una distribución simétrica es normal o no. Esto es importante de conocer, porque si la distribución es "Normal", se podrán calcular cuales son los valores de la serie que se encuentran fuera de la campana. Los valores que se encuentran fuera de la campana (o debajo de las colas), se consideran "VALORES EXTREMOS" y se definirán como aquellos valores que afectan notablemente a la "Media Aritmética". Se define como "Valores Extremos", aquellos datos de la serie que se encuentran fuera del intervalo: | ±S|≥ 68,27 %
Para que un "Diagrama de Dispersión", sea considerado como una "Distribución Normal", se deben cumplir las siguientes condiciones: a) Simetría de los datos: |± D |≥ 57,5% b) Que por lo menos el 68,27% de los datos esté incluida en el intervalo: | ±S|≥ 68,27 % Ejemplos: Para datos no agrupados: muestras ≤ 30 Se tienen las siguientes muestras:
nxi|xi- | , , , , , , , , , , , , , , , , , , , ∑= 2358,94
13/19=68% 68% > 57,5% nxi
b)| ±S|≥ 68,27% |363,68±161,62|= Lim inf 202 Lim sup /19=74% 74%>68,27%
SERIE DEPURADA
Histogramas Es una representación gráfica de una variable en forma de barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores representados, ya sea en forma diferencial o acumulada. Sirven para obtener una "primera vista" general, o panorama, de la distribución de la población, o la muestra, respecto a una característica, cuantitativa y continua, de la misma y que es de interés para el observador. Diagramas de barras simples Representa la frecuencia simple (absoluta o relativa) mediante la altura de la barra la cual es proporcional a la frecuencia simple de la categoría que representa. Diagramas de barras compuesta Se usa para representar la información de una tabla de doble entrada o sea a partir de dos variables, las cuales se representan así; la altura de la barra representa la frecuencia simple de las modalidades o categorías de la variable y esta altura es proporcional a la frecuencia simple de cada modalidad. Diagramas de barras agrupadas Se usa para representar la información de una tabla de doble entrada o sea a partir de dos variables, el cual es representado mediante un conjunto de barras como se clasifican respecto a las diferentes modalidades. Polígono de frecuencias Es un gráfico de líneas que de las frecuencias absolutas de los valores de una distribución en el cual la altura del punto asociado a un valor de las variables es proporcional a la frecuencia de dicho valor. Ojiva porcentual Es un gráfico acumulativo, el cual es muy útil cuando se quiere representar el rango porcentual de cada valor en una distribución de frecuencias.
Ejemplo: hacer un histograma con los datos del ejercicio anterior. Para iniciar debemos hacer una tabla con la distribución de frecuencias: Nos paramos en cualquier celda y le damos click a la pestaña insertar – columna – columna en 2D – columna agrupada. xifi
Luego damos click contrario en el gráfico y le damos SELECCIONAR DATOS y nos aparece los casillas para seleccionar los datos a graficar.
Nombramos la serie: Frecuencia y seleccionamos los dato de la tabla.
Editamos la etiquetas del eje horizontal:
Damos click en cualquiera de las barras del gráfico y en opciones de serie llevamos ANCHO DEL INTERVALO a sin intervalo. Luego en la parte izquierda buscamos RELLENO y seleccionamos la casilla de VARIAR COLORES ENTRE LOS PUNTOS. Fin.
Nuestro histograma queda:
Para realizar la regresión se utiliza el método de mínimo cuadrados ordinarios (MCO). Ejemplo: La siguiente tabla de datos contiene el consumo de tazas de café por día (Y) y el precio por taza en E.E.U.U de 1970 a AÑO Y2,572,52,352,32,252,22,111,941,972,062,02 X0,770,740,720,730,760,751,081,811,391,21,17
Realizamos la siguiente secuencia en Excel: -Datos – Análisis de datos – Regresión – Aceptar.
Y X
A diferencia de la función de primer grado o lineal en ésta tenemos un tercer término, que se encuentra elevado al cuadrado. Para su desarrollo en Excel debemos crear una nueva columna como lo indica su forma función para realizar la regresión a través de MCO.
Quedando entonces el modelo de la siguiente manera: Y i = 6322,0234 – 13,9725X i + 0,00995X i 2 Los costos caen hasta cierto (un mínimo) punto, cuando la producción aumenta, pero a partir de ese mínimo existe un incremento progresivo por cada unidad adicional.
YXX^2Y^2X^2X*Y Y (V) X (P) LNYLNXX2LNY2LNX2LNY*LNX 10,51,65-0, , , , , , ,0300, , , ,50,740, , , , , , ,610, , , , , , ,50,530, , , , , , ,451, , , , , , SUMATORIAS 2,4204-1,6981,62733,17181,6273-2,271
El modelo lineal queda de la siguiente forma: Y i = 0,0119 – 1,383X i Para ajustarlo a la forma funcional debemos de aplicar anti.ln al intercepto: Quedando ahora: P= 1,01197*V -1,383
X Y
Para desarrollar el modelo por MCO creamos una nueva columna con el ln(Y) posteriormente hacemos la regresión de ln(y) y X.
Ahora para llegar a la forma funcional tomamos la constante e= 2, elevado al intercepto hallado. β 0 = 2,7182 8,7813 = 6511,3815 Y= 6511,3815*e -0,05688*x