José Francisco Valverde Calderón Sitio web: Profesor:

AJUSTE 1 I ciclo, 2015 Email: jose.valverde.calderon@una.cr
José Francisco Valverde Calderón Sitio web: Profesor: José Francisco Valverde C

Introducción El “Estudio de los datos cuantitativos de la población…”
Ajuste 1 I Ciclo, 2015 2 Introducción El “Estudio de los datos cuantitativos de la población…” La “Rama de la matemática que utiliza grandes conjuntos de datos numéricos para obtener inferencias basadas en el cálculo de probabilidades.” Otra definición es: la Estadística es la parte de las Matemáticas que se encarga del estudio de una determinada característica en una población, recogiendo los datos, organizándolos en tablas, representándolos gráficamente y analizándolos para obtener conclusiones de dicha población. Comúnmente dos tipos de estadísticas: La estadística descriptiva, que se refiere a los métodos aplicables para describir un conjunto de observaciones (cuantitativas o cualitativas), por medio de la tabulación y presentación de datos (Quintana, C. 1996) Ejemplo: Red geodésica oficial de Costa Rica Profesor: José Francisco Valverde C

La red de primer orden es definida por 33 vértices pasivos
Ajuste 1 I Ciclo, 2015 3 Introducción La red de primer orden es definida por 33 vértices pasivos Profesor: José Francisco Valverde C

Introducción Ajuste 1 I Ciclo, 2015 4 Profesor:
José Francisco Valverde C

Ajuste 1 I Ciclo, 2015 5 Introducción La estadística inferencial, que comprende los métodos y procedimientos para deducir propiedades (hacer inferencias) de una población, a partir de una parte de la misma, que llamamos muestra. La inferencia proporciona instrumentos estadísticos para obtener conclusiones y hacer generalizaciones válidas de la población en estudio, con base a la información obtenida en el muestreo. Por ejemplo, se hace el reconocimiento de 7 vértices de la red geodésica de primer orden, seleccionados al azar**. Con base a los resultados de las visitas, se determina la cantidad de vértices en buen y mal estado y se hace una inferencia sobre el estado de la red geodésica. Nota: la inferencia estadística requiere el diseño de experimentos, los cuales se realizan con diferentes tipos de muestreos, que no se estudian en el curso. Profesor: José Francisco Valverde C

Elementos de estadística
Ajuste 1 I Ciclo, 2015 6 Elementos de estadística Se habla de variables, cuando se hace referencia a características cuantitativas de la unidad estadística en estudio Una variable aleatoria discreta, es una variable X la cual no puede tener resultados intermedios, toma valores aislados Una variable aleatoria continua, es una variable X que, dentro de un intervalo, su magnitud puede dar lugar a cualquier valor (la variable puede tomar infinito número de valores en el intervalo) La aplicación de la teoría de errores a la topografía y la geodesia, implica el estudio de variables continuas Dada la naturaleza de este tipo de variables, la probabilidad de que asuma un valor particular dentro del intervalo es cero (0), ya que se trata de un caso favorable, en infinito número de opciones Profesor: José Francisco Valverde C

Ajuste 1 I Ciclo, 2015 7 Elementos de estadística Es común que para determinar una determinada cantidad, se hagan una serie de observaciones de esa cantidad, por lo que se define el vector de observaciones l: De esta forma, los valores li se encontrarán en un intervalo a,b, de forma que: n es el tamaño de la serie de mediciones Profesor: José Francisco Valverde C

Ajuste 1 I Ciclo, 2015 8 Elementos de estadística Exactitud y Precisión Debido a los errores aleatorios presentes en la mediciones, una medición repetida de la misma cantidad dará como resultado diferentes valores Discrepancia es la diferencia algebraica entre dos mediciones de la misma cantidad Las medidas precisas no son necesariamente valores exactos La precisión de una medición se da cuando aparecen pequeñas discrepancias entre mediciones repetidas. En general se supone que existen únicamente errores aleatorios. De esta forma, la tendencia es a dar mayor credibilidad a tales datos y llamar las medidas como precisas (aunque puedan que no sean exactas) Profesor: José Francisco Valverde C

Ajuste 1 I Ciclo, 2015 9 Elementos de estadística Precisión: grado de consistencia entre un grupo de mediciones Se basa en los tamaños de las discrepancias en una serie de datos El grado de precisión alcanzable depende de la condiciones del medio ambiente durante las mediciones, la calidad del equipo usado, experiencia del observador con el equipo y las técnicas de medición Exactitud: medida de la aproximación absoluta de la cantidad medida con su valor verdadero Como el valor verdadero es una cantidad que no puede ser conocida, la exactitud es una incógnita Población: es el conjunto de todas las unidades estadísticas. Este puede ser una población finita, como la cantidad de participantes inscritos en un evento o infinita Muestra: Es un subconjunto de datos tomados de una población. Se selecciona con propósitos de efectuar estudios e inferir resultados Profesor: José Francisco Valverde C

Ajuste 1 I Ciclo, 2015 10 Elementos de estadística Alta precisión Baja exactitud Alta precisión Alta exactitud Baja precisión Baja exactitud Profesor: José Francisco Valverde C

4.1. Promedio simple y promedio general
Ajuste 1 I Ciclo, 2015 11 4.1. Promedio simple y promedio general A los valores obtenidos en una serie de n mediciones, con n finito, pueden hacerse corresponder puntos en la recta orientada de números reales Por la presencia de los errores aleatorios, todos los resultados se ubicarán en forma dispersa dentro de un intervalo limitado por un valor mínimo y otro máximo Los resultados de la mediciones corresponden a valores de una variable aleatoria, y se ubican como componentes del vector de observaciones L Profesor: José Francisco Valverde C

Pesado 2.1 Promedio simple y promedio general Ajuste 1 I Ciclo, 2015 12 4.1. Promedio simple y promedio general El promedio simple se define para una serie de mediciones realizadas con la misma exactitud. Si dentro de la serie hay mediciones con exactitudes diferentes, tal es el caso en el que se utilizan diferentes equipos de medición o metodologías, el promedio se define de forma general como el promedio pesado o ponderado. pi : peso de la observación Li P: matriz de los pesos de las observaciones, diagonal para el caso de observaciones independientes, sin correlación Profesor: José Francisco Valverde C

4.1. Promedio simple y promedio general Medidas de tendencia central
Ajuste 1 I Ciclo, 2015 13 4.1. Promedio simple y promedio general Medidas de tendencia central La media (poblacional o muestral) La mediana La moda Se le conoce también como media posicional. Es el valor que esta a la mitad del conjunto de datos, una vez que estos han sido ordenados de menor a mayor (la mitad de las observaciones estará sobre la mediana y la otra mitad por debajo de la mediana) Si n es par: Si n es impar: Profesor: José Francisco Valverde C

Ajuste 1 I Ciclo, 2015 14 4.1. Promedio simple y promedio general Media poblacional Media muestral Profesor: José Francisco Valverde C

Ajuste 1 I Ciclo, 2015 15 4.1. Promedio simple y promedio general La Moda Es el valor que mas se repite dentro de un conjunto de datos. Es el valor que se obtiene con mas frecuencia. Ejemplo: Profesor: José Francisco Valverde C

2.2 Valor mas probable y valor verdadero
TGC424 Ajuste 1 Ajuste 1 I Ciclo, 2015 16 4.2. Valor más probable y valor verdadero Si se realiza una cantidad de observaciones que tienda a infinito (n  ∞), la muestra tiende a la población y el promedio es un valor inmejorable. A este valor se le denomina valor más probable y se puede decir que es un promedio óptimo. En la estadística matemática se le llama esperanza matemática o valor esperado. Li = observación i n = cantidad de observaciones L = variable aleatoria L = valor verdadero EL= Esperanza matemática Profesor: José Francisco Valverde C

4.2. Valor más probable y valor verdadero
Ajuste 1 I Ciclo, 2015 17 4.2. Valor más probable y valor verdadero Valor verdadero: Es el valor exacto de una magnitud. Es un valor teórico y salvo algunos casos especiales, en general no se conoce Error verdadero: Es la diferencia entre una medida individual y el valor verdadero Valor mas probable: Es el valor de una cantidad que basado en la serie de mediciones realizadas, tiene la más alta probabilidad de ocurrencia Grados de libertad: es el número de observaciones superabundantes o redundantes, que sobredeterminan un problema Residuo: es la diferencia entre cualquier valor medido y el valor más probable de una cantidad. Un residuo NO es un error Las medidas de dispersión indican que tanto se dispersan las observaciones alrededor de la media Rango: es la diferencia entre el valor máximo y el valor mínimo de un conjunto de datos Profesor: José Francisco Valverde C

Escuela de Topografía, Catastro y Geodesia
Ing. Jorge Moya Z. Ajuste 1 I Ciclo, 2015 18 Diferencias entre los distintos valores Entre valor más probable y valor verdadero, error sistemático Entre una observación y el valor verdadero, error verdadero matemática Entre una observación y el valor más probable, error accidental o casual matemática Entre el promedio y las observaciones, residuo o corrección geodesia Profesor: José Francisco Valverde C

4.3. Varianza y desviación estándar
Ajuste 1 I Ciclo, 2015 19 4.3. Varianza y desviación estándar Varianza de una población 2: Desviación estándar de una población :

4.3. Varianza y desviación estándar
Ajuste 1 I Ciclo, 2015 20 4.3. Varianza y desviación estándar Varianza de una muestra s2: Desviación estándar de una muestra s:

4.3. Varianza y desviación estándar Desviación estándar de un promedio
Ajuste 1 I Ciclo, 2015 21 4.3. Varianza y desviación estándar Desviación estándar de un promedio Debido a que todos los valores medidos contienen errores, el promedio que se calcula para una muestra también contendrá un error, el cual se estima mediante el cálculo de la desviación estándar del promedio: Profesor: José Francisco Valverde C

Algunas funciones estadísticas con Matlab
Ajuste 1 I Ciclo, 2015 22 Algunas funciones estadísticas con Matlab Operaciones matriciales en Matlab: Nota: se parte de que las dimisiones de las matrices permiten la operación a efectuar. max(x): encuentra el valor mas grande del vector x [a,b] = max(x): devuelve el valor mas grande del vector x y su ubicación min(x): encuentra el valor mas pequeño del vector x [a,b] = min(x): devuelve el valor mas pequeño del vector x y su ubicación mean(x): encuentra el promedio vector x median(x): encuentra la mediana del vector x sum(x): suma los elementos del vector x std(x): calcula la desviación estándar del conjunto de datos en x var(x): calcula la varianza del conjunto de datos en x Profesor: José Francisco Valverde C

Concepto de peso y cofactor
TGC424 Ajuste 1 Ajuste 1 I Ciclo, 2015 23 Concepto de peso y cofactor El cofactor y el peso son parámetros que también se utilizan para describir las características aleatorias o estocásticas de las observaciones El peso pi de una observación se define como el recíproco de la varianza de esa observación El peso se puede definir en forma general como una constante dividida por la varianza; si se introduce como constante la varianza de la unidad de peso, el peso de la observación queda expresado como: Profesor: José Francisco Valverde C

Concepto de peso y cofactor
TGC424 Ajuste 1 Ajuste 1 I Ciclo, 2015 24 Concepto de peso y cofactor El cofactor qi de una observación Li se define como el inverso del peso. Los conceptos de peso y cofactor aplicados a matrices de varianza-covarianza en el caso del vector aleatorio de dimensión n conduce a las relaciones: Matriz de cofactores empíricos de las observaciones Matriz de cofactores teóricos de las observaciones Matriz de pesos de las observaciones Profesor: José Francisco Valverde C

4.4. Coeficiente de correlación
TGC424 Ajuste 1 Ajuste 1 I Ciclo, 2015 25 4.4. Coeficiente de correlación Correlación significa dependencia entre dos variables aleatorias, mide la dependencia estocástica entre dos observaciones y se expresa mediante el coeficiente de correlación, que para el caso empírico es rij: coeficiente de correlación entre Li y Lj. si, sj: desviaciones estándar de Li y Lj. sij: covarianza Coeficiente de correlación en el caso teórico rij: coeficiente de correlación entre Li y Lj. si, sj: desviaciones estándar de Li y Lj. sij: covarianza entre Li y Lj. La idea de la correlación surgió en 1888 de F. Galton a partir de estudios en el campo de la biología y meteorología. Profesor: José Francisco Valverde C

TGC424 Ajuste 1 Ajuste 1 I Ciclo, 2015 26 4.4. Coeficiente de correlación El coeficiente de correlación se encuentra entre dos valores extremos -1 < r < + 1 Considerando el coeficiente de correlación en la matriz de varianza-covarianza teórica, esta queda expresada de la forma general que se tiene en la diapositiva siguiente La matriz SLL es simétrica y por lo tanto vale sij = sji y rij = rji para todo i diferente de j Vale algo semejante para la matriz empírica SLL, sustituyendo las s por  y las r por  Profesor: José Francisco Valverde C

TGC424 Ajuste 1 Ajuste 1 I Ciclo, 2015 27 4.4. Coeficiente de correlación s21 r12s1s2 r13s1s3 . r1ns1sn r21s2s1 s22 r2ns2sn r31s3s1 r32s3s2 s23 r3ns3sn S LL = r n1sns1 r n2sns2 r n3sns3 s2n Profesor: José Francisco Valverde C

TGC424 Ajuste 1 Ajuste 1 I Ciclo, 2015 28 4.4. Coeficiente de correlación Ejemplos de correlación en geodesia Correlación empírica entre las distancias medidas desde un punto poligonal al punto atrás y al punto adelante. Correlación empírica entre los dos ángulos medidos en una estación Profesor: José Francisco Valverde C

TGC424 Ajuste 1 Grado de dependencia entre dos variables aleatorias determinadas por series de observaciones L1(j) L1(k) L2(j) L2(k) L3(j) L3(k) L(j) = . L(k) = Ln(j) Ln(k)

TGC424 Ajuste 1 Ajuste 1 I Ciclo, 2015 30 4.4. Coeficiente de correlación Regresión lineal en geodesia Los casos más comunes de regresión se basan en funciones lineales, exponenciales y logarítmicas. En el caso lineal la función tendrá la forma y = m x + b Siendo L(j) la variable dependiente y L(k) la variable independiente, se llama línea de regresión a la curva ( c ) = L(j) = f ( L(k) ) función de la forma explícita y = f ( x ) que cumple la condición Σ( Lc(j) - L(j) )2 = mínimo con Lc(j) = ordenada medida hasta la curva. Profesor: José Francisco Valverde C

Ajuste 1 I Ciclo, 2015 31 4.5. Histogramas Si se considera que X es una variable aleatoria continua, la cual obtiene valores como resultado de un experimento, las n mediciones conforman el vector de observaciones L. Las n observaciones de la variable se encuentran dentro del intervalo <a, b> Los errores aleatorios no se pueden pronosticar, pero pueden deducirse algunas reglas sobre su comportamiento en base a la frecuencia con que se presentan en una serie de mediciones, lo que se puede visualizar en el gráfico conocido como histograma. La serie de mediciones se divide en distintas clases de un ancho determinado x y se determina la frecuencia con que se da un resultado dentro de cada clase. Con las clases y la frecuencia se construye el histograma Profesor: José Francisco Valverde C

Ing. Jorge Moya Z. Ajuste 1 I Ciclo, 2015 32 4.5. Histogramas La cantidad de resultados dentro de cada clase i con el valor central xi, con i = 1 … m, se denomina frecuencia absoluta ki. La relación entre ki y n se llama frecuencia relativa o función de frecuencia, y se puede utilizar en lugar de la frecuencia absoluta. Profesor: José Francisco Valverde C

Ing. Jorge Moya Z. Ajuste 1 I Ciclo, 2015 33 4.5. Histogramas Profesor: José Francisco Valverde C

4.5. Histogramas Con la función de frecuencia relativa la suma de las frecuencias era igual a la unidad, y se puede graficad en forma semejante al caso absoluto Con n tendiendo a infinito, la muestra tiende a la población, la función de la frecuencia relativa tiende hacia un límite llamado probabilidad, la función correspondiente se llama función de probabilidad. Dividiendo la función de probabilidad por Dx y haciéndolo tender a dx se obtiene la función de densidad de probabilidad. Profesor: José Francisco Valverde C

4.6. Funciones de distribución y de densidad
Ajuste 1 I Ciclo, 2015 35 4.6. Funciones de distribución y de densidad La distribución normal Si el tamaño de las mediciones tendiera a infinito y representan en un histograma con intervalos diferenciales (cada vez pequeños) xdx, la curva del histograma tendería a ser una línea continua en forma de campana. Gauss la llamó curva de error y dedujo su función a partir del cálculo de probabilidades, usando los errores aleatorios en vez de las observaciones en el eje x y las frecuencias en el eje y. La forma de distribución de los errores aleatorios se llama distribución normal Si una variable aleatoria siguen una distribución normal se indica: Profesor: José Francisco Valverde C

4.6. Funciones de distribución y de densidad
Ajuste 1 I Ciclo, 2015 36 4.6. Funciones de distribución y de densidad f (e) e : error casual Li – m e: base de los logaritmos naturales s: desviación estándar teórica f(): función de densidad probabilidad de la distribución de los errores e

Ing. Jorge Moya Z. Ajuste 1 I Ciclo, 2015 37 4.6. Funciones de distribución y de densidad El comportamiento aleatorio de cada serie se describe por la función de densidad y dependerá de la desviación estándar de cada serie. En la figura siguiente se muestran tres curvas de distribución normal para valores de desviaciones estándar: menor que la unidad, igual a la unidad y mayor que la unidad.

La distribución normal estándar Ing. Jorge Moya Z. Ajuste 1 I Ciclo, 2015 38 Es una distribución normal que se puede vincular a cualquier distribución normal centrada mediante la siguiente transformación: Los valores de y representan múltiplos de la desviación estándar teórica de la serie de observaciones, la distribución normal general se normaliza en . La distribución normal estándar es una distribución normal con el valor especial  = 1. Llevando los valores de y al eje x se obtiene una curva cuya ecuación se denomina función de densidad de la distribución normal estándar. Profesor: José Francisco Valverde C

Ing. Jorge Moya Z. Ajuste 1 I Ciclo, 2015 39 Función de densidad de la distribución normal Profesor: José Francisco Valverde C

La distribución normal estándar Ing. Jorge Moya Z. Ajuste 1 I Ciclo, 2015 40 Si los errores se distribuyen según la distribución normal estándar, entonces se dice que las observaciones siguen una distribución normal estándar o estandarizada: Con la función de densidad de la distribución normal y de la distribución normal estándar se pueden calcular probabilidades. Este cálculo se basa en el área bajo la curva entre los límites -∞ y +∞. Con este concepto de probabilidad el área total bajo la curva entre esos límites representa el 100% de probabilidad, la unidad, la certeza, ya que la totalidad de los resultados posibles de una serie de mediciones se deben ubicar dentro de los límites. Profesor: José Francisco Valverde C

Probabilidades para distintos intervalos Escuela de Topografía, Catastro y Geodesia Ing. Jorge Moya Z. Ajuste 1 I Ciclo, 2015 41 -s s a b Profesor: José Francisco Valverde C

Normalización Ing. Jorge Moya Z. Ajuste 1 I Ciclo, 2015 42 En las computadoras y las calculadoras se tienen integradas las rutinas de la funciones de densidad y de distribución de la distribución normal estándar. En la gran mayoría de los libros dedicados a la estadística igualmente se tienen tablas con estos valores. La transformación entre una distribución normal cualquiera y la distribución normal estándar se realiza por medio de la relación conocida como normalización: Los parámetros fundamentales de una distribución normal son el valor más probable  como valor central y la varianza 2. Profesor: José Francisco Valverde C

Probabilidad e incertidumbre Ing. Jorge Moya Z. Ajuste 1 I Ciclo, 2015 43 En el estudio estadístico de ciertos eventos es usual establecer un nivel de confianza que equivale a la probabilidad o en su defecto el nivel de incertidumbre. Entre la probabilidad y el nivel de incertidumbre existe la siguiente relación. P = 1 –  La relación anterior vale cuando se aplica una cola de la distribución. Si se aplican dos colas simétricas de la distribución, la relación entre probabilidad e incertidumbre está dada por la siguiente igualdad. P = 1 – 2*/2 Profesor: José Francisco Valverde C

Ing. Jorge Moya Z. Ajuste 1 I Ciclo, 2015 44 a P Una cola a/2 P Dos colas Profesor: José Francisco Valverde C

Ing. Jorge Moya Z. Ajuste 1 I Ciclo, 2015 45 La distribución t de Student Se aplica cuando en la serie de n mediciones de una variable aleatoria se determina la desviación estándar empírica como estimación de la teórica, al normalizar los errores casuales dividiendo por la desviación estándar empírica se obtiene la variable t. La variable t no se comporta según la distribución normal, sino que según la distribución t-Student. La distribución depende de los grados de libertad f y para su determinación deben distinguirse dos casos. f = n, cuando la desviación estándar s se calcula con errores verdaderos . f = n – 1, cuando la desviación estándar s se calcula con los residuos v. Profesor: José Francisco Valverde C

Ing. Jorge Moya Z. Ajuste 1 I Ciclo, 2015 46 La distribución t de Student La función de densidad (la curva) de la distribución normal estándar es única, pero la de la distribución t varía en función de los grados de libertad. Cuando n tiende a infinito, la distribución t tiende la distribución normal estándar. Profesor: José Francisco Valverde C

Ji Escuela de Topografía, Catastro y Geodesia Ing. Jorge Moya Z. Ajuste 1 I Ciclo, 2015 47 La distribución ji-cuadrado Dada una cantidad de variables aleatorias que siguen la distribución normal estándar, si se hace la suma de sus cuadrados se obtiene una nueva variable aleatoria cuya distribución se denomina ji-cuadrado cuando s2 se calcula con errores verdaderos e. cuando s2 se calcula con los residuos ( f = n – 1 ) Profesor: José Francisco Valverde C

Ing. Jorge Moya Z. Ajuste 1 I Ciclo, 2015 48 La distribución F o de Fisher El cociente de dos parámetros independientes entre si con distribución ji- cuadrado, define una nueva variable aleatoria F: La variable F es el cociente de dos varianza empíricas. Su comportamiento se describe por medio de la función de densidad de la distribución Fisher o distribución F, que depende de los grados de libertad f1 y f2 de las respectivas varianzas empíricas Profesor: José Francisco Valverde C

4.7. Intervalos y regiones de confianza
Ajuste 1 I Ciclo, 2015 49 4.7. Intervalos y regiones de confianza Los intervalos de confianza dan el grado de confianza con que se logra una aproximación al valor teórico de una variable aleatoria determinada de forma “empírica”. El cálculo de los intervalos de confianza se basa en el uso de la estadística matemática, para una determinada probabilidad, que por lo general para el 95% de confianza o 5% de incertidumbre. Elegida la probabilidad o el nivel de incertidumbre, se calculan los valores (a, b) que definen el intervalo de confianza. Profesor: José Francisco Valverde C

Ajuste 1 I Ciclo, 2015 50 4.7. Intervalos y regiones de confianza 1- = Probabilidad = incertidumbre  = valor verdadero 1- /2 /2  a b Profesor: José Francisco Valverde C

Ing. Jorge Moya Z. Ajuste 1 I Ciclo, 2015 51 4.7. Intervalos y regiones de confianza Intervalo de confianza del valor más probable , con  conocido (distribución normal) Se parte de una distribución normal y se buscan los límites a y b del intervalo de confianza para m, asumiendo que se conoce la s de cada medida, por lo que el error del promedio sx se puede determinar como el cociente de s entre la raíz cuadrada de n. Por simetría en la curva de la distribución normal Profesor: José Francisco Valverde C

Ajuste 1 I Ciclo, 2015 52 4.7. Intervalos y regiones de confianza a/2 ya/2 y1-a/2 1 - a Límites del intervalo de confianza Profesor: José Francisco Valverde C

Ing. Jorge Moya Z. Ajuste 1 I Ciclo, 2015 53 4.7. Intervalos y regiones de confianza Intervalo de confianza del valor más probable m, con s desconocido (distribución t) Se estima s a través de la desviación estándar empírica s calculada con los datos de la serie de mediciones, que siguen una distribución t. La desviación estándar del promedio sx se calcula como el cociente de la desviación estándar empírica de la medición entre la raíz de n. Límites del intervalo de confianza Profesor: José Francisco Valverde C

Ajuste 1 I Ciclo, 2015 54 4.7. Intervalos y regiones de confianza Para el caso del test global, se parte del hecho de que se ha hecho un ajuste con f-grados de libertad y que a partir de las n-observaciones se obtiene la varianza a posteriori de la unidad de pesos so2. El cálculo del intervalo de confianza se hace de la siguiente forma: a y b = valores extremos del intervalo de confianza so = desviación estándar a posteriori de la unidad de pesos f = grados de libertad 2 = cuantil de la distribución Chi-cuadrado Profesor: José Francisco Valverde C

Ajuste 1 I Ciclo, 2015 55 4.7. Intervalos y regiones de confianza Profesor: José Francisco Valverde C

Ajuste 1 I Ciclo, 2015 57 4.7. Intervalos y regiones de confianza Calculo de elipses de confianza Las elipses representan una región de confianza, tal que con una probabilidad P = 1 -  se puede asegurar estadísticamente que el punto, dado por sus coordenadas teóricas, esta dentro de esa elipse. Entre más pequeña y menos excéntrica es la elipse más confiable es la solución. A1 = semieje mayor de la elipse (a) A2 = semieje menor de la elipse (b)  = ángulo de giro del semieje mayor Profesor: José Francisco Valverde C

Ajuste 1 I Ciclo, 2015 58 4.7. Intervalos y regiones de confianza Calculo de elipses de confianza Caso teórico Los valores qNN, qEE, qNE se extraen de la matriz de factores y cofactores de las incógnitas ajustadas Qxx Para cada punto son los elementos de la submatriz cuadrada correspondiente a las coordenadas del punto. a = semieje mayor de la elipse (a) b = semieje menor de la elipse (b)  = ángulo de giro del semieje mayor Profesor: José Francisco Valverde C

Ajuste 1 I Ciclo, 2015 59 4.7. Intervalos y regiones de confianza Calculo de elipses de confianza Caso empirico Los valores qNN, qEE, qNE se extraen de la matriz de factores y cofactores de las incógnitas ajustadas Qxx Para cada punto son los elementos de la submatriz cuadrada correspondiente a las coordenadas del punto. a = semieje mayor de la elipse (a) b = semieje menor de la elipse (b)  = ángulo de giro del semieje mayor Profesor: José Francisco Valverde C

2.8 Test estadísticos Ing. Jorge Moya Z. Ajuste 1 I Ciclo, 2015 63 4.8. Test estadísticos Es usual en topografía y geodesia tener como resultados dos determinaciones independientes de una misma variable aleatoria, por ejemplo, la distancia entre dos puntos A y B. Surge la pregunta de que si ambas determinaciones: Son coincidentes y que la diferencia numérica es natural por la presencia de los errores casuales en las mediciones. O que discrepan significativamente, eventualmente por un desplazamiento del punto A, del punto B, o de ambos. La decisión para dar una respuesta o la otra puede tomarse con respaldo en una prueba o test estadístico. En el ejemplo de la distancia se asume que ambas determinaciones siguen una distribución normal: Profesor: José Francisco Valverde C

Hipótesis Ing. Jorge Moya Z. Ajuste 1 I Ciclo, 2015 64 4.8. Test estadísticos En teoría, el valor central es el valor verdadero, pero en la práctica lo que se obtiene es el valor ajustado o promediado de la variable aleatoria. La comparación de ambos resultados conduce al planteamiento de dos hipótesis: una hipótesis nula H0 y una hipótesis alternativa HA1 o HA2. En la hipótesis nula se plantea que ambos resultados son coincidentes; aunque exista diferencia numérica no es significativa y es atribuible a la dispersión natural de los errores en las observaciones. Profesor: José Francisco Valverde C

Ejemplo Ing. Jorge Moya Z. Ajuste 1 I Ciclo, 2015 65 4.8. Test estadísticos La primera hipótesis alternativa se plantea cuando se espera con cierto fundamento un incremento en el valor de la variable, es decir, un cambio positivo. La segunda hipótesis alternativa se plantea cuando se asume que pueden haber cambios en los resultados que pueden ser tanto positivos como negativos. Las hipótesis deben someterse a pruebas o test estadísticos para comprobar su validez. Para el planteamiento del test debe partirse de que las variables siguen una distribución conocida. En el ejemplo de la distancia ambas determinaciones siguen una distribución normal, por lo cual su diferencia también seguirá una distribución normal. Si d es la diferencia entre los dos promedios y d la desviación estándar del promedio: Profesor: José Francisco Valverde C

Decisión Ing. Jorge Moya Z. Ajuste 1 I Ciclo, 2015 66 4.8. Test estadísticos y: estadístico o valor de prueba. sd: desviación estándar de la diferencia, obtenida por medio de propagación de errores Bajo la hipótesis nula, y sigue una distribución normal estándar, centrada en el origen y con desviación estándar igual a uno. Bajo la hipótesis alternativa la distribución es normal pero no estándar, con el valor central igual a la diferencia d estandarizada con la desviación estándar. Profesor: José Francisco Valverde C

Región de aceptación y rechazo para el estadístico por medio del test de UNA COLA Ing. Jorge Moya Z. Ajuste 1 I Ciclo, 2015 67 j0(y) y1-a jA(y) y REGIÓN DE ACEPTACIÓN REGIÓN DE RECHAZO cuantil 1- a a Profesor: José Francisco Valverde C

Ing. Jorge Moya Z. Ajuste 1 I Ciclo, 2015 68 Región de aceptación y rechazo para el estadístico por medio del test de DOBLE COLA j0(y) y1-a/2 y jA(y) a/2 ya/2 REGIÓN DE RECHAZO REGIÓN DE ACEPTACIÓN REGIÓN DE RECHAZO cuantil cuantil Profesor: José Francisco Valverde C

Ing. Jorge Moya Z. Ajuste 1 I Ciclo, 2015 69 4.8. Test estadísticos Pasos generales para la aplicación de un test estadístico Formular la hipótesis nula y la hipótesis alternativa. Calcular del estadístico o valor de prueba a partir de las observaciones que siguen una determinada distribución. Elegir el nivel de incertidumbre a y determinar los límites entre las regiones de aceptación y rechazo a partir de los valores de distribuciones estadísticas para un test de una cola o de dos colas. Decidir si la hipótesis nula se acepta o se rechaza, es decir, si el estadístico se encuentra en la zona de aceptación o de rechazo. Profesor: José Francisco Valverde C

Decisión Escuela de Topografía, Catastro y Geodesia Ing. Jorge Moya Z. Ajuste 1 I Ciclo, 2015 70 4.8. Test estadísticos 4.8.1 Test de significancia para la diferencia de dos promedios, caso con mediciones de la misma varianza Se hacen una serie de mediciones para las variables aleatorias L1 y L2, que son las componentes de los vectores de observaciones respectivos. A través de un test se debe decidirse cuál de las siguientes hipótesis se acepta. Hipótesis nula: H0: m1 = m2 Hipótesis alternativas HA1: m1 < m2 Test de 1 cola HA2: m1 ≠ m2 Test de 2 colas Profesor: José Francisco Valverde C

Decisión Escuela de Topografía, Catastro y Geodesia Ing. Jorge Moya Z. Ajuste 1 I Ciclo, 2015 71 4.8. Test estadísticos 1. Cálculo de los promedios empíricos y la diferencia: H0: E{d} = 0 HA1: E{d} > 0 HA2: E{d} ≠ 0 2. Cálculo de la desviación estándar empírica de la diferencia: En este caso la s2 es la misma para ambos conjuntos, s1 y s2 no son más que estimaciones de la varianza teórica s2 E{s12 }= E{s22 } = s2 Profesor: José Francisco Valverde C

Decisión Ing. Jorge Moya Z. Ajuste 1 I Ciclo, 2015 72 4.8. Test estadísticos Cálculo de la varianza común a las series de observaciones Por propagación de errores se calcula la desviación estándar de la diferencia d 3. Cálculo del estadístico t que sigue una distribución Student bajo la hipótesis nula, con f = m+n-2, grados de libertad Hipótesis nula Ho: t ≤ q Ho no se rechaza t > q Ho se rechaza q: Cuantil de la distribución t, con q = tf,1-a: Test de 1 cola (HA1) q = tf,1-a/2: Test de 2 colas (HA2) Profesor: José Francisco Valverde C

Decisión Ing. Jorge Moya Z. Ajuste 1 I Ciclo, 2015 73 4.8. Test estadísticos 4.8.2 Test de significancia para la diferencia de dos promedios, caso con mediciones de diferente varianza Se parte de que s12 ≠ s22, la derivación de un test (problema de Behrens-Fisher) es compleja y no existe una solución estricta. 1. Cálculo de las desviaciones estándar empíricas de los promedios, calculados de igual forma que en el caso anterior. Cálculo de la varianza empírica de la diferencia d Profesor: José Francisco Valverde C

Decisión Ing. Jorge Moya Z. Ajuste 1 I Ciclo, 2015 74 4.8. Test estadísticos 2. 3. Determinación del estadístico o valor de prueba 4. Determinación de los grados de libertad f 5. Aplicación del test con base en la distribución de Student de igual forma que en el caso anterior Profesor: José Francisco Valverde C

Decisión Ing. Jorge Moya Z. Ajuste 1 I Ciclo, 2015 75 4.8. Test estadísticos 4.8.3 Test de significancia para la varianza, comparación de dos varianzas empíricas Se presenta cuando se tienen las varianzas empíricas de dos grupos de mediciones y se desea comprobar estadísticamente si corresponden a la misma exactitud o no, aunque difieran numéricamente. s12: Calculado para el primer grupo con f1 grados de libertad s22: Calculado para el segundo grupo con f2 grados de libertad Para el planteamiento del test se asume que la varianza teórica s2 es igual para ambos casos Hipótesis nula: H0: s2 = s12 = s22 Hipótesis alternativas HA1: s12 > s22 Test de 1 cola HA2: s12 ≠ s22 Test de 2 colas

Decisión Escuela de Topografía, Catastro y Geodesia Ing. Jorge Moya Z. Ajuste 1 I Ciclo, 2015 76 4.8. Test estadísticos Se calcula el estadístico F tomando como primer grupo y en el numerador el que tiene la mayor varianza. El cociente sigue una distribución de Fisher, con f1 y f2 grados de libertad. Cuantiles de la distribución Ff1,f2 : Ff1,f2,1- a (en las tablas) Ff1,f2,a/2 = 1 / Ff1,f2,1- a/2 Decisión en test de una cola: F > Ff1,f2,1 - a H0 se rechaza F ≤ Ff1,f2,1 - a H0 no se rechaza Decisión en test de dos colas: Ff1,f2,a/2 ≤ F ≤ Ff1,f2,1- a/2 H0 no se rechaza F < Ff1,f2,a/2 o F > Ff1,f2,1- a/2 H0 se rechaza Profesor: José Francisco Valverde C

Decisión Ing. Jorge Moya Z. Ajuste 1 I Ciclo, 2015 77 4.8. Test estadísticos 4.8.4 Test de significancia para la varianza, comparación de un grupo de varianzas empíricas Con m-grupos de mediciones siendo m>2, se calcula la varianza empírica si2 para una sola medición en cada grupo. Por medio del test se deberá probar si la exactitud en las mediciones refleja su homogeneidad. El test se desarrolla de la siguiente forma: 1. Suma de los grados de libertad y el promedio pesado de las varianzas. Profesor: José Francisco Valverde C

Decisión Escuela de Topografía, Catastro y Geodesia Ing. Jorge Moya Z. Ajuste 1 I Ciclo, 2015 78 4.8. Test estadísticos 2. Cálculo del factor de escala c para la normalización: 3. Cálculo del estadístico B, que sigue una distribución c2 siempre que fi no sea muy pequeño (fi ≥ 10): 4. Reglas del test: Hipótesis nula Ho: B ≤ c2m-1,1-a Ho no se rechaza B > c2 m-1,1-a Ho se rechaza Profesor: José Francisco Valverde C

José Francisco Valverde Calderón Sitio web: Profesor:

Presentaciones similares

Presentación del tema: "José Francisco Valverde Calderón Sitio web: Profesor:"— Transcripción de la presentación:

Presentaciones similares

Sobre el proyecto

Feedback

Iniciar la sesión

Autorizarse a través de una red social:

José Francisco Valverde Calderón Sitio web: Profesor:

Presentaciones similares

Presentación del tema: "José Francisco Valverde Calderón Sitio web: Profesor:"— Transcripción de la presentación:

Presentaciones similares

Sobre el proyecto

Feedback