La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

MARCO TEÓRICO DEL MUESTREO FORESTAL

Presentaciones similares


Presentación del tema: "MARCO TEÓRICO DEL MUESTREO FORESTAL"— Transcripción de la presentación:

1 MARCO TEÓRICO DEL MUESTREO FORESTAL
Hugo Ramírez Maldonado

2 DEFINICIONES BÁSICAS Población: Un conjunto de cosas: árboles o parcelas. Unidad Muestral o de Muestreo (UM): Cada uno de los elementos que constituyen a una población: Un árbol o una parcela. La población de árboles tiene 10 UM, N = 10 La población de parcelas tiene 16 UM, N = 16 Variable: Una característica que tienen las unidades muestrales. En árboles: altura, diámetro, volumen, estar vivo. En parcelas: altura promedio de los árboles, diámetro promedio de los árboles, proporción de árboles vivos, cantidad de biomasa (aérea y subterránea) en toda la vegetación.

3 DEFINICIONES BÁSICAS Medición: Determinación del valor de una variable en una UM (Dasometría). Dato: El registro de una medición. Típicamente hay un dato por cada UM. Censo: Medición de una variable en todas las unidades muestrales de una población. Generalmente se consideran varias, pero las estudiamos de una por una, el muestreo es Univariado, Un censo genera otra población: Población: El conjunto de datos de una variable de todas las UM.

4 Cada chango a su mecate, conjuntos: Changos y Mecates
DEFINICIONES BÁSICAS Función: Un conjunto de tres cosas, dos conjuntos y una regla de asociación que vincula a un elemento del primer conjunto con uno y sólo uno de los elementos del segundo conjunto. Cada chango a su mecate, conjuntos: Changos y Mecates Nunca falta un roto para un descosido: Descosidos y Rotos - Ya medí la altura del árbol, anótale 14.5 m Segundo conjunto Conjuntos: árboles que tienen altura y unidades de longitud. Regla de asociación: medición Regla de asociación Primer conjunto y = f (x) vol = f (dnormal, altura, coef. mórfico)

5 ESTADÍSTICA DESCRIPTIVA O ANÁLISIS DE DATOS
Resume la información de un conjunto de datos (población) Parámetro: Una función de una población Son de interés las poblaciones de valores, como la altura, el volumen, la supervivencia, la cantidad de carbono, las existencias reales. Son parámetros: Los valores que están al principio, en medio de todos o al final, una vez que se han ordenado crecientemente La suma de todos los valores El promedio de todos los valores La suma de los valores elevados al cuadrado Lo que en promedio se aleja cada dato de un valor de referencia Cualquier otra función que se proponga

6 ESTADÍSTICA DESCRIPTIVA O ANÁLISIS DE DATOS
Resume la información de un conjunto de datos (población) Algunas estadísticas descriptivas en una población (Parámetros, por estar referidas a la población) Media: Varianza: Moda: El valor que se repite más veces. Mediana: El valor que está en medio de todos después de ordenarlos de menor a mayor. Desviación media absoluta: Estas dos también son promedios

7 DEFINICIONES BÁSICAS ♠♠ ♠♠ ♠♠ ♠♠ ♠♠ ♠♠ V 43 52 54 36 35 67
Midiendo la altura de cada UM: árbol Evaluando “vivo” UM: árbol Midiendo la altura promedio de los árboles UM: parcela Evaluando “proporción de vivo” UM: parcela ♠♠ ♠♠ ♠♠ ♠♠ ♠♠ ♠♠ V M Al promediar valores promedio por parcela (sitio), como en este caso altura promedio y proporción de vivo, siempre deben ponderarse por el número de datos que generan ese promedio, de otra forma se producen resultados incorrectos 3.50 m 4.50 m 5.25 m 0.50 0.75 Población de la variable altura promedio, N = 3 Población de la variable proporción de vivo, N = 3 Población de la variable altura, N = 12 Población de la variable “vivo” (atributo) 8/12=0.67 N = 12 Población original: predio

8 Ejercicios con Excel Se dispone de datos de un inventario forestal, capturados en una hoja Excel. Con esos datos revisaremos los conceptos anteriores y además: Que forma y propiedades tiene una BASE DE DATOS Ordenar datos, dos formas Obtención de parámetros a través de funciones Inicio de Tablas Dinámicas Vamos a los datos

9 Resume la información de un conjunto de datos (ahora en una muestra)
ESTADÍSTICA DESCRIPTIVA O ANÁLISIS DE DATOS Resume la información de un conjunto de datos (ahora en una muestra) Algunas estadísticas descriptivas en una muestra (Estimadores, por estar referidas a la muestra) Una muestra es un subconjunto (pedazo) de una población, por ser a su vez un conjunto, también podemos definir funciones, que ahora llamamos estimadores (en vez de parámetros) para evitar confusiones Varianza muestral: Media muestral: Moda muestral: El valor que se repite más veces en los datos de la muestra. Mediana muestral: El valor que está en medio de todos los datos de la muestra, después de ordenarlos de menor a mayor. Desconcierta que en ésta el denominador es (n-1) cuando uno esperaría que fuera solamente (n). El motivo es que de esta manera resulta un estimador insesgado, lo que se discutirá más adelante.

10 Inferencia probabilística
ESTADÍSTICA INFERENCIAL O INFERENCIA ESTADÍSTICA Conociendo algunas estadísticas descriptivas de la muestra, se infiere, por inducción, sobre estadísticas descriptivas de la población Inferencia probabilística Media muestral: Media de la población Varianza muestral: Varianza de la población

11 NOCIONES BÁSICAS DE MUESTREO
(En el ejemplo que sigue se emplea muestreo con reemplazo porque los resultados son más claros, pero las nociones son ilustrativas de lo que pasa en muestreo sin reemplazo, que es el caso común en la práctica) Suponga que se tiene una población de cuatro números: 1, 2, 3 y 4. Para esa pequeña población la media m es 2.5 y la varianza es s2 es 1.25 La frecuencia con que se presentan los números genera esta gráfica. Vamos a hacer muestreo con reemplazo, con muestras de tamaño dos, es decir, muestras que incluyen dos unidades muestrales (n = 2)

12 Varianza de los valores de la media: 0.625
NOCIONES BÁSICAS DE MUESTREO Ahora tomemos las 16 muestras posibles con reemplazo, y de cada una calculemos la media, la varianza con “n” y la varianza con “n-1”, muestrales: Datos en la muestra Media muestral Var con "n" Var con "n-1" (1,1) 1 (1,2) 1.5 0.25 0.5 (1,3) 2 (1,4) 2.5 2.25 4.5 (2,1) (2,2) (2,3) (2,4) 3 (3,1) (3,2) (3,3) (3,4) 3.5 (4,1) (4,2) (4,3) (4,4) 4 Promedios 0.625 1.25 La frecuencia con que se presentan los valores de la media genera esta gráfica ¡La media de las medias es la media de la población! ¡El promedio de las “var con n-1” es la varianza de la población! ¡La varianza poblacional ente los valores de la media es (s2/n)=(1.25/2)=0.625! ¡Aparecieron números que antes no había, ahora con decimales! ¡Ahora las frecuencias de los valores de la media tienen una gráfica que se “parece” a la normal! Varianza de los valores de la media: 0.625

13 NOCIONES BÁSICAS DE MUESTREO
El valor esperado (esperanza matemática) de un conjunto de datos es el promedio de todos. Un estimador es INSESGADO si su esperanza matemática es igual al parámetro que pretende estimar Considerando TODAS las muestras posibles, 16 en este caso, concluimos: ¡La media de las medias es la media de la población!: la media muestral es un estimador insesgado de la media de la población (m) ¡El promedio de las “var con n-1” es la varianza de la población!: la varianza muestral, con el denominador “n-1”, es un estimador insesgado de s2, que es la varianza poblacional. ¡La varianza poblacional ente los valores de la media es (s2/n)=(1.25/2)=0.625!: la media tiene una varianza igual a s2/n ¡Aparecieron números que antes no había, ahora con decimales! Y ¡Ahora las frecuencias de los valores de la media tienen una gráfica que se “parece” a la normal!: la media tiende a distribuirse como la normal

14 Aplicación a los datos del inventario
La distribución que vimos de la frecuencia de valores del diámetro no era normal, la cola de la derecha era muy larga. Las conclusiones obtenidas son sobre la MEDIA, no sobre los valores originales. Y, lo que se observó, ¿también sucede aunque la distribución sea asimétrica como la que observamos en el diámetro? Veamos, necesitamos tomar muchas muestras con reemplazo usando la muestra que ya tenemos y calcular la media de cada una de esas muestras para ver cómo se distribuyen esas medias (bootstrap). Obtengamos 9,000 muestras así y calculemos su media, 9,000 medias y veamos su distribución:

15 Inferencias: La media se distribuye como la normal Los estadísticos
Son estimadores insesgados (“buenos”) de los parámetros m y s2 Estos parámetros definen a una distribución normal (que tiene una ecuación que no queremos ver) Por lo tanto, ya tengo “completamente” conocida (estimada) la distribución de que se trata.

16 NOCIONES BÁSICAS DE MUESTREO
Pero el caso común es que no conozcamos las estadísticas descriptivas de la población (parámetros), sino solamente las estadísticas descriptivas de la muestra (estimadores), ¡y solo de una muestra! Pero como ya conozco la distribución de la media (normal), si obtengo una muestra al azar, de su gráfica de distribución puedo leer: ¿Cuál es la probabilidad de que el promedio de los datos de esa muestra sea mayor que la media verdadera?: 6/16 ¿Menor o igual que la media verdadera?: 10/16 ¿Menor O mayor que la media verdadera ± algún número de veces la desviación estándar (la raíz cuadrada de la varianza)?: Pues quien sabe, ¡pero para eso hay TABLAS! Si conociera s2, podría tener a la normal, pero como no la tengo en un caso real, sólo puedo aproximarme a una distribución que se llama “t” de Student.

17 La gráfica de la distribución de “t” tiene esta forma:
¿Menor O mayor que la media verdadera ± algún número de veces la desviación estándar (la raíz cuadrada de la varianza)?: Todavía no lo se, ¡pero para esta gráfica existen TABLAS! Pero NÓTESE que la forma de la curva depende de los grados de libertad (df), que son “n-1”, o sea que depende del tamaño de la muestra. Se designa con alfa (a) a algún área referida dentro de esa curva, por ejemplo el 0.5 (50%), el 0.05 (5%) y puede estar ubicada en un extremo o repartida en ambos.

18 Ahora sí, de la gráfica de la distribución de “t” puedo leer:
df 0.1 0.05 0.025 0.01 2 2.92 4.3027 6.2054 9.925 3 2.3534 3.1824 4.1765 5.8408 4 2.1318 2.7765 3.4954 4.6041 5 2.015 2.5706 3.1634 4.0321 6 1.9432 2.4469 2.9687 3.7074 7 1.8946 2.3646 2.8412 3.4995 8 1.8595 2.306 2.7515 3.3554 9 1.8331 2.2622 2.685 3.2498 10 1.8125 2.2281 2.6338 3.1693 Esta tabla es de dos colas, así que si quiero el alfa en ambos extremos, se debe leer el alfa directamente en la primera fila. Por ejemplo, para alfa=5%=0.05, el valor de t que deja en las dos colas el 5% (2.5% en cada una), con 10 grados de libertad, es Pero Excel lo hace también

19 NOCIONES BÁSICAS: MUESTREO SIMPLE ALEATORIO
Conviene recapitular las fórmulas que hemos visto, ahora en la forma en que las vamos a usar en una aplicación práctica de Muestreo Simple Aleatorio: Estimador de la media Varianza de la variable Intervalo de estimación, se debe interpretar que con un (1-a) de probabilidad la media verdadera estará incluida en ese intervalo. Varianza de la media. Se ha introducido el llamado Factor de Corrección por Población Finita Estimador del error de muestreo En ocasiones se usa un “2” en lugar de “t”, porque para un alfa de 0.05 (que es usual) y para muestras (n) no muy pequeñas, el valor de t es cercano a 2.

20 Una presentación reiterativa
NOCIONES BÁSICAS: MUESTREO SIMPLE ALEATORIO Una presentación reiterativa Estimador de la media que se calcula de los datos obtenidos por el muestreo Varianza de la variable, también obtenida de los datos de la muestra Varianza de la media. La media también tiene varianza, porque puede haber muchas medias, tantas como muestras se puedan obtener de la población. Estimador del error de muestreo, ya incluye la confiabilidad de la inferencia, en el valor t Intervalo de estimación, se debe interpretar que con un (1-a) de probabilidad la media verdadera estará incluida en ese intervalo.

21 NOCIONES BÁSICAS: MUESTREO SIMPLE ALEATORIO
Al requerir una precisión determinada, se requiere que el error de estimación sea de cierto tamaño (B): El único valor que se puede manipular para satisfacer esta igualdad es n Con un poco de álgebra se puede llegar a: Pero si N es muy grande se simplifica a:

22 Para estimar una proporción nos sirven la mismas ecuaciones:
NOCIONES BÁSICAS: MUESTREO SIMPLE ALEATORIO Para estimar una proporción nos sirven la mismas ecuaciones: Hagamos que yi=1 si la UM tiene el atributo, yi=0 si no lo tiene Estimador de la media, ahora de la proporción p Varianza de la variable

23 El muestreo simple aleatorio es conveniente si:
NOCIONES BÁSICAS: MUESTREO SIMPLE ALEATORIO El muestreo simple aleatorio es conveniente si: La población no es muy grande, de manera que no sea muy costoso llegar a una unidad muestral, de otro modo al llegar a una habría que medir otras de una vez (conglomerados o etapas) No existen diferencias muy claras entre las unidades muestrales, que sugieran formar grupos (estratos) Situaciones que no son muy comunes en inventario forestal, pero es básico para desarrollar métodos más elaborados. Ahora formularemos una hoja Excel para procesar datos de un muestro simple aleatorio.


Descargar ppt "MARCO TEÓRICO DEL MUESTREO FORESTAL"

Presentaciones similares


Anuncios Google