INDUCCIÓN PARAMÉTRICA APLICADA A MUESTRAS PEQUEÑAS -MÉTODO Y MODELO CON FUNCIÓN INVERSA- Autor: Emilio José Chaves Pasto, Colombia Title: Parametric induction applied to small samples –Method and model with inverse function- Author: Emilio Chaves Country: Colombia, South America Resumen Elabora modelo del título usando solo la media y dos datos extremos: máximo y mínimo. Responde a cómo interpretar muestras pequeñas al inicio de una investigación. Ventajas: 1) separa dimensión de estructura distributiva; posee función inversa; 2) es manejable con hojas de cálculo. Sugiere ayuda de matemáticos para: 1) evaluar su uso en docencia; 2) retirar del currículo modelos paramétricos sin función inversa; 3) aclarar si métodos que usan curvas Normales son útiles en investigación y ciencia. Este artículo afirma que no lo son. Palabras clave: Modelo con valores extremos, Educación estadística - Métodos cuantitativos - Función inversa Abstract: It works model of title, using media plus two data extreme values: maximum and minimum ones. It answers common question: How can we interpret small samples at research beginning? Advantages are: 1) it separates dimension from structural distribution; 2) it has inverse function. It recommends the help of high level mathematitians to: 1) Evaluating its use in education; 2) Not using any parametric model without inverse function; 3) Declaring if methods that apply Normal distributions are useful or not. This article sustains they are not. Key words: Extreme values model, Statistical education – Quantitative methods – Inverse function
El problema de los 2 valores extremos positivos: del método a un modelo que los ajuste La pregunta que motiva la investigación es esta: Si los analistas suelen aceptar que la CDNormal es una distribución compleja que no tiene función inversa para K(P), se sigue que no pueden definir P(K≥Ki) o FDA necesaria para hallar la función de densidad de probabilidad, fdp, entonces: ¿por qué no usar la imaginación para diseñar otra función estadística paramétrica que sí posea función inversa y resulte manejable y plausible, para luego comparar los resultados con los producidos por el método “fdp de la distribución normal” y sacar conclusiones nuevas? Se decidió trabajar de manera intuitiva con un solo parámetro U y con los dos valores extremos como datos K(p) que el modelo debe ajustar perfecto a la muestra, dejando que el modelo rellene con una curva suave el intervalo entre esos valores extremos. La muestra puede contener cualquier número de datos N>=3, y todos ellos deben usarse para estimar la media U. No hace falta varianza σ (dispersión o desviación) porque U@=1 media, Kmax@>1 y 0<=Kmín@<1 lo reemplazan de forma implícita. La idea es llegar a una FDA (acumulativa) de la forma K# = U# * K@(P) donde U#=media en unidades reales; … K@(P) es la distribución acumulativa adimensional (en medias) de modo que la derivada de K# = constante*K’@ y la constante es tan solo U#, la misma media real. También se buscó que la función K@(P) tuviera función inversa P(K@) porque la derivada de la inversa produce la fdp, si es que se necesita. El método parte de la curva de Lorenz (¿?) hecha con 3 o más datos asumidos como representativos. También se hace el ordenamiento mayor a menor, para facilitar el manejo matemático. El método ortodoxo parte al revés: de la fdp, pero no posee ni integrales exactas, ni función inversa, ni ajusta bien a los dos valores extremos usando la curva Gaussiana, o distribución normal. Existe la Teoría de los Valores Extremos (EVT en inglés) que lleva casi 100 años buscando solución a este elemental ajuste. Artículos recientes admiten malos ajustes con la CDNormal y curvas asintóticas. (Serra, Isabel;2013)
CITAS SOBRE TEORIA VALORES EXTREMOS Desde un punto de vista matemático, o probabilista, la teoría de los valores extremos es satisfactoria, pero necesita de herramientas más pragmáticas como, por ejemplo, nuevos modelos para colas y resultados para muestras de tamaño pequeño. p 131 "Modelos estadísticos para valores extremos y aplicaciones". Isabel Serra Mochales, Dir. Joan del Castillo Franquet Noviembre, 2013 U. Autónoma de Barcelona Tesis de Doctorado en Matemáticas
Ejemplo 1: U@=1 Kx@=2.2 Kn@=0.4
Ejemplo 2: U@=1 Kx@=1.4 Kn@=0.4
Ejemplo 3: U@=1 Kx@=1.6 Kn@=0.4
Conclusiones y sugerencias para modelo propuesto y para CDNormal 1) La CDNormal no puede explicar este problema, y no acierta los 2 valores extremos. La relación“varianza”-fdp no es clara. No considera el efecto de las unidades físicas de medición en la inferencia. Su método parte de asumir una fdp imaginaria y arbitraria, sin integral precisa. Confunde aún más, al insertar otra unidad extra en el eje horizontal de las gráficas: las desviaciones estándar o desviaciones típicas. Para cursos iniciales de inducción univariable no hace falta hacer más difícil su enseñanza con textos grandes, ni teoremas del límite central, ni teorías combinatorias, ni usar mucho tiempo de clase en juegos de azar. 2) Ante estas críticas y resultados, sugiere que un comité académico de alto nivel matemático defina si la distribución normal debe salir del currículo de estadística univariable. Hay alternativas más claras y mejores. La meta educativa es llevar a los jóvenes a manejar, graficar e interpretar muestras univariables pequeñas, combinando computador personal, conjuntos, cálculo y análisis estadístico; en un ambiente de coherencia y autoconfianza; sin usar paquetes estadísticos, ni tablas de fin de texto. Se espera que así desarrollen conceptos y capacidades claves en corto tiempo, en contextos prácticos de investigación, inferencia y toma de decisiones, aceptando los límites e incertezas del modelo. Supuesto didáctico: Empezar con un modelo inductivo simple y coherente estimularía la capacidad del estudiante de actuar y pensar por sí mismo, con rigor, sentido crítico y autocrítico, sin emplear matemáticas sofisticadas. El modelo suele acercarse al fenómeno real si la muestra es grande (si N aumenta). Solo las réplicas experimentales permiten detectar cambios en la dimensión de la media U, y/o cambios en la estructura distributiva adimensional (en medias). En inducción cuantitativa es crucial: 1) Separar media real de estructura adimensional. 2) Ser conscientes del ordenamiento de los datos y su efecto en los gráficos usados. 3) Declarar temprano las unidades físicas de medición y su contexto de origen. Gracias por su interés, comentarios y preguntas. Emilio Chaves Los modelos básicos obtenidos son: L(P) = Kx * P – (kx-1) * P ^ [(Kx-Kn)/(Kx-1)] Curva de Lorenz de modelo propuesto K@(P) = Kx - (Kx-Kn)* P ^ [(1-Kn)/(Kx-1)] FDA adimensional para orden mayor a menor P(K) = [(Kx – K )/(Kx-Kn)] ^ [(Kx-1)/(1-Kn)] Función inversa de la FDA@ para orden mayor a menor