XLSTAT
XLSTAT
XLStatistics
ANÁLISIS ESTADÍSTICO CON EXCEL
La información independientemente de lo costosa que haya sido crearla, puede ser replicada y
compartida a un costo mínimo o nulo. -- Thomas Jefferson
Jorge Fallas
2010
i
Contenido
¿Qué es estadística? ...................................................................................................................... 1
Exactitud y precisión ....................................................................................................................... 1
Variables: medición y clasificación .................................................................................................. 2
Variables cualitativas ................................................................................................................ 2
Variables cuantitativas ............................................................................................................. 3
El proceso de investigación ............................................................................................................. 4
Terminología ................................................................................................................................... 5
Prueba de hipótesis: Error tipo I y II............................................................................................... 12
Sugerencias para el análisis de datos ........................................................................................... 13
Estadística: Software gratuito ........................................................................................................ 13
¿Qué es XLSTatistics? .................................................................................................................. 16
Instalación ..................................................................................................................................... 17
Desinstalación ............................................................................................................................... 17
XLStatistics: interfaz grafica y funciones ....................................................................................... 17
Otros complementos gratuitos para análisis estadístico en Excel .................................................. 23
Complementos comerciales para Excel ......................................................................................... 23
Programas gratuitos y en línea para análisis estadístico ............................................................... 24
Sitios de interés ............................................................................................................................. 25
Análisis de una variable numérica (variable cuantitativa discreta ó continua) ................................ 28
Data and Description: Datos y su descripción ........................................................................ 29
Summaries: Síntesis de datos (Tabla de frecuencia y gráficos).............................................. 30
Tests: Pruebas estadísticas ................................................................................................... 31
Prueba “t” para una muestra (requisitos muestra independiente y normalidad) ...................... 31
Análisis de Residuos .............................................................................................................. 31
Prueba de Normalidad ........................................................................................................... 33
Análisis de poder y determinación de tamaño de muestra...................................................... 33
Análisis de error marginal para IC de la media ....................................................................... 34
Pruebas no paramétricas ....................................................................................................... 35
Prueba de signos (prueba de mediana).................................................................................. 35
Prueba de Chi-2 para la varianza ........................................................................................... 35
Intervalos de tolerancia y de predicción.................................................................................. 36
Herramientas adicionales ....................................................................................................... 36
Datos agrupados 1NumGD.xls ............................................................................................... 36
Gráfico de probabilidad normal............................................................................................... 37
Análisis de una variable cualitativa (nominal-ordinal) .................................................................... 38
Data and Description: Datos y su descripción ........................................................................ 38
ii
Anexo 3: Prueba de hipótesis: una muestra, dos muestras, tres o más muestras ....................... 129
Anexo 4: Elección de una prueba estadística .............................................................................. 138
Anexo 5: Comparación de paquetes estadísticos ........................................................................ 144
Anexo 6: Software gratuito .......................................................................................................... 156
¿Qué es estadística?
La estadística es el arte-ciencia de tomar decisiones ante situaciones concretas y a la luz de
información o datos parciales. En otras palabras, es tomar decisiones bajo condiciones de
incertidumbre. La estadística nació en las sociedades antiguas para resolver un problema muy
concreto: colectar datos y crear información sobre aspectos tales como producción, población, e
impuestos; elementos esenciales para gobernar una nación o un imperio. Este primer aspecto de la
estadística todavía persiste y es lo que se conoce como estadística descriptiva.
Formalmente, la estadística puede definirse como una ciencia con un componente teórico y otro
aplicado que consiste en crear, desarrollar, y aplicar técnicas o instrumentos que nos permitan evaluar
el grado de incertidumbre o error de nuestras generalizaciones. Por ejemplo, si deseamos conocer el
diámetro medio a la altura del pecho (dap) de una plantación de roble de 10 hectáreas, ubicada en San
José de la Montaña, debemos decidir acerca del tamaño de la muestra y el método de selección; y una
vez colectados los datos hay que seleccionar los estadísticos y tablas a utilizar para generalizar los
resultados a la plantación (inferencia). Finalmente, debemos indicar el grado de confiabilidad de
nuestros resultados o en otras palabras que tan seguros estamos de nuestra estimación.
No existe ninguna medida perfecta y por tanto, todas las mediciones contienen algún grado de
error; de donde se desprende que para extraer la información de las mediciones es necesario analizar
los errores. Los errores se agrupan en dos grandes categorías: el sesgo o error sistemático que puede
modelarse utilizando una ecuación que describe las mediciones, lo que permite eliminar o reducir
significativamente su efecto; y el ruido o error aleatorio, el cual no se puede modelar, pero cuyas
propiedades estadísticas se pueden utilizar para optimizar los resultados del análisis.
Exactitud y precisión
Como se mencionó previamente, toda medición tiene un error; sin embargo con frecuencia se
confunden los términos error o sesgo y precisión (ver figura 1).
Exactitud: mide el grado de fidelidad o proximidad de la medición con respecto al valor real de la
variable. El error o sesgo es igual a valor real-valor medido. Para determinar el error en una medición
es necesario conocer el valor real de la variable medida.
Precisión: La precisión es una medición de la similitud entre mediciones repetidas de una variable.
Para variables con una distribución normal, la varianza se utiliza para cuantificar la variación del set de
datos con respecto a la media.
2
Figura 1: Conceptos de exactitud y precisión. Observe que una medición puede tener una alta
precisión y un bajo sesgo o error; sin embargo también puede tener una alta precisión y un alto sesgo
o error. Lo deseable es una alta precisión y un error mínimo.
Variables cualitativas
Estas variables se caracterizan por no expresar una cantidad o magnitud absoluta de lo que se
mide y comprenden dos niveles de medición: nominal y ordinal.
Escala nominal
El nivel de medición nominal es el más simple; ya que las variables se “miden” utilizando el
concepto de igualdad. La especie, el tipo de vegetación y el color de las hojas son ejemplos de
mediciones a nivel nominal. Los objetos o eventos se asignan a una u otra clase basados en el
concepto de igualdad. Los números o letras asignados a cada categoría son solo códigos y no tienen
un orden natural. Por ejemplo, podemos clasificar cinco tipos de uso-cobertura de la tierra de la
siguiente manera:
1) bosque seco
2) bosque húmedo
3) mangle
4) pastos y
5) cultivos permanentes
3
Sin embargo, el valor numérico no indica la precedencia de un tipo de vegetación sobre el siguiente;
por ejemplo, el bosque húmedo no es mayor que el bosque seco.
Escala ordinal
En el nivel de medición ordinal las variables se miden de acuerdo a su tamaño, valor relativo u
orden natural. Esta escala de medición no permite determinar la magnitud de la desigualdad entre
categorías contiguas. Por ejemplo, las especies forestales de Costa Rica pueden clasificarse de
acuerdo a la densidad de su madera en muy pesadas, pesadas, livianas y muy livianas; sin embargo
esta clasificación no indica cuánto más densa es la madera de la primera clase comparada con la
segunda o la última. Las variables numéricas o cuantitativas puedes expresarse como variable
ordinales utilizando cuantiles, percentiles u otro criterio definido por el usuario(a). Por ejemplo, los
datos de la variable “densidad de la madera” pueden dividirse en 5 categorías utilizando quintiles y de
esta manera saber cuánto más densa o menos densa es una madera de una categoría con respecto a
cualquier otra.
La escala de actitud de Likert es un caso especial de una escala de medición ordinal que con
frecuencia es analizada como una variable cuantitativa. La escala, formada por cinco clases o
categorías, fue diseñada con el fin de que las valoraciones sigan una progresión aritmética como se
muestra a continuación:
Observe que a diferencia de las variables numéricas o cuantitativas, en la cual los números tienen
un orden natural, en la escala de Likert los números o letras asignados a cada categoría son solo
códigos y no tienen un orden natural; aunque sí expresan una progresión aritmética; donde se podría
considerar la respuesta “Indiferente, indeciso o neutro” como el “cero” de la escala.
Variables cuantitativas
Estas variables se caracterizan por expresar una cantidad o magnitud de lo que se mide y
comprenden dos niveles de medición: intervalo y razón.
El cociente de una razón para observaciones a un nivel de medición de intervalo no tienen sentido o
explicación lógica. Por ejemplo, una temperatura de 30oC no es dos veces más caliente que una de
15oC, en tanto que un árbol de 30 metros sí es dos veces más alto que uno de 15 metros. En ambos
casos, el cociente es 2 (30/15=2); sin embargo el cero (0) en la escala de grados centígrados es ficticio
o sea un punto arbitrario en tanto que en la escala lineal es verdadero. Cualquier operación
matemática puede utilizarse e interpretarse en observaciones a un nivel de medición de razón. Para
observaciones a un nivel de intervalo sólo tienen sentido la suma, la resta y la multiplicación (cuadro
2).
Variables circulares
Las variables circulares son un tipo especial de variables cuantitativas que representan ciclos. En
estas variables, el valor más grande y el más pequeño se encuentra uno al lado del otro y el punto
cero es arbitrario. Algunos ejemplos de variables circulares son: hora del día (0-24), meses del año
(enero a diciembre) y la dirección de la brújula (0o-360o). Si se utiliza solo parte del ciclo, una variable
circular se convierte en una variable lineal. Por ejemplo, cuando usted utiliza la variable tiempo y la
mide como el número días entre dos eventos.
Si su variable es realmente circular (e.g. distancia y dirección de vuelo de las aves), existen pruebas
estadísticas diseñadas especialmente para este tipo de variable tales las herramientas de Matlab para
estadística circular http://www.kyb.tuebingen.mpg.de/bs/people/berens/circStat.html y el programa
comercial Oriana http://www.kovcomp.com/oriana/.
Los métodos estadísticos aplicados a un nivel de medición nominal y ordinal se denominan "no
paramétricos", en tanto que los aplicados a datos a un nivel de medición de intervalo y razón se
denominan "paramétricos". Observaciones a un nivel de medición de intervalo y razón pueden
transformarse a una escala ordinal o aun nominal. Por ejemplo, si tenemos 10 observaciones de
densidad de roble, podemos ordenarlas en forma ascendente, de tal forma que el primer valor es
mayor que el segundo, el segundo mayor que el tercero, y así sucesivamente. Luego se asigna un
valor de 1 a 10 a cada observación, estos nuevos “valores” se conocen con el nombre de órdenes.
Esto permite aplicar técnicas no paramétricas a datos medidos originalmente a un nivel apropiado para
aplicar técnicas paramétricas.
El proceso de investigación
Existen muchas definiciones del término investigación; sin embargo en el contexto del presente
documento la definiremos como el camino o ruta que usted sigue para responder a sus preguntas o
5
someter a prueba sus hipótesis. En el proceso de investigación se pueden reconocer los siguientes
elementos (ver figura 2):
Terminología
En el análisis de datos estadísticos con frecuencia se utilizan las palabras “variable independiente“
y “variable dependiente”; sin embargo en diferentes disciplinas dichos términos pueden tener
diferentes acepciones como se muestra a continuación:
Variable independiente, variable explicativa, variable control, variable manipulada, variable predictiva,
regresor, variable de exposición, insumo
Variable dependiente, variable respuesta, variable medida, variable observada, variable explicada,
variable resultado, variable experimental, producto.
Dado que la mayoría de las variables presentan algún grado de correlación es preferible utilizar los
términos variable respuesta y variable explicativa.
Mediciones repetidas: Las mediciones repetidas se obtienen en un grupo de sujetos o muestras que se
miden antes y después de aplicar un tratamiento (e.g. se mide variable respuesta en el sujeto antes
de un tratamiento y luego después de aplicar el tratamiento). Por lo tanto, cada sujeto o muestra actúa
como su propio control y por esta razón las dos mediciones no son independientes.
Los grupos son establecidos por el emparejamiento de sujetos o muestras utilizando como
referencia algún tipo de relación natural entre los sujetos o muestras de cada par. Por ejemplo, las
competencias de cada trabajador en el área social podrían compararse con las de su padre/madre.
Cada persona podría ser emparejada con su padre/madre en este diseño y debido a esta relación
natural, las mediciones no son independientes.
Población: Es el total o universo al cual se desea aplicar la inferencia o conclusión del estudio.
Deducción: A partir del todo (población) se deriva una afirmación que aplica a una condición particular
(muestra).
Inducción: A partir de una porción de la realidad (muestra) se hace una afirmación sobre el todo
(población).
Unidad experimental: Individuo, objeto, grupo o conjunto de sujetos experimentales a los cuales se les
aplica un determinado tratamiento. Por ejemplo, la unidad experimental puede ser una parcela en una
plantación, un grupo de semillas, un persona a la cual se entrevista, un árbol que se mide, etc. En
algunos textos se le denomina a la unidad experimental “caso”.
Testigo: Tratamiento de referencia utilizado para determinar si los tratamientos tienen un efecto
estadísticamente discernible sobre el material experimental.
7
Variable respuesta: Es aquella propiedad o cualidad de la unidad experimental que se mide. Para
mayor detalle sobre el tema ver pág.6.
Cuasi o seudo experimento: Estudio en el cual se utilizan los principios propuestos por Fisher para el
diseño de experimentos; sin embargo, por diversas razones prácticas, no es posible asignar los
tratamientos en forma aleatoria. Este tipo de estudios es común en el área de ecología y en general en
estudios de tipo observacional.
Significancia estadística: Esta es una regla que permite afirmar que la diferencia observada entre dos
o más tratamientos es el resultado del efecto del tratamiento y no del azar. Con frecuencia se declaran
como significativas aquellas diferencias que tienen una probabilidad inferior a 0.05 (o sea 5%) de
ocurrir en forma aleatoria. En algunos textos de estadística se recomienda utilizar un asterisco (*) para
designar las diferencias significativas a un 5% (P<0.05), dos asteriscos (**) para designar diferencias
significativas al 1% (P<0.01) y tres asteriscos (***) para designar diferencias significativas al 0.1%
(P<0.001). Sin embargo, dado que los paquetes estadísticos le brindan el valor de “p” se recomienda
reportar dicho valor y dejar que el lector juzgue por sí mismo(a) la intensidad de la significancia de la
prueba.
Aleatorización: Asignación aleatoria de los tratamientos a los sujetos o unidades experimentales. Esto
elimina cualquier sesgo conocido o desconocido en la asignación de los tratamientos.
Error experimental: Variación natural o innata del material experimental no controlado por el
investigador(a). Este no es un error adrede o derivado de la aplicación errónea de técnicas de
medición sino simplemente un componente propio del material experimental.
Análisis
Un Análisis en sentido amplio es la descomposición de un todo en partes para poder estudiar su
estructura y/o sistemas operativos y/o funciones (http://es.wiktionary.org/wiki/).
8
La acción y el efecto de separar un todo en los elementos que lo componen con el objeto de estudiar
su naturaleza, función o significado (http://es.wiktionary.org/wiki/).
Documento que revisa, separa o hace un resumen de los elementos o principios de un tema o de una
obra (http://es.wiktionary.org/wiki/).
Distinción y separación de las partes de un todo hasta llegar a conocer sus principios o elementos
(http://www.rae.es/rae.html).
Ciencia
Conocimiento estructurado y sistemático de las cosas por sus principios y causas; Conjunto de
conocimientos que constituyen una rama del saber humano (http://es.wiktionary.org/wiki/).
Conocer
Saber de la existencia de una cosa (http://es.wiktionary.org/wiki/).
Averiguar por el ejercicio de las facultades intelectuales la naturaleza, cualidades y relaciones de las
cosas (http://www.rae.es/rae.html).
Conocimiento
Resultado de la acción de conocer. Comprensión, entendimiento, inteligencia, razón
(http://es.wiktionary.org/wiki/)
Esquema sobre el conocimiento desde el punto de vista de las ciencias de la información, como se
genera y como se aplica. Fuente: http://es.wikipedia.org/wiki/Saber
Convicción
Acto o efecto de estar seguro sobre algo (http://es.wiktionary.org/wiki/).
9
Una convicción es una creencia de la que un cierto individuo opina que dispone de suficiente evidencia
para considerarla cierta. La diferencia entre una simple creencia y una convicción, es que en el primer
caso el individuo puede no tener evidencia suficiente para justificar su veracidad, mientras que en el
segundo el individuo si la considera probada, con independencia de que exista evidencia científica o
intersubjetiva incontrovertible de que dicha convicción es verdadera (http://es.wikipedia.org/wiki/Saber).
Creencia
Algo en lo que se cree, confianza en que algo existe o que es cierto.
(http://es.wiktionary.org/wiki/).
Una creencia es una proposición o conjunto de ellas, que un cierto individuo considera ciertas, pero
para la que en general no existe evidencia intersubjetiva suficiente para considerarla conocimiento
propiamente dicho. Una creencia puede ser acertada o equivocada. Sin embargo, aunque en el uso
contidiano al oponer "creencia" y "conocimiento", el primero se usa frecuentemente con el sentido de
proposiciones que alguien considera ciertas, pero de la que existe evidencia de estar equivocadas o
ser indemostrables(http://es.wikipedia.org/wiki/Saber).
Firme asentimiento y conformidad con algo; completo crédito que se presta a un hecho o noticia como
seguros o ciertos; religión, doctrina (http://www.rae.es/rae.html).
Criterio
Norma para conocer la verdad (http://www.rae.es/rae.html).
Juicio o discernimiento (http://www.rae.es/rae.html).
Evaluar
Señalar el valor de algo (http://www.rae.es/rae.html).
Estimar, apreciar, calcular el valor de algo (http://www.rae.es/rae.html).
Estimar los conocimientos, aptitudes y rendimiento de los alumno (http://www.rae.es/rae.html).
Evaluación
Valoración de los conocimientos que se da sobre una persona o situación basándose en una evidencia
constatable (http://es.wiktionary.org/wiki/).
Evidencia
Certeza clara y manifiesta de la que no se puede dudar (http://www.rae.es/rae.html).
Prueba determinante en un proceso (http://www.rae.es/rae.html).
Instrumento
Objeto o aparato, normalmente artificial, que se emplea para facilitar o posibilitar un trabajo, ampliando
las capacidades naturales del cuerpo humano. Sinónimos: herramienta, utensilio, útil
(http://es.wiktionary.org/wiki/).
Aquello que sirve de medio para hacer algo o conseguir un fin; Conjunto de diversas piezas
combinadas adecuadamente para que sirva con determinado objeto en el ejercicio de las artes y
oficios (http://www.rae.es/rae.html).
10
Información
Comunicación o adquisición de conocimientos que permiten ampliar o precisar los que se poseen
sobre una materia determinada (http://www.rae.es/rae.html).
La información es un fenómeno que proporciona significado o sentido a las cosas. En sentido general,
la información es un conjunto organizado de datos procesados, que constituyen un mensaje sobre un
determinado ente o fenómeno. Los datos se perciben, se integran y generan la información necesaria
para producir el conocimiento que es el que finalmente permite tomar decisiones para realizar las
acciones cotidianas que aseguran la existencia. La sabiduría consiste en determinar correctamente
cuándo, cómo, dónde y con qué objetivo emplear el conocimiento adquirido
(http://es.wikipedia.org/wiki/Informaci%C3%B3n).
Herramienta
Objeto o aparato, normalmente artificial, que se emplea para facilitar o posibilitar un trabajo, ampliando
las capacidades naturales del cuerpo humano. Sinónimos: instrumento, utensilio
(http://es.wiktionary.org/wiki/).
Instrumento, por lo común de hierro o acero, con que trabajan los artesanos
(http://www.rae.es/rae.html).
Método
Procedimiento, técnica o manera de hacer algo, en especial si se hace siguiendo un plan, o de forma
sistemática, ordenada y lógica. (http://es.wiktionary.org/wiki/).
Lista ordenada de partes o pasos (avance logrado para la consecución de una tarea.) para lograr un fin
(http://es.wiktionary.org/wiki/).
Percepción
La percepción es la función psíquica que permite al organismo, a través de los sentidos, recibir,
elaborar e interpretar la información proveniente de su entorno
(http://es.wikipedia.org/wiki/Percepci%C3%B3n).
Procedimiento
El o un procedimiento es el modo de ejecutar determinadas acciones que suelen realizarse de la
misma forma, con una serie común de pasos claramente definidos, que permiten realizar una
ocupación o trabajo correctamente. (http://es.wiktionary.org/wiki/)
Saber
Conjunto de conocimientos, adquiridos mediante el estudio o la experiencia, sobre alguna materia,
ciencia o arte. Sinónimo: sabiduría, erudición (http://es.wiktionary.org/wiki/).
Sabiduría
Conocimiento de las ciencias y artes (http://es.wiktionary.org/wiki/).
Grado más alto del conocimiento; conducta prudente en la vida o en los negocios; conocimiento
profundo en ciencias, letras o artes (http://www.rae.es/rae.html).
Técnica
Conjunto de habilidades para aplicar determinados conocimientos (http://es.wiktionary.org/wiki/).
Teoría
Conocimiento especulativo considerado con independencia de toda aplicación.
(http://www.rae.es/rae.html).
Serie de las leyes que sirven para relacionar determinado orden de fenómenos.
(http://www.rae.es/rae.html).
Hipótesis cuyas consecuencias se aplican a toda una ciencia o a parte muy importante de ella
(http://www.rae.es/rae.html).
Una teoría es un sistema lógico compuesto de observaciones, axiomas y postulados, así como
predicciones y reglas de inferencia que tienen sirven para explicar de manera económica cierto
conjunto de datos e incluso hacer predicciones, sobre que hechos serán observables bajo ciertas
12
condiciones. Las teorías además permiten ser ampliadas a partir de sus propias predicciones, e
incluso ser corregidas, mediante ciertas reglas o razonamientos, siendo capaces de explicar otros
posibles hechos diferentes de los hechos de partida de la teoría.
(http://es.wikipedia.org/wiki/Teor%C3%ADa)
Steiger, J.H., & Fouladi, R.T. 1997. Noncentrality interval estimation and the evaluation of statistical
models. Pp. 221-257. In Harlow, L. L., Mulaik, S. A., & Steiger, J. H. (Eds.) What if there were no
significance tests? Mahwah, NJ: Lawrence Erlbaum Associates. Disponible en:
http://www.statpower.net/Steiger%20Biblio/Steiger&Fouladi97.PDF
BioEstat. Análisis estadístico para Windows y Mac. Estadística descriptiva e inferencial paramétrica y
no paramétrica, análisis de poder. Interfaz en español. Manual en Portugués.
http://www.mamiraua.org.br/download/index.php?dirpath=./BioEstat%205%20Portugues&order=0
MacAnova Análisis estadístico para Macs y Windows. Estadística descriptiva e inferencial paramétrica
y no paramétrica, análisis de poder.
Mstat Windows Mac OSX Linux Análisis estadístico para Windows, Mac y Linux. Estadística
descriptiva e inferencial paramétrica y no paramétrica.
OpenEpi produce estadísticas para casos y medidas en estudios descriptivos y analíticos, análisis
estratificado con límites de confianza exactos, análisis de datos apareados y de personas-tiempo,
14
The R Project for Statistical Computing. Gran variedad de análisis, muy poderoso pero requiere de
usuarios experimentados. Opera en base a comandos.
WinIDAMS. Este es paquete de software para la validación, tratamiento y análisis estadístico de datos
desarrollado por la Secretaría de la UNESCO en cooperación con expertos de varios países.
http://portal.unesco.org/ci/en/ev.php-URL_ID=2070&URL_DO=DO_TOPIC&URL_SECTION=201.html
Referencias
Bryan F.J. Manly. Randomization, Bootstrap and Monte Carlo Methods in Biology, Third Edition.
Chapman and Hall/CRC. 388p. 2006.
Bryan F.J. Manly. Statistics for Environmental Science and Management, Second Edition.Chapman &
Hall/CRC. 292p. 2008.
Cox Nicholas J. Stata Users‟ Meeting London June 2004. Circular statistics in Stata, revisited.
Department of Geography, University of Durham, Durham City, DH1 3LE, UK
http://fmwww.bc.edu/repec/usug2004/dir2004_london.pdf
Dinov, Ivo D. (2006). "Statistics Online Computational Resource". Journal of Statistical Software 16 (1):
1–16. http://www.jstatsoft.org/v16/i11.
Dinov, Ivo D.; Sanchez, Juana; Christou, Nicolas (2008). "Pedagogical Utilization and Assessment of
the Statistic Online Computational Resource in Introductory Probability and Statistics Courses". Journal
of Computers & Education 50 (1 pages=284–300): 284. doi:10.1016/j.compedu.2006.06.003.
Good, Phillip I. Introduction to statistics through resampling methods and Microsoft Office Excel.West
Sussex, Reino Unido (INGLATERRA). John Wiley & Sons. 231p. 2005.
McDonald, J.H. 2009. Handbook of Biological Statistics (2nd ed.). Sparky House Publishing, Baltimore,
Maryland. Last revised August 18, 2009. http://udel.edu/~mcdonald/statintro.html.
Steel, R.G.D. y Torrie, J.H. Principles and procedures of Statistics: A Biometrical Approach (2 nd Ed.).
McGrawHill, New York. 629p. 1980.
Sokal,R. R.; Rohlf, F.J.. Biometry. 3 Ed. New York, WH Freeman. 887p. 1995
15
Stata Users‟ Meeting London June 2004. Circular statistics in Stata, revisited. Nicholas J. Cox
Department of Geography, University of Durham, Durham City, DH1 3LE, UK. 4p.
Wonnacott, Thomas H. y Ronald J. Wonnacott.. Introductory statistics. Third Edition. New York, John
Willey & Sons. 650p. 1977.
16
¿Qué es XLSTatistics?
XLSTatistics es un conjunto de 82 libros de Excel creados por el profesor Rodney Carr de la
Universidad Deakin, Australia (http://www.deakin.edu.au/~rodneyc/XLStatistics). XLSTatistics opera en
Microsoft Excel 97, 2000, 2002, 2003(XP) y 2007.
Carr, R., 2009, XLStatistics 09.09.24, XLent Works, Australia. Disponible en:
http://www.deakin.edu.au/~rodneyc/XLStatistics. [email protected]
Automatically enter data: Vincula datos seleccionados en otro archivo de Excel a “datos” del Libro de
Análisis de XLStatistics.
“Open XLStatistics workbooks in Read only mode”: Abrir archivos en modo sólo lectura para evitar que
los mismos sean sobrescritos accidentalmente.
“Display ‘Paste Special’ message when copying charts” Active esta opción para evitar que los gráficos
de Excel sean copiados y pegados en Word como Objetos de Excel.
17
Instalación
Descargue el archivo XLS5.zip (5 Megas). http://www.deakin.edu.au/~rodneyc/XLStatistics/XLS5.zip
Cree un directorio denominado Xlstats y descomprima el contenido del archivo XLS5.zip.
Para cargar XLStatistics abra el fichero XLStatistics.xlam (Excel 2007) o XLStats.xls
(Excel 5-2003). Le sugiero crear un acceso directo en su escritorio para dicho archivo.
Guardar sus resultados. ¡No guardar directamente el libro de trabajo de XLStatistics! Si desea copiar
los resultados de su análisis a otra hoja de Excel, Word, o Powerpoint simplemente seleccione el área
o grafico deseado cópielo y péguelo en el archivo receptor. Si lo desea también puede guardar el libro
de trabajo con otro nombre y con la opción de macros habilitada.
Desinstalación
XLStatistics no modifica la configuración del sistema ni la de Excel y por tanto no requiere de
desinstalación. Para desactivar XLStatistics haga un clic sobre .
2Num: Análisis de dos variables numéricas (continuas ó discretas): Correlación y regresión simple.
1Num1Cat: Una variable numérica y otra nominal.
2Cat: Análisis de dos variables nominales (variables cualitativas).
1Num2Cat: Análisis de una variable numérica y dos variables nominales (variables cualitativas).
2Num1Cat: Análisis de dos variables numéricas y una variable nominal (variables cualitativas).
A continuación se lista, para cada libro de trabajo, el análisis estadístico que usted puede realizar.
Dos variables Gráficos de dispersión multiseries con ejes y/o dirección permutable.
numéricas, una variable
Gráficos multilínea / multieje
cualitativa
2Num1Cat Regresión lineal (análisis de covarianza)
Varias opciones de análisis (con o sin término constante)
Diagrama de dispersión con líneas de regresión
Gráficos de pendientes e interceptos con barras de error
Pruebas de hipótesis
Ajuste de una función definida por el usuario(a) (grupo por grupo)
Funciones linealizables con regresión lineal por mínimos
cuadrados
Ecuaciones polinomiales
Regresión no lineal por mínimos cuadrados
Regresión lineal por mínimos cuadrados para detectar un punto
de inflexión en la tendencia de la serie
Ajuste de curva de suavizado a los datos (grupo por grupo)
Media móvil (media o mediana)
Medias de grupo de datos con barras / bandas de error
Regresión localmente ponderada – LOWESS
22
La interfaz grafica de cada libro de Excel es prácticamente estándar, lo cual facilita su uso. Al
interior de cada libro usted puede utilizar las funciones y herramientas de Excel (e.g. fuentes: tamaño,
color, itálico, negrita; colores en gráficos; copiar y pegar tablas y gráficos a otros programas de Office;
guardar libros de Excel con macros habilitados.
El (Ia) usuario(a) solo tiene que digitar, copiar y/o pegar los datos en las columnas de „Data‟ de un
libro de trabajo y el resto se hace automáticamente: Síntesis numérica y gráfica; análisis estadístico
(e.g. pruebas de hipótesis, intervalos de confianza, pruebas de poder, determinación de tamaño de
muestra, ajustar modelos de regresión, etc.). Su tarea fundamental es decidir ¿qué prueba debo
realizar? o ¿cómo expreso gráficamente los datos?.
Nota: Usted SOLO debe modificar el contenido de las celdas con números o textos en color azul.
XLSTATPro ®
XLSTATPro es un conjunto de libros de trabajo que permiten automatizar una gama muy diversa de
análisis y pruebas estadísticas paramétricas y no paramétricas. XLSTAT funciona con diversas
versiones de Excel, desde 97 hasta 2007 para Windows y Mac (http://www.xlstat.com).
XLMiner
XLMiner es un conjunto de herramientas para minería de datos conformado tanto por métodos
estadísticos como de aprendizaje automatizado (disciplina científica que diseña y desarrolla algoritmos
que le permiten a las computadoras discernir comportamientos basados en datos empíricos). El
programa parte de la premisa que un mismo set de datos debe analizarse utilizando diferentes
enfoques para luego elegir el modelo que mejor se adapte a los datos. Entre las funciones del
programa están: partición del set de datos, diversos métodos de clasificación y predicción, análisis de
afinidad, análisis de series de tiempo y exploración y reducción del set de datos. Para mayores detalles
sobre la funcionalidad del programa visitar:
http://www.resample.com/xlminer/capabilities.html
• Clinical Research Calculators (Calculators 1-3. For prevalence, sensitivity, specificity, predictive
values, likelihood ratios, etc.,Kaplan-Meier Survival Probability Estimates,Kappa as a Measure of
Concordance in Categorical Sorting,Chi-Square, Cramer's V, and Lambda for a Rows by Columns
Contingency Table,McNemar's Test for Correlated Proportions in the Marginals of a 2x2 Contingency
Table, Simple Logistic Regression [the plain-vanilla version],Simple ROC Curve Analysis )
•Probabilities (Randomness and the Appearence of Pattern [Demo], For Sequential Sampling: Pascal
(Negative Binomial) Probabilities,Backward Probability Template, Bayes' Theorem: Conditional
Probabilities,Bayes' Theorem: Adjustment of Subjective Confidence,[See also: Clinical Research
Calculators.)
•Frequency Data (Exact Binomial Probability Calculator, Binomial z-Ratio Calculator, Poisson
Approximation of Binomial Probabilities, Fitting an Observed Frequency Distribution to the Closest
Poisson Distribution, For Sequential Sampling: Pascal (Negative Binomial) Probabilities, Chi-Square
"Goodness of Fit" Test, Kolmogorov-Smirnov One-Sample Test, Fisher Exact Probability Test, Phi
Coefficient of Association, Rates, Risk Ratio, Odds, Odds Ratio, Log Odds, 2x2Chi-Square,
25
McNemar's Test for Correlated Proportions in the Marginals of a 2x2 Contingency Table, Fisher Exact
Probability Test for Tables Larger than 2x2, Chi-Square, Cramer's V, and Lambda for a Rows by
Columns Contingency Table, Log-Linear Analysis for a 3-Way Contingency Table, Kappa as a
Measure of Concordance in Categorical Sorting
•Proportions (The Confidence Interval of a Proportion, The Confidence Interval for the Difference
Between Two Independent Proportions, Significance of the Difference Between Two Independent
Proportions, McNemar's Test for Correlated Proportions in the Marginals of a 2x2 Contingency Table)
•Correlation & Regression (Basic Linear Correlation & Regression, Matrix of Intercorrelations,
Multiple Regression,0.95 and 0.99 Confidence Intervals for r, Estimating the Population Value of rho on
the Basis of Several Observed Sample Values of r, Test for the Heterogeneity of Several Values of
r,The Significance of an Observed Value of r, Significance of the Difference Between Two Independent
Values of r, Significance of the Difference Between an Observed Value of r and a Hypothetical Value of
rho, First- and Second-Order Partial Correlations, Phi Coefficient of Association, Point Biserial
Coefficient, Correlation for Unordered Pairs: Eta2, Intraclass Correlation, & Resampling of r, Simple
Logistic Regression)
•t-Tests & Procedures (t-Tests for the Significance of the Difference Between the Means of Two
Samples (independent or correlated), Single Sample t-Test,0.95 Confidence Interval for the Estimated
Mean of a Population)
•ANOVA (One-Way ANOVA for Independent or Correlated Samples, Two-Way Factorial ANOVA for
Independent Samples, Two-Factor ANOVA with Repeated Measures on One Factor, Two-Factor
ANOVA with Repeated Measures on Both Factors,2x2x2 ANOVA for Independent Samples,
Orthogonal Latin Square Designs for n=j2)
•ANCOVA (One-Way ANCOVA for Independent Samples, Two-Way Factorial ANCOVA for
Independent Samples)
•Miscellanea (Basic Sample Stats, Resampling Probability Estimates for the Difference Between the
Means of Two Independent Samples,The Power of the Chi-Square "Goodness of Fit" Test [Text &
Demo]
Sitios de interés
http://www.statsoft.com/textbook/nonparametric-statistics/
Según la compañía StatSoft este es el único recurso de Internet sobre Estadística recomendado por
la Enciclopedia Británica. El libro trata, de manera concisa, la mayoría de las técnicas de análisis
estadístico, incluye un glosario de términos estadísticos así como una lista de referencias.
26
Citar como:
(Versión electrónica): StatSoft, Inc. (2010). Libro de texto electrónico de Estadística. Tulsa, OK:
StatSoft. WEB: http://www.statsoft.com/textbook/.
(Versión impresa): Hill, T. & Lewicki, P. (2007). ESTADÍSTICAS Métodos y Aplicaciones. StatSoft,
Tulsa, OK
En este sitio usted puede encontrar otros programas en línea para el análisis de datos
http://www.psychnet-uk.com/experimental_design/online_calculators.htm
Para iniciar la sesión haga un doble clic sobre el archivo XLStatistics.xlam si usted utiliza Excel
2007 o sobre XLStats.xls si usted utiliza Excel 2000 y habilite los MACROS.
Una vez activados los macros, observará una nueva pestaña “XLStatitics”
En la sección inferior del libro de de trabajo 1Num.xls usted observará cinco hojas de cálculo:
1) Information: Información. Esta hoja contiene información general sobre la organización de este
libro de trabajo.
2) Data and Description: Datos y estadísticos descriptivos
3) Summaries: Síntesis de datos (Tabla de frecuencia y gráficos)
29
Nota: Usted SOLO debe modificar el contenido de las celdas con números o textos en color azul.
Description (Describir):
Estadísticos descriptivos (número de
observaciones, media, desviación
estándar, Coef. Variación, asimetría,
mínimo, primer cuartil, mediana, tercer
cuartil, máximo).
Nota: si desea observar los valores graficados por el programa, seleccione con el puntero del ratón la
gráfica y observe a la derecha de la hoja de cálculo las celdas seleccionadas. Ahora seleccione dichas
Min Q1 Md Q3 Max
El “*” indica un valor extremo, atípico o no esperado para la serie estadística y corresponden a
datos menores que Q1-1.5*(Q3 - Q1) o mayores que Q3+1.5*(Q3 - Q1). Estos valores deben analizarse
cuidadosamente ya que pueden representar errores de transcripción o condiciones particulares de
dicho dato (e.g. formar parte de otra población estadística). Por ejemplo, si usted analiza datos de
31
lluvia y en un año determinado se presenta un huracán, la lluvia de dicho año debe considerarse como
un evento de otra población estadística.
Ejercicio: Utilizando las viables Pt y Año, realice un análisis de tendencia en tiempo (Pt Vs año) como
el que se muestra en ”Cambio de pendiente (tendencia) en el set de datos” para determinar si
efectivamente existe un cambio en la pendiente para dicho año.
32
Nota: si desea observar los valores graficados por el programa, seleccione con el puntero del ratón la
gráfica y observe a la derecha de la hoja de cálculo las celdas seleccionadas. Ahora seleccione dichas
celdas y asígneles un color al texto (color de la fuente) . A continuación se muestran los datos
para la gráfica de probabilidad normal para los residuos y para el histograma de residuos.
Prueba de Normalidad
Recuerde que usted debe fijar el nivel de alfa antes de realizar cualquier prueba estadística.
Tabla de decisión estadística para una prueba de hipótesis sobre dos grupos.
Ho (hipótesis nula)
HI (hipótesis alternativa)
Nota: Muestras muy grandes tienden a rechazar Ho aunque las diferencias entre los grupos sean muy
pequeñas. Pruebas estadísticas con un gran poder tienden a generar mayor número de resultados
34
Steiger, J.H., & Fouladi, R.T. 1997. Noncentrality interval estimation and the evaluation of statistical
models. Pp. 221-257. In Harlow, L. L., Mulaik, S. A., & Steiger, J. H. (Eds.). What if there were no
significance tests? Mahwah, NJ: Lawrence Erlbaum Associates. Disponible en:
http://www.statpower.net/Steiger%20Biblio/Steiger&Fouladi97.PDF
Pruebas no paramétricas
Mediana (Prueba de signos, prueba del signo)
Prueba de Wilcoxon para muestras pareadas
Prueba de Chi-2 para la varianza
Datos
Herramientas adicionales
1775 1977 3
1978 2179 5
2180 2381 4
2382 2584 6
2585 2786 9
2787 2997 8
2998 3190 5
3191 3393 2
3394 3595 2
3596 3797 2
3798 4001 2
37
Nota: Esta sección del tutorial asume que usted ya activó el complemento de XLStatisticis
(XLStatistics.xlam ó XLStats.xls); de no ser así, ver página 23.
2. Haga un clic sobre XLStatistics y luego otro clic sobre . Observe que el programa abre el
libro de trabajo 1Cat.xls y copia los datos seleccionados a dicho libro.
En la sección inferior de la hoja de cálculo 1Cat.xls usted observará cuatro hojas de cálculo:
1) Information: Información. Esta hoja contiene información general sobre la organización de este
libro de trabajo.
2) Data and Description: Datos y estadísticos descriptivos
3) Summaries: Síntesis de datos (Tabla de frecuencia y gráficos)
4) Tests: Pruebas estadísticas
Nota: Recuerde que SOLO debe modificar el contenido de las celdas con números o textos en color
azul.
Description (describir):
Frecuencia absoluta para cada valor
de la variable ENOS (Niña, Niño,
Neutro)
1. Prueba de hipótesis
2. Intervalo de confianza
3. Análisis de poder y determinación de tamaño
de muestra
Observe que el intervalo de confianza contiene el valor 0.333. ¿Qué le indica esto?
1. Prueba de hipótesis
2. Intervalo de confianza
3. Análisis de poder
A B
42
Observe que a partir de 1996 existe una mayor frecuencia de años “lluviosos”; sin embargo
a partir de 2006 parece que se inicia otro ciclo de menor precipitación.
A. B.
Observe que a partir de 1996 existe una mayor frecuencia de años “lluviosos”; sin
embargo a partir de 2006 parece que se inicia otro ciclo de menor precipitación.
43
Nota: Esta sección del tutorial asume que usted ya activó el complemento de XLStatisticis
(XLStatistics.xlam ó XLStats.xls); de no ser así, ver página 23.
A continuación analizaremos los datos de las variables año y precipitación anual. A esta serie se le
conoce como una serie temporal porque involucra a la variable tiempo (años).
Nota: Dado que las dos variables son cuantitativas, XLStatistics ofrece herramientas para
realizar un análisis de correlación y regresión simple. En Excel la primera columna
corresponde al eje “Y” y la segunda al Eje “X”.
En este caso deseamos analizar el comportamiento de la lluvia anual en el tiempo y por tanto
la variable Y es PT anual y la variable X el tiempo.
1. Abra el archivo “xlstats_tutorial.xlsx” y seleccione de la hoja de cálculo 2Num las variables Año
(variable predictora) y Moravia Pt. anual (mm) (variable dependiente).
2. Haga un clic sobre XLStatistics y luego otro clic sobre . Observe que el programa abre el
libro de trabajo 2Num.xls y copia los datos seleccionados a dicho libro.
En la sección inferior de la hoja de cálculo 2Num.xls usted observará cuatro hojas de cálculo:
5) Information: Información. Esta hoja contiene información general sobre la organización de este
libro de trabajo.
6) Data and Description: Datos y estadísticos descriptivos
7) Corr &Linear Regress: Correlación y regresión simple
8) Extra Tools: Herramientas adicionales
Nota: Recuerde que SOLO debe modificar el contenido de las celdas con números o textos en color
azul.
44
Figura 1: Distribución hipotética de la variable altura (h) en metros para un valor de diámetro de 40
cm. La distribución de valores de altura es normal con una media de 22.78 m y un error de
estimación es 4.25 m.
Ahora supongamos que existen otros valores de altura y diámetro como se muestra en la figura 2.
La ecuación de regresión ajusta una recta a través de las cimas de cada una de las distribucioes de
h|d. Sin embargo, observe que el ajuste no es perfecto, o sea existe un error de estimación; dicho error
se utiliza para calcular los intervalos de confianza y realizar las pruebas de hipótesis sobre la validez
estadística del modelo. Cuanto más pequeño sea dicho error mayor capacidad predictiva y descriptiva
tendrá el modelo.
Figura 2: Distribución hipotética de valores de altura (h, m) y diámetro (cm). El error de estimación
es una función de la amplitud de cada una de las distribuciones de “h” dado un valor de “d”.
45
Análisis de correlación
1. Coeficiente de correlación lineal
2. Prueba de hipótesis sobre rho.
Para un alfa 0.05 ¿se rechaza Ho?____
1- Modelo
a. El modelo es completo. La ecuación posee todos las variables requeridas para describir la
relación entre Y y X. Ejemplo: Y=a+bX+e. No existe ninguna prueba estadística que le indique
directamente si el modelo posee todas las variables requeridas para describir la relación entre
Y y X. Le sugiero utilizar sus conocimientos teóricos (e.g. publicaciones previas, consulta con
expertos, colegas, etc.) para evaluar este criterio.
b. Lineal. La relación entre las variables X y Y es lineal. Principio de linealidad de la regresión.
c. Aditivo. La relación entre las variables es aditiva. Este supuesto es especialmente crítico en
regresiones múltiples (dos o más variables predictoras); ya que el efecto de una variable
puede estar afectado por otra variable. Por ejemplo, el efecto de la fertilización en el
crecimiento de un bosque segundario puede depender del uso previo del sitio, de la
profundidad del suelo ó del pH. No existe ninguna prueba estadística que le indique
directamente si el modelo requiere de términos no aditivos. Si usted sospecha que la relación
entre las variables es no aditiva le sugiero los siguiente:
d. Utilizar sus conocimientos teóricos (e.g. publicaciones previas, consulta con expertos,
colegas, etc.) para evaluar este criterio.
e. Ajustar otras funciones y comparar los valores de R2 ó del cuadrado medio del error.
f. Ajustar una regresión separada para los diferentes grupos utilizando variables de
clasificación.
g. Incluir un término multiplicativo en el modelo (e.g. X1*X2)
2- Variables
a. Nivel de medición de intervalo o razón.
b. Variables se miden sin error. Se supone que las variables solo son afectadas por el error
aleatorio. Si los datos incluyen un error sistemático, el error de estimación del modelo
incrementará y el valor de la pendiente será diferente.
47
B. Eficientes: Estima el parámetro de interés con el menor error posible. Ejemplo: el error
estándar de estimación será un mínimo.
C. Consistentes: Conforme el tamaño de muestra aumenta el error del estimador tiende a cero.
Si alguno de estos supuestos es violado, entonces las estimaciones de los parámetros del modelo,
las predicciones, las pruebas de hipótesis, los intervalos de confianza y la relación entre las variables
indicada por el modelo de regresión puede ser, en el mejor de los casos, ineficiente o peor aun, estar
gravemente sesgadas o ser engañosas. Normalmente los residuos se utilizan para probar por los
siguientes supuestos del modelo:
Supuesto Prueba
La relación entre las Diagrama de dispersión, gráfico de valores observados Vs valores
variables X y Y es estimados, gráfico de residuos Vs valores estimados ((. ).
lineal En caso de violar este supuesto debe utilizar un modelo linealizable ó no
lineal, transformar las variables ó utilizar variables de clasificación (dividir del
set de datos en segmentos lineales).
Los errores son Para series temporales graficar errores vs tiempo. Para otros datos utilizar el
independientes gráfico de autocorrelación de residuos de resago 1. Es deseable que la
mayoría de las autocorrelaciones residuales estén dentro de las bandas de
confianza del 95% en torno a cero, las cuales se encuentran
aproximadamente a ± 2/(n)0.5, donde “n” es el tamaño de la muestra. Así, si
el tamaño de la muestra es de 48, las autocorrelaciones debe estar entre +/-
0,29. Ponga especial atención a las autocorrelaciones significativas de
resago uno y dos. El estadístico Durbin-Watson (d) es utilizado para probar
por autocorrelación de resago-1 entre residuos: “d” es aproximadamente
igual a 2*(1-r) donde “r” es la autocorrelación residual: un valor de 2,0 indica
ausencia de autocorrelación. Como regla general, cualquier valor de “d”
inferior a 1 indica autocorrelación grave entre los residuos. El valor de “d”
siempre se encuentra entre 0 y 4. Si el estadístico de Durbin-Watson es
sustancialmente menor que 2, existe evidencia de correlación serial positiva.
Un estadístico robusto y más poderoso que DW es la prueba LM de
autocorrelación de residuos de Breusch-Godfrey.
Homocedasticidad de Gráfico de residuos versus variable predictora (en este caso “año”).
los errores (varianzas
son constantes) con
respecto a la variable
predictora.
Los errores tienen una Gráfico de probabilidad normal e histograma de residuos. Prueba de
distribución normal. normalidad.
El libro 2NRP.xls de XlStatistics le ofrece las siguientes pruebas para evaluar los supuestos del
modelo.
Para probar por el supuesto de linealidad usted puede graficar los residuos versus los
valores estimados, para esto debe crear dos nuevas variables como se muestra a
continuación.
Pt Estimado Residuos
2832 217.3
3127 353.0
3675 615.2
1650 -408.6
2029 -230.8
2513 -0.8
2949 205.7
4309 874.2
1925 -329.4
2413 -97.4
2550 -40.1
1029 -812.4
. .
Observe que los datos se ajustan a una recta, por cuanto puede asumirse que cumplen con el
supuesto de linealidad.
Herramientas adicionales
Esta hoja de trabajo le brinda acceso a las siguientes funciones:
1. Ajuste de funciones: ecuaciones linealizables, regresión polinomial, regresión no lineal y
determinación de puntos de inflección en la tendencia del set de datos.
2. Suavizado de tendencia en el set de datos. Media móvil, media con barras de error y regresión
localmente ponderada.
3. Síntesis numérica y gráfica para cada una de las variables en el set de datos.
4. Análisis de correlación no paramétrico: Coeficientes de correlación de Spearman y de Kendall.
5. Análisis de series de tiempo. Ajuste de función exponencial y suavizado de datos.
6. Adicionar etiquetas a datos
51
Ajuste de funciones
Transformaciones lineales
Esta hoja de trabajo permite ajustar
ecuaciones no lineales en su forma
original pero que pueden linealizarse
mediante el uso de logaritmos
(naturales y de base 10).
El programa ofrece estimaciones de
“a” e IC, “b” e IC, r y R2; así como la
ecuación de regresión.
También puede ajustar una regresión
logística.
Ecuación polinomial
Regresión no lineal
Notas:
1. Esta función utiliza el complemento “Solver” de Excel.
2. El punto de cambio en la pendiente del set de datos puede variar con el número de eventos
utilizados (# trials for breaking point).
Suavizado de tendencia: media móvil, media con barras de error, regresión localmente
ponderada
Media móvil
Media móvil
La media móvil es utilizada con series
de tiempo para determinar si existe
algún patrón en el set de datos.
Usted puede elegir entre la media ó
la mediana; así como el número de
años a utilizar en el cálculo.
Regresión localmente
ponderada(LOWESS)
LOWESS y LOESS
El término "LOWESS" proviene del inglés "Locally Weighted Scatter plot Smoothing"; sin embargo
algunos autores también utilizan la palabra "LOESS" como sinónimo. Ambos métodos utilizan
regresiones lineales ponderadas localmente con el objetivo de suavizar la tendencia local en el set de
datos. Por defecto las funciones lowess y loess realizan un ajuste localmente lineal y localmente
cuadrático, respectivamente.
La principal ventaja de LOESS es que el usuario(a) no debe especificar ningún modelo que deba
ajustarse a todos los datos de la muestra. En su lugar, el o la analista solo tienen que proveer un valor
de parámetro de suavizado y el grado del polinomio local. LOESS es una técnica de análisis muy
flexible y por tanto es ideal para analizar procesos para los cuales no existen modelos teóricos. La
técnica LOESS permite calcular la incertidumbre asociada al modelo de predicción y de calibración así
como aplicar la mayoría de las pruebas y procedimientos utilizados para validar los modelos de
regresión basados en mínimos cuadrados.
Entre las desventajas del método tenemos que hace un uso menos eficiente de los datos que otros
métodos de mínimos cuadrados. Sin embargo, dados los resultados que el método proporciona, sin
duda podría ser más eficiente en general, que otros métodos de estimación como el de mínimos
cuadrados no lineales. Otra desventaja de LOESS es que no produce una función de regresión y por
tanto no puede transferirse a otros usuarios(as).
LOESS, al igual que cualquier otro método de mínimos cuadrados, es afectado por valores atípicos
o extremos en el set de datos. La versión iterativa y robusta de LOESS (Cleveland (1979) reduce dicha
sensibilidad; sin embargo, valores muy atípicos o extremos pueden superar incluso el método de
análisis más robusto.
Referencias
Cleveland, W.S. (1979). "Robust Locally Weighted Regression and Smoothing Scatterplots". Journal of
the American Statistical Association 74 (368): 829–836. MR0556476. JSTOR 2286407.
http://www.stat.purdue.edu/~wsc/papers/localregression.principles.ps
55
Grafico de frecuencia
Etiquetas eje Y: frecuencia absoluta,
proporciones, porcentaje, acumulada.
Etiquetas eje X:
Límite superior de clase
Clases: punto medio, intervalo de
clase
Series de tiempo
Ejercicio
Si usted desea practicar lo expuesto en esta sección puede utilizar los datos de lluvia anual
de las estaciones Batán (15 msnm) y Moravia de Chirripó (1200 msnm) (hoja 2Num del
archivo xlstats_tutorial.xlsx).
A B
A B
A B
Descriptive Statistics Software: Central Tendency, Average, Mean, Median, Variability, Interquartile
Range, Concentration, Lorenz Curve, Gini Coefficient, Skewness, Kurtosis, Quartiles, Percentiles,
Notched Boxplot, Histogram, Correlation, Partial Correlation, Rank Correlation (Spearman and
Kendall), Simple Regression, Kernel Density Estimation, Harrell-Davis Quantiles, Bivariate KDE,
Correlation Matrix, Stem-and-leaf plot, Explorative Data Analysis
Citar como: Wessa, P. (2010), Free Statistics Software, Office for Research Development and
Education, version 1.1.23-r6, URL http://www.wessa.net/
Paso 1: Copiar de la hoja de Excel los datos de la variable “Y” (Pt anual de Moravia) y pegarla en la
columna “Data Y”. Etiquete el eje Y (Label y-axis) como Moravia. Asegúrese que no quede ningún
espacio vacío al final de la columna de datos.
Paso 2: Copiar de la hoja de Excel los datos de la variable “X” (año) y pegarla en la columna “Data X”.
Etiquete el eje Y (Label x-axis) como Año. Asegúrese que no quede ningún espacio vacío al final de la
columna de datos.
Resultados
Cuadrado medio
Análisis de autocorrelación
Estadístico de Durbin-Watson
Estadísticos descriptivos
Varianza insesgada
Varianza sesgada
Media aritmética
Media armónica
Media ponderada
Media geométrica
Fuente: http://www.xycoon.com/
64
Nota: Esta sección del tutorial asume que usted ya activó el complemento de XLStatisticis
(XLStatistics.xlam ó XLStats.xls); de no ser así, ver página 23.
En la sección inferior del libro 1Num1Cat usted observará cuatro hojas de cálculo:
Nota: Recuerde que SOLO debe modificar el contenido de las celdas con números o textos en
color azul.
Estadísticos descriptivos
por episodio de ENOS
(Niña, Niño, Neutro).
En la gráfica de frecuencia,
usted puede elegir entre
barras e histograma; así
como el episodio de ENOS
a graficar: Niño, Niña o
Neutro.
Usted puede elegir:
# de clases, límite superior
e inferior de los datos,
límite superior de la clase,
clases (intervalo, punto
medio).
66
Eje X
# de clases, límite superior e inferior
de los datos, límite superior de la
clase, clases (intervalo, punto
medio).
Eje Y
Frecuencia absoluta y relativa,
proporciones
Eje X
# de clases, límite superior e inferior
de los datos, límite superior de la
clase, clases (intervalo, punto
medio).
Eje Y
Frecuencia absoluta y relativa,
proporciones, acumulada.
Grafico de Columna
Diagrama de caja.
Bajo los supuestos del diseño irrestricto al azar o completamente al azar el valor esperado de
cualquier observación Xij puede estimarse mediante el modelo:
, en donde:
Media de la población
Efecto del tratamiento i
Residuo o error con una distribución normal (0,σ 2)
La tabla de análisis de varianza de una vía contiene los siguientes elementos para el modelo
de efectos fijos (modelo tipo I):
En un modelo de efectos fijos o modelo “I” se eligen todos los posibles niveles de interés de la
variable nominal y asume que los datos provienen de poblaciones normales, las cuales podrían
diferir únicamente en sus medias. En el modelo “II” o de efectos aleatorios solo se eligen algunos
de los posibles niveles de interés de la variable nominal y por esta razón la partición de varianza
es de mayor interés que determinar qué grupos son diferentes.
Normalidad. La dependiente o respuesta debe ser normal. Este es un requisito para las pruebas
estadísticas. Sin embargo, la prueba F (razón de dos varianzas) es muy robusta a datos no
normales, especialmente en modelos de efectos fijos o cuando el tamaño de muestra es superior
a 50. Cuando se viola seriamente este supuesto los resultados de las pruebas estadísticas son
muy laxas (mayor tendencia a rechazar Ho) y decrece el poder y la eficiencia de la prueba. Si sus
datos son no normales puede transformarlos, utilizar un equivalente no paramétrico (Kruskal-
Wallis ó Friedman) ó utilizar una prueba F basada en aleatorización.
Pruebas: Para probar por la igualdad de varianzas pude utilizar la gráfica de cajas para cada
una de los tratamientos ó la gráfica de desviación estándar por tratamiento (la varianza de cada
media debe ser equivalente). También puede utilizar la prueba de Levene, la cual calcula una
ANOVA de 1 vía utilizando el valor absoluto (o algunas veces al cuadrado) de los residuos, |yij -
Yi| con t-1, N - t grados de libertad); esta es una prueba robusta cuando se utiliza con datos no
normales pero es demasiado conservadora. Si sus datos son normales o casi normales, se
recomienda utilizar la prueba de Bartlett, ya que, bajo estas condiciones, es más poderosa
(capacidad para detectar varianzas desiguales cuando las mismas son realmente diferentes)
que la de Levene.
Los supuestos de normalidad e igualdad de varianzas son críticos para realizar las pruebas de
hipótesis; sin embargo el análisis de varianza es robusto a dichas violaciones; especialmente
conforme aumenta el tamaño de la muestra. En la práctica se pueden aceptar violaciones a dichos
supuestos sin invalidad los resultados. También es posible transformar los datos (e.g. raíz
cuadrada, logaritmos, recíproca, angular) para hacerlos compatibles con los supuestos del análisis
de varianza; sin embargo dichas transformaciones afectarán la magnitud de las interacciones.
Otra alternativa es utilizar pruebas no paramétricas (Kruskal-Wallis ó Friedman) ó utilizar una
prueba F basada en aleatorización como la que realiza el programa “resampling”
http://www.uvm.edu/~dhowell/StatPages/Resampling/Resampling.html).
71
Análisis de residuos
El histograma y el gráfico de
probabilidad normal permiten
concluir que los datos cumplen con
el supuesto de normalidad.
72
Para utilizar esta versión en línea de StatGraphics usted debe registrarse (es gratuito). Los datos
utilizados se encuentran en el archivo anova_statgraphics.xls y corresponden a los analizados con
XLSTatistics.
Esta barra de menú le permite configurar las opciones que ofrece el programa.
Una vez leídos los datos y configurado las opciones de análisis que desea haga un clic sobre
Calculate.
Gráfico de dispersión
Este gráfico muestra la precipitación (mm) por episodio de ENOS. Observe que la dispersión
entre grupos es similar; lo cual es un indicador de la igualdad de varianzas entre grupos; esto se
confirma al observar el coeficiente de variación (entre 17 y 24%).
Gráfico de Box-Whisker
El signo “+” indica la ubicación de la media para cada grupo. Los cuadrados pequeños indican
valores atípicos que se encuentran a más de 1.5 veces el rango intercuartil por encima o por
debajo del primer (Q1) ó del tercer cuartil (Q3), respectivamente.
ANOVA gráfica
La representación gráfica de ANOVA se utiliza para mostrar gráficamente la
importancia de las diferencias entre los niveles del factor experimental (en este caso
ENOS). Se trata de una grafica de los efectos del factor de escala, donde el "efecto" es
igual a la diferencia entre la media para un nivel de dicho factor y la media global. Cada
uno de los efectos es multiplicado por un factor de escala dado por:
donde vR son los grados de libertad del residuo, νT son los grados de libertad para el factor, ni es
igual al número de observaciones en el nivel i-ésimo del factor, y es el número medio de
observaciones para todos los niveles del factor. Estos valores escalan los efectos de manera que
75
Esta gráfica muestra la media anual de Pt (mm) por episodio de ENOS. Los intervalos
para la media que se muestran se basan en la diferencia mínima significativa de Fisher
(LSD) y están construidos de tal manera que si dos medias son iguales, sus intervalos se
solaparán 95% del tiempo. Los pares de intervalos que no se superponen verticalmente
corresponden a medias estadísticamente diferentes.
La X indica que no existe una diferencia significativa entre ninguna de las medias comparadas
como se aprecia en la siguiente tabla:
Este gráfico muestra la media de cada una de las tres muestras (episodios de ENOS). También
se muestra la gran media y los límites de decisión al 95%. Dado que ninguna de las medias queda
fuera de los límites de decisión, no hay diferencia significativa entre ellas para un alfa de 0.05.
77
Test P-Value
Levene's 0.586176 0.560643
Esta tabla muestra la comparación de las desviaciones estándares para cada par de muestras.
Para un alfa de 0.05, no existe ninguna diferencia estadísticamente significativa entre las
desviaciones estándares comparadas (p>=0.05).
Este gráfico muestra los residuos para cada uno de los episodios de ENOS. Los
residuos son iguales a los valores observados de Pt anual (mm) menos la media anual de
Pt (mm) del respectivo grupo. Observe que la dispersión entre grupos es similar; lo cual es un
indicador de la igualdad de varianzas entre grupos.
ENOS Sample Size Average Rank Test statistic = 5.95164 P-Value = 0.0510056.
Neutro 20 21.85
Niña 14 20.6429
Niño 14 32.1429
78
La prueba de Kruskal-Wallis evalúa la hipótesis nula de que las medianas de Pt anual (mm)
para cada uno de los tres episodios de ENOS es la misma. Para un nivel de significancia de 5%,
dado que el valor “p” es mayor o igual a 0,05, no existe una diferencia estadísticamente
significativa entre las medianas de los episodios de ENOS. Sin embargo, observe que el valor de
“p” es muy cercano al “p” crítico y posiblemente con un tamaño de muestra mayor el resultado
sería significativo al menos para la diferencia Niño-Niña.
ENOS Sample Size n<= n> Median 95% lower CL 95% upper CL
Neutro 20 10 10 2704.05 2434.45 3225.23
Niña 14 6 8 2788 1819.54 3152.85
Niño 14 8 6 2617.4 2229.98 3104.24
Test statistic = 0.571429 P-Value = 0.751477
El estadístico de Mood somete a prueba la siguiente hipótesis: las medianas de las tres
muestras son iguales. Dado que el valor “p” para la prueba de chi-cuadrado es mayor o igual a
0,05, las medianas de las muestras no son significativamente diferentes al nivel de confianza del
95%. También se incluyen los intervalos de confianza al 95% para cada mediana. Esta prueba es
menos sensible a los valores atípicos que la prueba de Kruskal-Wallace, pero también es menos
potente cuando los datos proceden de una distribución normal.
Nota: Observe que la conclusión (no diferencia entre Pt media o mediana por episodio de
ENOS) es consistente en todas las pruebas realizadas.
Grafico de medianas
Este gráfico muestra la mediana de cada grupo con su respectivo intervalo de confianza al
95%. Los pares de intervalos que no se superponen verticalmente corresponden a
medianas estadísticamente diferentes. Observe que este caso todos los intervalos se
traslapan y por tanto todas las medianas son iguales.
79
Análisis de residuos
El análisis de residuos tiene como
objetivo verificar los supuestos de la
prueba de hipótesis:
Normalidad e Igualdad de varianzas.
Nota: Usted puede someter a prueba los otros contrastes: Niña-Neutro; Niña-Niño.
Recuerde el efecto de las comparaciones múltiples sobre el valor de alfa (ver pág. 78).
82
Remuestreo
La palabra remuestreo (resampling) describe aquellas técnicas de simulación empleadas para
estimar parámetros y realizar pruebas de hipótesis, a partir de los datos observados y de la
generación de muestras simuladas de igual tamaño que la muestra original (denominadas
remuestras). Los métodos de aleatorización y las estimaciones "bootstrap" son considerados
como casos particulares de la metodología de simulación conocida como Monte Carlo (por su
relación con los juegos de azar de Monte Carlo, Mónaco).
Dado dos muestras aleatorias, el método de “bootstrap” parte de la premisa que los datos de
ambas muestras provienen de una misma población y que por tanto es posible crear una
seudopoblación conformada por las observaciones de ambas muestras. A partir de este nuevo set
de datos se obtienen 1000 o más muestras con reemplazo y se calcula la media para cada
muestrea. Finalmente se reordenan los resultados y se obtienen los percentiles 2.5 y 97.5; dichos
percentiles corresponden a un intervalo de confianza para la media de 95%. Este método se utiliza
para:
Valorar el sesgo y el error estándar de un estadístico calculado a partir de una
muestra.
Establecer un intervalo de confianza para un parámetro estimado.
Realizar pruebas de hipótesis respecto a uno o más parámetros poblacionales.
El método de Jackknife (traducido como “la cuchilla de mil usos”) consiste en crear muestras
eliminando una observación “Xi” cada vez que se obtiene una nueva muestra e igual que en los
casos anteriores para cada muestra se calcula el valor del parámetro de interés (e.g. media), el
proceso se repite para i=1 hasta N. De esta manera se obtienen los denominados pseudovalores,
los cuales se utilizan para calcular la media, la cual se denomina estimador jackknife. A partir de la
distribución obtenida se calcula su varianza y el intervalo de confianza para el mismo.
“Jackknifing“ es similar a "bootstrapping" y se utiliza en la estadística inferencial para estimar:
Valorar el sesgo y el error estándar de un estadístico calculado a partir de una
muestra.
Establecer un intervalo de confianza para un parámetro estimado.
1) Calcule la media o mediana para cada grupo y la diferencia “D1” entre las medias o medianas
de los grupos. Esta es la diferencia observada en las muestras.
2) Mezcla las dos muestras y asigne al azar 10 datos a la muestra 1 y 10 datos a la muestra 2 y
calcule la diferencia entre las medias o medianas de dichos grupos (D2). El numero de formas
(muestras) en que las 20 observaciones pueden dividirse en dos grupos esta dado por:
3) Repita el paso (2) un gran número de veces (e.g. 1000) para crear un conjunto de muestras de
las diferencias entre las medias o medianas (D) y de esta manera crear una distribución
empírica de “D” dado que su asignación a los dos grupos fuese aleatoria (hipótesis nula: bajo la
hipótesis nula el grupo/categoría no ejerce ninguna influencia en el valor de X). A estas
estimaciones se les conoce como remuestreo mediante aleatorización.
4) Determine cuántas veces las diferencias entre las medias o medianas obtenidas por
remuestreo son iguales o superiores a la diferencia obtenida entre los datos reales. Esta
proporción representa el valor de “p” estimado a partir del remuestreo y equivale al valor de “p”
obtenido en las pruebas tradicionales de hipótesis. Si el valor de “p” es pequeño (e.g. menor
que 0.05) se puede concluir que la media o mediana de las dos muestras es diferente a dicho
nivel de significancia; para una prueba de 1 cola el valor de “p” debe ser 0.025. En otras
palabras, la conclusión es que existe una diferencia entre la media ó mediana de los grupos
(prueba de dos colas).
En resumen, una prueba de remuestreo se base en los datos obtenidos por el investigador(a) y
no en una distribución teórica como la “t” o la normal. La prueba compara un estadístico calculado
(la diferencia entre medias o medianas en este ejemplo) con el valor de ese estadístico obtenido
de otros cientos o miles de arreglos del set de datos. El valor de probabilidad (p) es la proporción
de veces que el estadístico estimado a partir de diferentes muestras aleatorias obtenidas del set
de datos es mayor o igual al valor obtenido de los datos reales. Las pruebas de permutaciones
sólo tienen un inconveniente: son imprácticas para muestras de moderadas a grandes. Por
ejemplo, el número de formas en que 45 datos pueden dividirse en tres grupos de 15
observaciones cada uno es 5.34 *1019.
La alternativa a esta limitación es utilizar las técnicas de “bootstrap” ó aleatorización, las cuales
calcula una proporción de todas las posibles muestras y a partir de dichos datos estima el valor de
“p”. Para que el resultado sea confiable se recomienda realizar entre 10000 y 5000 remuestreos.
Good, Phillip I. Introduction to statistics through resampling methods and Microsoft Office
Excel.West Sussex, Reino Unido (INGLATERRA). John Wiley & Sons. 231p. 2005.
Ejercicio
El archivo efecto_borde.xls o efecto_borde.xlsx puede utilizarse para evaluar el efecto de
muestras de diferentes tamaños en las pruebas de hipótesis de dos grupos o categorías.
85
Nota: Esta sección del tutorial asume que usted ya activó el complemento de XLStatisticis
(XLStatistics.xlam ó XLStats.xls); de no ser así, ver página 23.
1. Abra el archivo “xlstats_tutorial.xlsx” y seleccione las columnas Década y ENOS, haga un clic
sobre XLStatistics y luego otro clic sobre . Observe que el programa abre la el libro de
cálculo 2cat.xls y copia los datos seleccionados a dicho libro.
En la sección inferior del libro de cálculo 2Cat.xls usted observará seis hojas de cálculo:
Nota: Recuerde que SOLO debe modificar el contenido de las celdas con números o textos en
color azul.
Nota: “Tables” es un programa gratuito que permite realizar pruebas estadísticas para
tablas de 2*2, 3*3 y 2*7. http://www.quantitativeskills.com/downloads/winprog/tabsetup.exe
Otras Herramientas
Ver: http://www.quantitativeskills.com/sisa/statistics/twoby2.htm
Prueba de Yate's= 1.856 (p= 0.1731)
Prueba de Mantel Haenszel= 3.686 (p= 0.0548)
Prueba exacta de Fisher p= 0.175757.
Tabla:
Frecuencia absoluta,
porcentaje, proporción
Nota: Esta sección del tutorial asume que usted ya activó el complemento de XLStatisticis
(XLStatistics.xlam ó XLStats.xls); de no ser así, ver página 23.
En la sección inferior de la hoja de cálculo 1Num2cat.xls usted observará cuatro hojas de cálculo:
Nota: Recuerde que SOLO debe modificar el contenido de las celdas con números o textos en
color azul.
91
Cuadro de frecuencia de
ENOS Vs Década. Usted
debe elegir el estadístico
que sea incluir en el cuadro.
Frecuencia
Media
Des. Estándar
Asimetría
Mínimo
Primer cuartil (Q1)
Mediana (Segundo
cuartil Q2)
Tercer cuartil (Q3)
Máximo
Nota: A continuación utilizamos las variables Pt anual (mm), Estación y Década de la hoja de
cálculo 1Num2Cat del archivo “xlstats_tutorial.xlsx”. Los efectos que se desean analizar son: lluvia
por década y por estación; en otras palabras ¿es la cantidad de lluvia medida durante la década
del 70 y 80 independiente de la estación?
93
1. La distribución de la variable dependiente debe ser normal. Los datos en cada celda
deben ser aproximadamente normales. Compruebe la normalidad de los datos utilizando
histogramas, coeficientes de asimetría y curtosis. Realice prueba de hipótesis de
normalidad. Analice los residuos para verificar los supuestos del modelo.
Se eligió efectos fijos porque se asume que no existen otras estaciones ni tampoco otras
décadas para el análisis; en otras palabras se utilizaron todas las opciones disponibles para las
variables estaciones y décadas. Sin embargo, esta decisión podría cuestionarse pues se podría
asumir que los sitios donde se mide la lluvia son solo algunos de todos los posibles sitios donde
podría ubicarse una estación meteorológica. Bajo este argumento el efecto estación debería ser
aleatorio.
94
Análisis de residuos
Gráfico de probabilidad
normal e histograma de
residuos. Las gráficas
indican que los datos no se
apartan de una distribución
normal.
Residuos Vs valores
estimados. Evaluación del
supuesto de igualad de
varianzas. Los datos
muestras una posible
violación de este supuesto
pues la variabilidad aumenta
al aumentar la precipitación.
Para utilizar esta versión en línea de StatGraphics usted debe registrarse (es gratuito). Los
datos utilizados se encuentran en el archivo anova2vias_balanceado.xls y corresponden a los
analizados en la sección anterior (1Num2Cat).
Esta barra de menú le permite configurar las opciones que ofrece el programa.
Una vez leídos los datos y configurado las opciones de análisis que desea haga un clic sobre
Calculate.
96
Gráfico de dispersión
Este gráfico muestra la
precipitación (mm) para cada una
de las estaciones. El gráfico permite
evaluar el supuesto de igualad de
varianzas. Los datos muestras una
posible violación de este supuesto
pues la variabilidad aumenta con la
cantidad de precipitación.
Analysis of Variance for Pt anual (mm) - Type I Sums of Squares (Análisis de varianza Tipo I)
El valor de “p”, inferior a 0.05, indica que el efecto de los factores es estadísticamente
significativo en el valor de la precipitación.
ANOVA Gráfica
Table of Least Squares Means for Pt anual (mm) with 95% Confidence Intervals
Esta tabla muestra la precipitación anual media (Pt mm) global y para cada nivel de los
factores. También muestra el error estándar de cada media, que es una medida de su variabilidad
de muestreo. Las columnas de la derecha muestran los intervalos de confianza al 95% para cada
una de las medias.
Esta gráfica muestra la media anual de Pt (mm) por estación. Los intervalos para la media se
basan en la diferencia mínima significativa de Fisher (LSD) y están construidos de tal manera que
si dos medias son iguales, sus intervalos se solaparán 95% del tiempo. Los pares de intervalos
que no se superponen verticalmente corresponden a medias estadísticamente diferentes.
98
Este gráfico es útil para determinar si existe interacción entre los factores “Estación” y
“Década”. Cuando no existe interacción (como en este caso), las líneas son paralelas. El gráfico
también incluye los intervalos LSD al 95% para cada media. Si dos intervalos cualesquiera no se
traslapan, esto indica que las respectivas medias son estadísticamente diferentes a un alfa 0.05.
99
Este gráfico es útil para determinar si existe interacción entre los factores “ENOS” y “Década”.
Las cinco líneas corresponden a los niveles del factor “Década”, las cuales conectan las medias
estimadas por mínimos cuadrados de los tres niveles de ENOS. Cuando existe interacción (como
en este caso), las líneas se traslapan entre sí.
Este gráfico muestra los residuos versus el número de fila en el archivo. Cualquier patrón que
no sea una dispersión aleatoria podría indicar la presencia de correlación serial en los datos.
101
Nota: Esta sección del tutorial asume que usted ya activó el complemento de XLStatisticis
(XLStatistics.xlam ó XLStats.xls); de no ser así, ver página 23.
En la sección inferior de la hoja de cálculo 2Num1cat.xls usted observará cuatro hojas de cálculo:
Nota: Recuerde que SOLO debe modificar el contenido de las celdas con números o textos en
color azul.
Descripción:
Frecuencia total y por episodio de ENOS.
Coeficientes de correlación para Pt y año
por episodio de ENOS
Coeficientes de determinación para Pt y
año por episodio de ENOS.
Intercepto:
1. Diferentes para cada
regresión
2. Igual para todas las
regresiones
3. Igual a cero
Pendiente:
1. Diferentes para cada
regresión
2. Igual para todas las
regresiones
Resumen:
Pendiente e intercepto para
cada modelo de regresión
lineal.
Análisis de residuos
Residuos Vs variable de
clasificación. Este gráfico permite
evaluar el supuesto de homogeneidad
de varianzas entre episodios de
ENOS. Para este set de datos, las
varianzas son semejantes y por tanto
no se viola este supuesto.
Gráfico de medias
Ajuste de funciones
Suavizado
105
Nota: Esta sección del tutorial asume que usted ya activó el complemento de XLStatisticis
(XLStatistics.xlam ó XLStats.xls); de no ser así, ver página 23.
2. Haga un clic sobre XLStatistics y luego otro clic sobre . Observe que el programa abre
el libro de cálculo nNum.xls y copia los datos seleccionados a dicho libro.
No incluir constante.
En la sección inferior de la hoja de cálculo nNum.xls usted observará seis hojas de cálculo:
Nota: Recuerde que SOLO debe modificar el contenido de las celdas con números o textos en
color azul.
107
Datos
Lista las variables que usted desea analizar
Etiqueta eje X
Punto medio de clase
Clases (Intervalo, Punto medio)
Estilo de gráfico
Barras
Líneas
Histograma
Diagrama de frecuencia
multivariable
Etiquetas eje X
Límite superior de clase
Clases: intervalo, punto
medio
Etiquetas eje Y
Frecuencia absoluta,
porcentaje, proporción,
acumulada
Este gráfico permite determinar visualmente el tipo y grado de correlación entre las variables
analizadas.
109
Análisis de residuos
Corrección por
autocorrelación
de resago 1.
112
Comparación de modelos
Predicción o estimación
Para un alfa de 0.05, solo las variables Coronado y Zarcero son estadísticamente significativas
y por tanto, en un caso real, el modelo debería ajustarse nuevamente pero utilizando solo dichas
variables y luego utilizarlo para realizar predicciones.
Otras herramientas
Mediciones repetidas
Mediciones repetidas.
En cada estación se
mide la lluvia durante 18
años.
Intervalo de
confianza 95%.
Análisis de varianza
115
Regresión no lineal
116
Nota: Esta sección del tutorial asume que usted ya activó el complemento de XLStatisticis
(XLStatistics.xlam ó XLStats.xls); de no ser así, ver página 23.
2. Haga un clic sobre XLStatistics y luego otro clic sobre . Observe que el programa
abre el libro de cálculo nNum1Cat.xls y copia los datos seleccionados a dicho libro.
En la sección inferior del libro de cálculo nNum1Cat.xls usted observará cuatro hojas de
cálculo:
Nota: Recuerde que SOLO debe modificar el contenido de las celdas con números o textos en
color azul.
Datos
Lista de los datos
117
Eje X
Límite superior
Clases
Intervalo de clase
Punto medio
Estilo:
Barra, línea, histograma
Barras de error:
Rango
Desv. Estándar
Error estándar
Intervalo de confianza
118
Nota: Esta sección del tutorial asume que usted ya activó el complemento de XLStatisticis
(XLStatistics.xlam ó XLStats.xls); de no ser así, ver página 23.
1. Abra el archivo “xlstats_tutorial.xlsx”, vaya a la pestaña “ncat” y seleccione las columnas ENOS,
Década, Clase.
2. Haga un clic sobre XLStatistics y luego otro clic sobre . Observe que el programa abre el
libro de cálculo nCat.xls y copia los datos seleccionados a dicho libro.
En la sección inferior de la hoja de cálculo nCat.xls usted observará cuatro hojas de cálculo:
Nota: Recuerde que SOLO debe modificar el contenido de las celdas con números o textos en
color azul.
Datos
Lista de los datos
119
Tabla dinámica
La tabla muestra la
frecuencia por episodio
de ENOS y Década
para la totalidad de las
observaciones.
La tabla muestra la
frecuencia en porciento
por episodio de ENOS y
Década para los años
clasificados como
lluviosos.
Nota: Esta sección del tutorial asume que usted ya activó el complemento de XLStatisticis
(XLStatistics.xlam ó XLStats.xls); de no ser así, ver página 23.
En la sección inferior del libro de cálculo 1NumnCat.xls usted observará tres hojas de cálculo:
Nota: Recuerde que SOLO debe modificar el contenido de las celdas con números o textos en
color azul.
Datos
Tablas dinámicas
Usted puede elegir entre
frecuencia, mínimo, máximo,
media y desviación estándar
por clase y década.
La tabla muestra la
precipitación media
anual por episodio de
ENOS y Década para
los años clasificados
como lluviosos.
Si lo desea puede
expresar los resultados
en forma gráfica.
La tabla muestra la
precipitación media
anual por episodio de
ENOS y Década para
los años clasificados
como secos.
122
Nota: Esta sección del tutorial asume que usted ya activó el complemento de XLStatisticis
(XLStatistics.xlam ó XLStats.xls); de no ser así, ver página 23.
2. Seleccione y copie la columna d (cm), luego pegue los datos en la columna borde. Observe
que el programa abre el libro de cálculo SampSel.xls y copia los datos seleccionados a dicho
libro.
En la sección inferior de la hoja de cálculo SampSel.xls usted observará cinco hojas de cálculo:
Nota: Recuerde que SOLO debe modificar el contenido de las celdas con números o textos en
color azul.
A continuación utilizaremos la hoja “Sample Selection” para seleccionar una muestra aleatoria
con reemplazo de 36 observaciones de las 66 observaciones de arboles de borde.
Usted puede elegir entre una muestra aleatoria con y sin reemplazo; así como el tamaño de la
muestra. En este caso hemos elegido 36 observaciones porque existen 36 árboles de borde en la
parcela y el objetivo del muestreo es preparar los datos para realizar una prueba de hipótesis
sobre el efecto de borde en la parcela.
123
Referencias
Análisis univariante
Número y Tipo de Hipótesis nula Prueba(s)
tipo de resultado (H0)
variables
predictoras
Ninguna normal Prueba “t” para una muestra.
variable
predictora no-normal Prueba del signo; prueba de signos para
una muestra (one-sample median/ sign
test).
Muestras independientes
Datos de muestras independientes
Variable producto
Nominal Categorías Ordinal Cuantitativa Cuantitativa No Cuantitativa
(>2 Discreta Normal Normal
Categorías)
Insumo Nominal Mann- Mann-Whitney; Prueba “t” de
o Prueba de Whitney test de log- Estudiante
Fisher (tablas de tendencia
o Mann- rango (prueba
contingencia y de Mantel-
muestras Whitney
Haenszel) (a)
pequeñas)
Categorías (>2 Kruskal- Kruskal- Kruskal-Wallis Análisis de
categorías) Wallis (b) Wallis (b) (b) varianza de una
vía (c)
Ordinal (categorías (e) Orden de Orden de Orden de Coef.
ordenadas) tendencia o Spearman Spearman Spearman Correlación de
Mann-Whitney órdenes de
Spearman o
regresión lineal
(d)
Cuantitativa Discreta Regresión logística (e) (e) Orden de Orden de Coef.
Spearman Spearman Correlación de
órdenes de
Spearman ó
regresión lineal
(d)
Cuantitativa No Normal Regresión logística (e) (e) (e) Graficar datos, Graficar datos,
Coef. Coef.
Correlación de Correlación de
rangos de Pearson, Coef.
Spearman o Correlación de
Coef. órdenes de
Correlación Spearman y
lineal de regresión lineal
Pearson.
133
Cuantitativa Normal Regresión logística (e) (e) (e) Regresión lineal Coef.
(d) Correlación
lineal de
Pearson y
regresión lineal
(b) La prueba de Kruskal-Wallis es una generalización de la prueba de U de Mann-Whitney y se utiliza para comparar variables ordinales
o nominales
(c) El análisis de varianza de una vía se utiliza para comparar variables con una distribución normal para tres o más grupos. El
equivalente no paramétrico es la prueba de Kruskal-Wallis.
(d) Si la variable de resultado es la variable dependiente, entonces siempre los residuos son plausiblemente normales y por tanto la
distribución de la variable independiente no es importante.
(e) Hay una serie de técnicas más avanzadas, tales como la regresión de Poisson, para hacer frente a estas situaciones. Sin embargo,
requieren ciertas suposiciones por lo que a menudo es más fácil ya sea expresar la variable resultado como dicotómica o tratarla como
una variable continua.
Fuente: http://www.bmj.com/collections/statsbk/13.dtl
134
135
Sawilowsky, Shlomo S. 2002. Fermat, Schubert, Einstein, and Behrens–Fisher: The Probable
Difference Between Two Means When σ1 ≠ σ2. Journal of Modern Applied Statistical Methods,
1(2).
*: Poder de las pruebas es bajo cuando N1 y N2 son muy diferentes. Evitar utilizar corrección de
Welch cuando N1 y N2 son muy diferentes, ya que la prueba tiene poco poder.
**: La prueba “t” basado en permutaciones es preferible, ya que corrige error tipo I y tiene mas
poder.
Kingman A, Zion G. 1994. Some power considerations when deciding to use transformations.
Stat Med. 15; 13(5-7):769-83.
137
Neuhäuser M. 2005. One-sided nonparametric tests for ordinal data. Percept Mot
Skills.101(2):510-4.
Sawilowsky, Shlomo S. 2002. Fermat, Schubert, Einstein, and Behrens–Fisher: The Probable
Difference Between Two Means When σ1 ≠ σ2 Journal of Modern Applied Statistical Methods,
1(2).
Sawilowsky, S. S., & Hillman, S. B. 1992. Power of the independent samples t test under a
prevalent psychometric measure distribution. Journal of Consulting and Clinical Psychology, 60,
240-243.
Correa Juan Carlos, Iral René y Rojas Lucinia. 2006. Estudio de potencia de pruebas de
homogeneidad de varianza. Revista Colombiana de Estadística. Volumen 29 No 1. pp. 57 a 76.
138
intervalo de - 1 - Describir exactitud de la Se puede utilizar para Apropiada para cualquier variable
confianza estimación de la media realizar pruebas de cuantitativa.
aritmética. hipótesis.
ANOVA de un 1 1 - Probar la hipótesis que El modelo de efectos Comparar la media del contenido de
factor o una vía, los valores medios de la fijos o modelo “I” metales pesados en los peces de los
modelo I variable cuantitativa son asume que los datos ríos Reventazón, Pacuare, Grande de
iguales entre los provienen de Térraba y Grande de Tárcoles para ver
diferentes grupos. poblaciones normales si hay diferencias en el nivel de
El investigador(a) las cuales podrían contaminación.
selecciona, basado en su diferir únicamente en
opinión, juicio o prejuicio, sus medias.
K valores de interés de la
variable independiente
(VI).
ANOVA de un 1 1 - Estimar la proporción de En el Modelo “II” o de Comparar la media del contenido de
factor o una vía, la varianza en la variable efectos aleatorios solo metales pesados en 5 familias de
modelo II continua explicada por la se eligen algunos de peces criados bajo las mismas
variable nominal. El los posibles niveles de condiciones para determinar si existe
investigador(a) interés de la variable una variación heredada con respecto a
selecciona, utilizando un nominal y por esta la fijación de metales pesados.
procedimiento al azar, K razón la partición de
de los posibles valores de varianza es más
la variable independiente interesante que
(VI). determinar qué grupos
son diferentes.
Método 1 1 - Prueba a posteriori Es deseable realizar Comparar, por ejemplo, la media del
secuencial de planeada no ortogonal o comparaciones contenido de metales pesados en los
Dunn-Sidák no independiente entre planeadas peces de los ríos
grupos. Se realiza una ortogonales. Decidir Reventazón+Pacuare Vs Grande de
vez que el ANOVA antes de realizar el Térraba + Grande de Tárcoles.
140
Referencias
Intuitive Biostatistics: Choosing a statistical test. http://www.graphpad.com/www/Book/Choose.htm. Capítulo 37 del libro “Intuitive
Biostatistics” (ISBN 0-19-508607-4) de Harvey Motulsky. Copyright © 1995 by Oxford University Press Inc.
Statistics at Square One. Study design and choosing a statistical test. http://www.bmj.com/statsbk/13.dtl
144
MATLAB The MathWorks 2009b, September Depends on many things. No Proprietary CLI/GUI
4, 2009
MedCalc Frank Schoonjans August 3, 2009 $395 No Proprietary GUI
modelQED marketingqed June 15, 2007 No Proprietary GUI
Minitab Minitab Inc. January 10, 2007 $1195[2] No Proprietary CLI/GUI
MRDCL MRDC January 04, 2008 $4000[2] No Proprietary CLI/GUI
NCSS NCSS Statistical >$399 No Proprietary GUI
Software
NMath Stats CenterSpace November 2009 ($1295)[2] No Proprietary CLI
Software
NumXL Spider Financial October 2009 Lite version (Free), Professional edition ($300) [2] No Proprietary GUI
OpenEpi A. Dean, K. May 20 2009 Free Sí GNU GPL GUI
Sullivan, M. Soe
Origin OriginLab $699 No Proprietary GUI
Ox OxMetrics, J.A. August 2009 Free for Academic use No Proprietary CLI
programming Doornik
language
OxMetrics OxMetrics, J.A. August 2009 $1805-... No Proprietary CLI/GUI
Doornik
Partek Partek June 2007 No Proprietary GUI
Primer Primer-E February 2007 $500-$1000 No Proprietary GUI
PSPP pspp October 11, 2009 Free Sí GNU GPL CLI/GUI
R R Foundation April, 2010 Free Sí GNU GPL CLI/GUI[6]
R Commander[7] John Fox August 1, 2006 Free Sí GNU GPL CLI/GUI
RATS Estima October 1, 2007 $500 No Proprietary CLI/GUI
RKWard[7] RKWard February 15, 2007 Free Sí GNU GPL GUI
Community
SalStat Alan James Salmoni February 2007 Free Sí GNU GPL GUI
SAGE >100 developers 4.3, December Free Sí GNU GPL CLI &
worldwide 2009 GUI
SAS SAS Institute March 2008 Commercial: ~$6000 per seat (PC version) / ~$28K per No Proprietary CLI/GUI
processor (Windows server) first-year fees for BASE,
STAT, GRAPH, and ACCESS modules. Modules are
licensed individually. Subsequent year fees are roughly
half. [2]
SHAZAM Elastix Ltd July 2007 Pro $490 / Std. $390 / Site Lic: / Std. $1200 / Pro $1600 No Proprietary CLI/GUI
SOCR UCLA October 28, 2008 Free Sí none stated GUI
SOFA Statistics Grant Paton- April 2010 Free Sí AGPL GUI
Simpson
146
Sistemas operativos
Product Windows Mac OS Linux BSD Unix
AcaStat Sí No No No No
ADaMSoft Sí Sí Sí Sí Sí
Analyse-it Sí No No No No
Auguri Sí No No No No
Autobox Sí No Sí No Sí
BioStat Sí No No No No
BMDP Sí
BrightStat Sí Sí Sí No Sí
Dataplot Sí Sí Sí Sí Sí
EasyReg Sí No No No No
Epi Info Sí No No No No
147
StatPlus Sí Sí No No No
StatsDirect Sí No No No No
SYSTAT Sí No No No No
Total Access Statistics Sí No No No No
UNISTAT Sí No No No No
The Unscrambler Sí No No No No
VisualStat Sí No No No No
Winpepi Sí No No No No
WinSPC Sí No No No No
XLStat Sí Sí No No No
XploRe Sí No Sí No Sí
ANOVA
Product One-Way Two-Way MANOVA GLM Post-hoc Tests Latin Squares Analysis
AcaStat No No No No No No
ADaMSoft No No No No No No
Analyse-it Sí Sí No No Sí No
Auguri Sí Sí No No No No
Autobox No No No No No No
BioStat Sí Sí Sí Sí Sí No
BMDP Sí Sí Sí Sí Sí
BrightStat Sí Sí No Sí Sí No
EasyReg No No No No No No
Epi Info Sí Sí No No No No
EViews Sí
GAUSS No No No No No
GenStat Sí Sí Sí Sí Sí Sí
Golden Helix Sí Sí
GraphPad Prism Sí Sí No No Sí No
gretl
Mathematica Sí Sí Sí Sí Sí No
MedCalc Sí Sí No Sí Sí No
Minitab Sí Sí Sí Sí Sí Sí
NCSS Sí Sí Sí Sí Sí Sí
NMath Stats Sí Sí No No No No
OpenEpi Sí No No No No No
Origin Sí Sí No No No No
Partek Sí Sí Sí Sí Sí Sí
149
PSPP Sí Sí Sí Sí Sí Sí
R Sí Sí Sí Sí Sí
R Commander Sí Sí Sí
Sage Sí Sí Sí Sí Sí
SAS Sí Sí Sí Sí Sí
SHAZAM Sí Sí No Sí Sí No
SOCR Sí Sí No No Sí Sí
SOFA Statistics Sí No No No No No
Stata Sí Sí Sí Sí Sí
Statgraphics Sí Sí Sí Sí Sí Sí
STATISTICA Sí Sí Sí Sí Sí Sí
StatIt Sí Sí Sí Sí Sí No
StatPlus Sí Sí Sí Sí Sí Sí
SPlus Sí Sí Sí Sí Sí Sí
SPSS Sí Sí Sí Sí Sí Sí
StatsDirect Sí Sí No No Sí Sí
Statistix Sí Sí Sí Sí Sí Sí
SYSTAT Sí Sí Sí Sí Sí Sí
Total Access Statistics Sí Sí No No No No
UNISTAT Sí Sí No Sí Sí Sí
The Unscrambler Sí No No No No No
VisualStat Sí Sí Sí No Sí No
Winpepi No No No No No No
WinSPC Sí Sí No No No No
XLStat Sí Sí Sí Sí Sí No
Correlación y regresión
Product OLS WLS 2SLS NLLS Logistic GLM LAD Stepwise Quantile regression Probit Poisson MLR
AcaStat
ADaMSoft Sí No No Sí Sí No No No
Analyse-it Sí
Auguri Sí Sí No Sí
Autobox Sí Sí Sí
BioStat
BMDP Sí Sí Sí
BrightStat Sí Sí Sí
EasyReg Sí Sí Sí
Epi Info Sí No No No Sí No No No
150
EViews Sí Sí Sí Sí Sí Sí Sí Sí Sí Sí Sí
GAUSS No No
Golden Helix Sí Sí
GraphPad Prism Sí Sí No Sí No No No No No No No
gretl Sí Sí Sí Sí Sí No Sí Sí Sí Sí Sí
Mathematica Sí Sí Sí Sí[9] Sí[10] Sí Sí[11] Sí
MedCalc Sí No No Sí Sí No No Sí
Minitab Sí Sí No No Sí No No Sí No
NCSS Sí Sí Sí
NMath Stats Sí Sí Sí Sí
Origin
Partek Sí No No No No Sí No Sí
PSPP
R Sí Sí Sí Sí Sí Sí Sí Sí Sí Sí Sí Sí
R Commander[7] Sí Sí No
RATS Sí Sí Sí Sí Sí No Sí Sí Sí
Sagata Sí Sí No No No No Sí Sí
Sage Sí Sí Sí Sí Sí Sí Sí Sí Sí Sí Sí
SAS Sí Sí Sí Sí Sí Sí Sí Sí Sí
SHAZAM Sí Sí Sí Sí Sí Sí Sí Sí Sí Sí Sí Sí
SOCR Sí No No No Sí No No No
SPlus Sí Sí Sí Sí Sí No
SPSS Sí Sí Sí Sí Sí Sí No Sí No
Stata Sí Sí Sí Sí Sí Sí Sí Sí Sí Sí Sí Sí
Statgraphics Sí Sí No Sí Sí Sí No Sí
STATISTICA Sí Sí Sí Sí Sí Sí Sí Sí No
StatIt
StatPlus Sí No Sí Sí Sí Sí No Sí
StatsDirect Sí Sí Sí Sí
Statistix
SYSTAT Sí Sí Sí Sí Sí Sí Sí Sí No
Total Access Statistics Sí Sí
UNISTAT Sí Sí Sí Sí Sí Sí No Sí Sí Sí
The Unscrambler
VisualStat
Winpepi Sí Sí
XLStat Sí Sí Sí Sí Sí Sí
151
Product ARIMA GARCH Unit root test Cointegration test VAR Multivariate GARCH
AcaStat
Analyse-it
Auguri Sí
Autobox Sí
BioStat
BMDP Sí
EasyReg Sí Sí Sí Sí
EViews Sí Sí Sí Sí Sí Sí
GAUSS
GraphPad Prism No No No No No
gretl Sí Sí Sí Sí Sí
Mathematica Sí Sí Sí
MedCalc No No No No No
Minitab Sí No No No No
NCSS Sí
NumXL Sí Sí
NMath Stats
Origin
PSPP
R Sí Sí Sí Sí Sí
R Commander[7]
RATS Sí Sí Sí Sí Sí Sí
Sage Sí Sí Sí Sí Sí Sí
SAS
SHAZAM Sí Sí Sí Sí Sí No
SOCR No No No No No
Stata Sí Sí Sí Sí Sí Sí
Statgraphics Sí No No No No
STATISTICA Sí No No No No
StatIt
StatPlus Sí No No No No
SPlus Sí Sí
SPSS Sí
StatsDirect
Statistix
SYSTAT Sí
152
Gráficos
Chart Bar chart Box plot Correlogram Histogram Line chart Scatterplot
AcaStat No No Sí Sí Sí Sí
ADaMSoft
Analyse-it
Auguri Sí Sí Sí Sí Sí Sí
Autobox Sí Sí Sí
BioStat Sí Sí Sí Sí Sí Sí
BMDP Sí Sí
BrightStat Sí Sí No Sí Sí Sí
EasyReg
Epi Info Sí No No Sí Sí Sí
EViews Sí Sí Sí Sí Sí Sí
GAUSS
Golden Helix
GraphPad Prism Sí Sí Sí Sí Sí Sí
gretl Sí Sí Sí Sí Sí Sí
Mathematica Sí[12] Sí[13] Sí[14] Sí[15] Sí[16][17]
MedCalc Sí Sí Sí Sí Sí
Minitab Sí Sí Sí Sí Sí Sí
NCSS Sí Sí Sí Sí Sí Sí
NMath Stats
Origin Sí Sí Sí Sí Sí
Partek
PSPP
R Sí Sí Sí Sí Sí Sí
R Commander
Sage Sí Sí Sí Sí Sí Sí
SAS Sí Sí Sí Sí Sí Sí
SHAZAM Sí Sí Sí Sí Sí Sí
SOCR Sí Sí Sí Sí Sí Sí
Stata Sí Sí Sí Sí Sí Sí
Statgraphics
153
STATISTICA Sí Sí Sí Sí Sí Sí
StatIt
StatPlus Sí Sí Sí Sí Sí Sí
SPlus
SPSS Sí Sí Sí Sí Sí Sí
StatsDirect
Statistix
SYSTAT
Total Access Statistics
UNISTAT Sí Sí Sí Sí Sí Sí
The Unscrambler Sí Sí Sí Sí
VisualStat
Winpepi
XLStat Sí Sí Sí Sí Sí Sí
Otros análisis
Producto s/w Descriptive Nonparametric Qua- Surv- Data
type Statistics Statistics lity ival Processing
[18]
base norm- CTA nonpara- Con- Anal- cluster discri- BDP Ext.
[19] [21] [22] [23]
stat. ality metric comp., trol ysis anal- minant
tests [20] ANOVA ysis anal-
ysis
AcaStat S + - - - - - - - - -
Analyse-it X + + + + - - - - + +
Auguri S + + - - - - - - + +
BioStat S + + + + - + - - + +
BMDP + + + + + + +
BrightStat + + + + - + - - + +
EasyReg S + - - - - +? - - + +
Epi Info S + - + + - + - - + +
Gauss St + + - - - - - - + +
Golden Helix S + + - + + - + - - -
GraphPad Prism S + + - + - + - - - -
Mathematica S + + + + - - + - + +
MedCalc S + + + + + + - - + +
154
Minitab S + + + + + + + + + +
NCSS S + + + + + + + + + +
NMath Stats S + + - - - - + - - -
OpenEpi S + - + - - - - - - -
Origin S + + - - + +- - - + +
Partek S + + + + + + + + + +
PSPP S + +
RATS S + + - - - - - - + +
SAS S + + + + + + + + + +
SHAZAM S + + - - - - - - + +
SOCR S + + + + - + + - + +
SOFA Statistics S - + + - - - - - -
Stata S + + + + + + + + + +
Statgraphics S + + + + + + + + + +
STATISTICA S + + + + + + + + + +
StatIt S + + + + + + + + N/A N/A
StatPlus S + + + + + + - - + +
SPlus St + + + + + - + + + +
SPSS S + + + + + + + + + +
StatsDirect S + + + + + + - - N/A N/A
Statistix 2008 + + + + + + - - + +
SYSTAT S + + + + + + + + + +
Total Access A + + + + - - - - + +
Statistics
UNISTAT S + + + + + + + + + +
The Unscrambler S + +
VisualStat S + + - + - - - - + -
Winpepi S + + + + - + + - - -
XLStat X + + + + - + + + N/A +
Notas
1. ^ a b c Promo price. Check for availability. Regular prices are higher by up to 50%.
155
Referencias
"A Short Preview of Free Statistical Software Packages for Teaching Statistics to Industrial Technology Majors" Ms. Xiaoping Zhu and Dr.
Ognjen Kuljaca. Journal of Industrial Technology, (Volume 21-2, April 2005).
http://gsociology.icaap.org/methods/soft.html
http://en.citizendium.org/wiki/Free_statistical_software
http://statpages.org/javasta2.html