0% encontró este documento útil (0 votos)
44 vistas37 páginas

Tesis Final

Este estudio propone una metodología no paramétrica para el análisis de datos ordinales en diseños de bloques con parcelas divididas, utilizando simulaciones de Monte Carlo. Se comparan los resultados de análisis paramétricos y no paramétricos, encontrando que ambos enfoques ofrecen resultados similares en ciertas condiciones. La investigación justifica el uso de la metodología no paramétrica en situaciones donde los supuestos de normalidad no se cumplen.

Cargado por

spuzzar
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
44 vistas37 páginas

Tesis Final

Este estudio propone una metodología no paramétrica para el análisis de datos ordinales en diseños de bloques con parcelas divididas, utilizando simulaciones de Monte Carlo. Se comparan los resultados de análisis paramétricos y no paramétricos, encontrando que ambos enfoques ofrecen resultados similares en ciertas condiciones. La investigación justifica el uso de la metodología no paramétrica en situaciones donde los supuestos de normalidad no se cumplen.

Cargado por

spuzzar
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

RESUMEN

En este estudio se intenta encontrar una alternativa al anlisis de datos ordinales


provenientes de un diseo en bloque con arreglo de parcelas divididas, para ello se utiliz
una poblacin simulada por el mtodo de Mote Carlo de 1000 datos como base para estima
a travs de 100 muestras de 72 datos cada una un grupo de datos usando las medias
muestrales que permiti probar los supuestos de normalidad y de esta manera clasificar los
datos en dos grupos uno que cumpla con los supuestos y que se anlisis de forma
tradicional, otro que incumpla con los supuestos y que se trasform a escala ordinal por la
metodologa de la transformacin de rangos alineados, resolviendo sus anlisis por la
misma metodologa tradicional y por la metodologa propuesta del efecto de parcela
principal evaluado por la prueba de Kruskal-Wallis, el efecto de la sub-parcela por la
prueba Friedman y la interaccin por medio del estadstico propuesto por . Encontrando que
la metodologa propuesta da resultados parecidos a los encontrados por los datos muestrales
por va paramtrica, es por ello que se justifica su uso en situaciones de violacin de
supuestos por datos provenientes de diseos en bloque con arreglo de parcelas divididas.

Palabras Claves: Kruskal-Wallis, Friedman, Rangos alineados, parcelas divididas

1. INTRODUCCIN

El avance de las metodologas estadsticas han desarrollado modos o formas de


estudiar la realidad de un experimento, estas metodologas a grosso modo seran los diseos
experimentales, pero en un modo ms simple son los modelos estadsticos, aplicados con el
fin de explicar la verdad que subyace alrededor de los resultados. Para Handam G, Niijad
(1993) el modelo "es una definicin de trminos verbales o matemticos de las relaciones
de interdependencia existente entre las diferentes partes de un sistema que ser lo
suficientemente clara y explcita, tal que permita estudiar el sistema considerando de
acuerdo con su comportamiento en diferentes circunstancias y ms an, que nos permita
discutirlo y predecir sus resultados futuros."

Un modelo estadstico es una expresin simblica en forma de igualdad o ecuacin


que se emplea en todos los diseos experimentales y en la regresin para indicar los
diferentes factores que modifican la variable de respuesta, estos modelos pueden ser
clasificados segn los efectos que se estudian con ellos, de esta forma podran ser
clasificados como: modelo de efectos fijos es un modelo estadstico que representa las
cantidades observadas en las variables explicativas que son tratadas como si las cantidades
fueran no-aleatorias; modelo de efectos aleatorios, tambin conocido como modelo de
componentes de la varianza, es una especie de modelo lineal jerrquico. Se supone que el
conjunto de datos que se analiza consiste en una jerarqua de diferentes poblaciones cuyas
diferencias se refieren a esa jerarqua y modelo mixto en los que todas o algunas de las
variables explicativas son tratadas como si se derivaran de causas aleatorias.
Vale la pena destacar que muchos estudios utilizan diseos que requieren modelos
de anlisis de varianza con dos o ms tipos de errores experimentales. Ejemplos de ellos
son usados en arreglos de parcelas divididas, diseos factoriales y modelos de regresin.
Anteriormente,

tales

estudios

han

sido

analizados

utilizando

procedimientos

computacionales apropiados para modelos de efectos fijos modificados, con el fin de


obtener la estadstica relevante. En este sentido, la experimentacin dentro de la
investigacin cientfica es muy amplia, la cantidad y tipos de experimentos que se pueden

realizar son muy grandes. Uno de estos tipos de experimentos lo constituye el arreglo de
tratamiento factorial o experimentacin factorial como es conocido tradicionalmente.
Para darle sentido a esos modelos se estudi su estructura o diseo, dando como
resultados diferentes categoras de diseos, se podra mencionar el diseo de tipo factorial
que es un experimento cuyo diseo consta de dos o ms factores, cada uno de los cuales
con distintos valores o niveles, cuyas unidades experimentales cubren todas las posibles
combinaciones de esos niveles en todo los factores. Este tipo de experimentos permiten el
estudio del efecto de cada factor sobre la variable respuesta, as como el efecto de las
interacciones entre factores sobre dicha variable.

El arreglo de parcelas divididas, es un arreglo factorial, conducido de tal manera que


la unidad experimental con respecto a uno o ms factores sea una sub-unidad de la unidad
experimental con respecto a otros factores. Los experimentos con arreglos de parcelas
divididas son frecuentemente usados cuando un factor debe ser aplicado a una gran unidad
experimental (estrato), mientras que otros factores son ms apropiados aplicarlos a las subunidades. Tambin este diseo es utilizado por la conveniencia o facilidad de aplicar
diferentes factores a diferentes unidades con tamaos distintos. El arreglo de parcelas
divididas tambin puede ser usado con la finalidad de incrementar la precisin del efecto
estimado, esto por la aplicacin de un factor a las sub-unidades.

Por consiguiente, los arreglos en parcelas divididas han resultado de mucha utilidad
para realizar estudios en las ms diversas reas de la investigacin cientfica, como es el
caso de Espinosa et al (2008) donde estudiaron las concentraciones sricas promedio de
insulina y somatotropina se analizaron a travs de un diseo de parcelas divididas en el
tiempo, Hervert et al (2007) que utilizo diseo de parcelas divididas para determinar los
factores que influyen en la velocidad de corrosin y en varios estudios psicologicos.

En el caso particular de la investigacin experimental en agricultura, sus


aplicaciones con diferentes disposiciones de los tratamientos principales son resaltadas por
autores de gran trayectoria investigativa como Steel y Torrie (1960), Cochram y Cox
(1976), Pimentel (1976), De Campos (1984), Martnez (1988), entre otros. Sin embargo,
3

para Canavos, (1988) en un ambiente de incertidumbre, los experimentos son, en forma


general, comparativos en el sentido de que, idealmente miden y comparan las respuestas de
unidades experimentales esencialmente idnticas, despus de que estas se exponen a los
tratamientos seleccionados y aplicados por el investigador.
No obstante, las variables respuestas estudiadas en el experimento pueden presentar
caractersticas, que deben ser consideradas a la hora de realizar los anlisis planificados,
estas variables respuestas pueden ser variables en escala cuantitativa, que se pueden dividir
a su vez en aquellas que cumplen con los supuestos exigidos por el anlisis de varianza, la
tcnica adecuada para poder analizar la informacin, aquellas que se miden en esta escala y
n cumplen con los supuestos a las cuales se considera transformar para que logren cumplir
con ellos y a aquellas que son medidas en escala ordinal y son el centro de esta
investigacin.

Es importante hacer referencia a que el anlisis convencional de los datos


experimentales se basa en los supuestos de: normalidad, independencia e igualdad de
varianzas. Existen muchas situaciones experimentales donde estos supuestos no se
cumplen, especialmente el de normalidad. La mayora de los mtodos en estos casos estn
basados en estudios por rangos y su estadstica. Otra de las razones para el uso de la
estadstica por rangos es lo expuesto por Conover e Iman (1976), que los rangos se acercan
aproximadamente a una distribucin normal cuando n (cantidad de elementos) incrementa.

Es de notar que muchos estudios matemticos y estadsticos en los ltimos tiempos,


estn ms interesado en los anlisis no paramtricos cuando los paramtricos no pueden ser
usados, y estn desarrollando investigaciones que permitan establecer las condiciones para
su uso, los niveles de aceptacin de sus resultados y la comprobacin de tcnicas
estadsticas conocidas con datos de tipo ordinal. Asimismo, las pruebas no paramtricas de
que dispone la literatura cubren varios procedimientos, entre ellos se pueden mencionar:
diseos completamente al azar, diseos de bloques completamente al azar, diseos de
bloques incompletos, diseos para bioensayos, arreglos de parcelas divididas, diseos de
cross-over.

Por lo expuesto anteriormente, el presente trabajo pretende evaluar alternativas no


paramtricas para datos medidos en escala ordinal provenientes de arreglos en parcelas
divididas.

2. OBJETIVOS

2.1 OBJETIVO GENERAL:


Evaluar alternativas no paramtricas para el anlisis de datos medidos en escala ordinal
provenientes de arreglos en parcelas divididas en diseos de bloque al azar.

2.2 OBJETIVOS ESPECFICOS:

2.2.1. Describir las metodologas estadsticas paramtricas de arreglos en parcelas divididas


en diseos de bloque al azar.

2.2.2 Proponer metodologas estadsticas no paramtricas como alternativas para datos


medidos en escala ordinal provenientes de arreglos en parcelas divididas en diseos de
bloque al azar.

2.2.3 Aplicar las metodologas estadsticas no paramtricas como alternativas de anlisis en


datos medidos en escala ordinal provenientes de arreglos en parcelas divididas en diseos
de bloque al azar.

2.2.4 Contrastar las metodologas estadsticas no paramtricas y paramtrica de arreglos en


parcelas divididas en diseos de bloque al azar con base a valores de probabilidad y
respuestas en la hiptesis.

3. REVISIN DE LITERATURA
En este captulo se aclararan los conceptos necesarios para lograr una buena
comprensin del presente trabajo. Conceptos que abarcan desde el diseo de experimentos
hasta la simulacin. Se explicar lo que es el anlisis de varianza, o tambin conocido como
ANAVAR, para el diseo parcelas divididas con bloques al azar, tambin se describir la
prueba de kruskal wallis, y la prueba de friedman, esto con el fin de lograr mostrar las
mejoras producidas por estas al anlisis propuesto. De la misma manera se describirn
conceptos que se incluirn en este trabajo, dichos conceptos son: contrastes, p-value,
Simulacion de Monte Carlo.
Antecedentes
Espinosa et al (2008) utilizo un arreglo en parcelas divididas para estudiar las
concentraciones sricas promedio de insulina y somatotropina en el tiempo. Los trminos
incluidos en el modelo fueron tratamiento, animal dentro de tratamiento, tiempo de
muestreo y la interaccin tratamiento x tiempo. Cuando la interaccin no result
significativa nicamente se reportaron los efectos principales. El efecto principal de la
parcela completa fue evaluado usando al animal dentro de tratamiento como trmino
especfico del error. Los efectos de las subparcelas tiempo y tratamiento x tiempo fueron
probados usando el error residual.
En 2007 Hervert et al, utilizo un diseo de parcelas divididas con el objeto
determinar si la velocidad de corrosin presentada en vigas de concreto reforzado en
presencia de NaCl (Cloruro de Sodio) y Na2SO4 (Sulfato de Sodio) al 3.5 %, este
procedimiento permiti analizar la solucin a la que estn expuestas las vigas, la condicin
de la varilla, y las diferentes vigas de manera conjunta y con ello determinar cul de estos
factores afecta de manera significativa el comportamiento de la velocidad de corrosin.
Ellos concluyeron que la velocidad de corrosin presentada por las vigas expuestas en
ambas soluciones no es estadsticamente diferente, debido a que el comportamiento
presentado por las vigas inmersas en cada solucin es estadsticamente semejante, adems
el sistema de zonas protegidas y no protegidas en las vigas bajo estudio, no tuvieron
ninguna influencia en las mediciones de velocidad de corrosin de dichas vigas
6

Existe una amplia diversidad de pruebas no paramtricas, las cuales pueden ser
utilizadas dependiendo de los objetivos y los juegos de hiptesis planteados en un estudio
especfico, con la finalidad de establecer conclusiones sobre el comportamiento de las
variables bajo estudio. Hotelling y Pabst (1934), realizan un trabajo, que se basa en el uso
de las permutaciones, para crear un estadstico que permita comparar dos muestras
medidas en escala ordinal; este trabajo es catalogado por muchos autores como uno de los
avances significativos dentro de la inferencia estadstica no paramtrica
Mood y Graybill (1972) afirman que, al aplicar mtodos estadsticos resulta
necesario conocer, al menos aproximadamente, la forma general de la distribucin que
siguen los datos que se estudian y que, si sta es normal, se podr usar directamente los
mtodos paramtricos, pero en caso contrario se deber transformar los datos, de modo que
las observaciones transformadas sigan la distribucin normal. Y, que cuando se desconozca
la forma de la distribucin, se deber usar mtodos ms generales, llamado distribucin
libre o no paramtricos.
En este orden de ideas, Freud y Walpole, (1990) sealan que las pruebas no
paramtricas deben utilizarse cuando no se cumplan los supuestos para hacer una prueba
paramtrica y en una muestra pequea, cuando se duda su cumplimiento. La principal
ventaja de las pruebas no paramtricas consiste en que pueden efectuarse inferencias
exactas cuando las suposiciones fundamentales de los mtodos estndar no pueden
cumplirse en su totalidad; su principal desventaja radica en que exigen demasiada
informacin y tienen una eficiencia menor cuando todas las suposiciones se satisfacen.
Con la finalidad de probar la efectividad de las pruebas no paramtricas, Thompson
y Parmer (1995), aplicaron cuatro pruebas no paramtricos a un grupo de datos dispuestos
en paneles (Split). Estas pruebas fueron: Mann-Whitney, el test de los signos por rango de
Wilcoxn y el test de Quade, con la finalidad de estimar diferencias entre los paneles. Ellos
concluyeron, que cuando era dudoso el supuesto de normalidad, los test no paramtricos
tenan mayor poder que sus contrapartes paramtrica.

En este mismo orden de ideas, los trminos estadsticas no paramtrica o mtodos


libres de distribucin, hacen referencia a una coleccin de pruebas estadsticas en las cuales
no se hacen suposiciones acerca de la distribucin de la poblacin de donde provienen los
datos; hay algunas suposiciones que se asocian a la mayora de las tcnicas o pruebas
estadsticas no paramtrica como son: la independencia de las observaciones, la continuidad
bsica de la variable, entre otras. En general, estas suposiciones son menores y son ms
dbiles que las asociadas con la estadstica paramtrica. (Hettmansperger, Mckean y
Shearther, 2000).

Tambien, Beasley y Zumbo (2003), en sus investigaciones compararon la prueba de


Rangos de Friedman contra mtodos paramtricos, evaluando la interaccin en diseo de
parcelas divididas. Ellos encontraron que cuando la estructura de covarianza no es esfrica,
se incrementa el error tipo I en la prueba F en anlisis uni variantes cuando el tamao de
muestra es muy pequeo, cuando no hay una buena distribucin del error y cuando los
datos son ordinales.
La metodologa no paramtrica propuesta por Brunner y sus colegas representa un
avance significativo en el anlisis estadstico de datos ordinales, porque tiene un punto a su
favor que aprovecha la generalizacin para muchos diseos experimentales. Mucho
progreso se alcanz a finales de los 90, con la unificacin de la teora para el anlisis de
jerarqua propuesto por Brunner y sus colegas, extendiendo metodologas para anlisis de
datos ordinales de un diseo al azar con arreglo factorial, parcelas divididas y medidas
repetidas (Shan y Madden, 2003)
Se debe destacar, finalmente, que en los ltimos aos se ha producido un gran
desarrollo de las tcnicas de estimacin no paramtrica, el mismo ha sido paralelo al de la
informtica y su aplicacin a la estadstica, el acceso a nuevos y potentes ordenadores, y la
aparicin de una gran gama de software estadstico con facilidades graficas de alto nivel.

Bases Tericas
2.1 Diseo de experimentos
Los modelos de diseo de experimentos son modelos estadsticos clsicos cuyo
objetivo es averiguar si unos determinados factores influyen en la variable de inters y, si
existe influencia de algn factor, cuantificarla. Ejemplos donde habra que utilizar estos
modelos son los siguientes:
En el rendimiento de un determinado tipo de mquinas (unidades producidas por
da) se desea estudiar la influencia del trabajador que la maneja y la marca de la
mquina.
Se quiere estudiar la influencia del tipo de pila elctrica y de la marca en la
duracin de las pilas.
Una compaa de software est interesada en estudiar la variable porcentaje que
se comprime un fichero al utilizar un programa que comprime ficheros teniendo en
cuenta el tipo de programa utilizado y el tipo de fichero que se comprime.
Se quiere estudiar el rendimiento de los alumnos en una asignatura y, para ello, se
desean controlar diferentes factores: profesor que imparte la asignatura; mtodo de
enseanza; sexo del alumno.
La metodologa del diseo de experimentos se basa en la experimentacin. Es
conocido que si se repite un experimento, en condiciones indistinguibles, los resultados
presentan variabilidad que puede ser grande o pequea. Si la experimentacin se realiza en
un laboratorio donde la mayora de las causas de variabilidad estn muy controladas, el
error experimental ser pequeo y habr poca variacin en los resultados del experimento.
Pero si se experimenta en procesos industriales, administrativos, la variabilidad es grande
en la mayora de los casos.
El objetivo del diseo de experimentos es estudiar si utilizar un determinado
tratamiento produce una mejora en el proceso o no. para ello se debe experimentar
utilizando el tratamiento y no utilizndolo. si la variabilidad experimental es grande, slo se
detectar la influencia del uso del tratamiento cuando ste produzca grandes cambios en
relacin con el error de observacin. Los experimentos son una parte natural del proceso de
toma de decisiones en la ingeniera.
9

2.2. Parcelas divididas


Las parcelas divididas son experimentos factoriales con un arreglo especial, estas
variaciones implican que algunos factores tengan parcelas de mayor tamao, y otros, de
menor, estos ltimos se quedan entonces, contenidos en las parcelas de cada nivel de los
factores anteriores. El factor o factores asignados a las parcelas mayores, se llaman
principales, son aleatorizados segn el diseo experimental escogido, y el otro u otros
factores son asignados a cada una de las parcelas principales, con sorteos independientes
son llamados sub-parcelas. El modelo matemtico seria, para un ejemplo con dos factores:
,
Con i= 1,2,,I; j=1,2,,J y k=1,2,,K
Una de las consecuencias de tal distribucin de los tratamientos a las parcelas
experimentales es que van a haber dos tipos de errores en el ANAVAR, un error (a) usado
para probar los efectos de los tratamientos asignados a las parcelas principales y un error
(b), que es usado en la prueba de hiptesis concernientes a los factores de las sub-parcelas
y a las interacciones entre los factores de parcelas y sub-parcelas, al asumirse un modelo
fijo. De esta forma las hiptesis a probar serian:
hiptesis

Prueba

: No hay efecto de A, sin interaccin

: No hay efecto de B, sin interaccin

: No hay efecto de interaccin


Donde parcela principal (pp) y sub-parcela (sp)

La caracterstica ms sobresaliente de este diseo es la presencia de dos errores


experimentales diferentes. Uno que representa la variabilidad entre parcelas principales
tratadas de la misma forma (2pp error de las parcelas principales) y otro que representa la
variabilidad entre sub-parcelas tratadas de la misma forma (2sp error de las sub-parcelas).

10

La forma del modelo sugiere que este anlisis combina dos anlisis separados, el
anlisis de la parcela principal y el anlisis de la sub-parcela. La idea es que la parcela
principal actu como bloque para el anlisis de la sub-parcela. La suma de cuadrados de la
parcela principal, es calculada en forma similar a la suma de cuadrados para bloques en un
diseo en bloques al azar. Se podra entonces particionar los grados de libertad del diseo
de la siguiente manera:
Cuadro XX.- Grados de Libertad del diseo en parcelas Divididas.
FV

Gl

Parcela Principal (A)


ErrorA
Total(A)

a-1
(r-1)a
ra-1

FV

gl

Parcela Principal (A)


Sub-parcela(B)
Interaccin (AB)
ErrorB
Total(B)

ra-1
b-1
(a-1)(b-1)
(r-1)a(b-1)
rab-1

De esta forma podra ser calculada la varianza de la media para los niveles del factor A
(parcela principal) y los niveles del factor B (sub-parcela) utilizando la siguiente ecuacin:
Parcela principal (A)

Var yi..

A2
r

B2
rb

Sub-parcela (B)

Var y. j .

A2 B2
ra

El cuadrado medio asociado al error experimental de las parcelas principales (A) se


utiliza como denominador del estadstico F, en los contrastes de hiptesis de los factores
asociados a las parcelas principales, as como tambin en las pruebas de comparaciones
mltiples entre las medias de los tratamientos aplicados a las parcelas principales. El
cuadrado medio del error de sub-parcela (B) se utiliza para el contraste de hiptesis de los
factores asociados a las sub-parcela y de las interacciones de stos con el o los factores
asociados a las parcelas principales as como para las correspondientes comparaciones
mltiples. El esquema de la tabla del anlisis de la varianza para estos experimentos seria
de la siguiente forma:

11

Cuadro XX.- Esquema del Anlisis de Varianza (ANAVAR) en un diseo en Parcelas


Divididas.
Fuente de
Variacin
Factor en
parcela
principal (A)

Suma de
Cuadrados

Grados de
libertad

SCA

glA= a-1

Cuadrado Medio

CM A

ErrorA

SCErrorA

glErrorA= (r-1)a

Factor en
subparcela (B)

SCB

glB= b-1

Interaccin AB

SCAB

glAB= (a-1)(b-1)

ErrorB

SCerrorB= SCT-SCASCErrorA-SCB-SCAB

glErrorB= (r-1)a(b-1)

SCT

glTotal= rab -1

Total

CM ErrorA

SC A
gl A

CM A
CM ErrorA

SCEErrorA
glErrorA

SCB
glB
SC AB
CM AB
gl AB
SCErrorB
CM ErrorB
glErrorB

CM B

CM B
CM ErrorB
CM AB
F
CM ErrorB
F

El procedimiento especial de este diseo es realizar los anlisis de estos grupos


(parcela principal y sub-parcela) por separado, ya que los errores residuales son diferentes.

Simulacin de Monte Carlo


Para Faulin y Juan (2003) expresan que la simulacin de Monte Carlo es una tcnica
que combina conceptos estadsticos (muestreo aleatorio) con la capacidad que tienen los
ordenadores para generar nmeros pseudo-aleatorios y automatizar clculos. Lla simulacin
de Monte Carlo se ha venido aplicando a una infinidad de mbitos como alternativa a los
modelos matemticos exactos o incluso como nico medio de estimar soluciones para
problemas complejos. As, en la actualidad es posible encontrar modelos que hacen uso de
simulacin MC en las reas informtica, empresarial, econmica, industrial e incluso
social.
La simulacin de Monte Carlo es una tcnica cuantitativa que hace uso de la
estadstica y los ordenadores para imitar, mediante modelos matemticos, el
comportamiento aleatorio de sistemas reales no dinmicos (por lo general, cuando se trata
de sistemas cuyo estado va cambiando con el paso del tiempo, se recurre bien a la
12

simulacin de eventos discretos o bien a la simulacin de sistemas continuos). La clave de


la simulacin MC consiste en crear un modelo matemtico del sistema, proceso o actividad
que se quiere analizar, identificando aquellas variables (inputs del modelo) cuyo
comportamiento aleatorio determina el comportamiento global del sistema. Una vez
identificados dichos inputs o variables aleatorias, se lleva a cabo un experimento
consistente en (1) generar con ayuda del ordenador- muestras aleatorias (valores
concretos) para dichos inputs, y (2) analizar el comportamiento del sistema ante los valores
generados. Tras repetir n veces este experimento, dispondremos de n observaciones sobre el
comportamiento del sistema, lo cual nos ser de utilidad para entender el funcionamiento
del mismo obviamente, nuestro anlisis ser tanto ms preciso cuanto mayor sea el
nmero n de experimentos que llevemos a cabo.
2.3 Estadstica no paramtrica
La estadstica no paramtrica se basa principalmente sobre un concepto conocido
como la propiedad de distribucin libre, la cual establece que una prueba de hiptesis para
una distribucin libre es aquella para la cual el nivel de significancia permanece constante
bajo una clase de suposiciones distribucionales fundamentales. La mayora de las pruebas
de distribucin libre se basan en la transformacin de los datos en puestos, o en el orden
relativo de los valores de las variables medidas.
2.4 Kruskal-Wallis
En casos en los que la suposicin de normalidad no se justifica, el experimentador
podr estar dispuesto a utilizar un procedimiento alternativo al de la prueba de F del
anlisis de variancia y que no depende de esta suposicin. Kruskal y Wallis en 1952
desarrollaron este procedimiento. La prueba de Kruskal-Wallis se usa para probar la
hiptesis nula de la igualdad de a tratamientos contra la hiptesis alterna de que algunos de
ellos producen observaciones que son mayores que otras. A veces resulta conveniente
pensar que la prueba de Kruskal-Wallis es una prueba de igualdad de medias de tratamiento
porque es un procedimiento diseado para ser sensible en pruebas de diferencias entre
medias. La prueba de Kruscal-Wallis constituye una alternativa no paramtrica al anlisis
de variancia usual. Montgomery (1991)
13

Para realizar una prueba de Kruskal-Wallis primero hay que organizar las
observaciones Y ij en orden ascendente y reemplazarlas por su rango (o jerarqua, en ingls
rank ) R ij con el rango 1 correspondiente a la observacin ms pequea. En caso de empate
(varias observaciones con el mismo valor), se asigna el rango promedio a cada observacin
empatada. Sea R i. La suma de los rangos de las observaciones del i-simo tratamiento. La
estadstica de prueba es:
(

] (a)

En donde n i es el nmero de observaciones del i-simo tratamiento, N en el nmero


total de observaciones y:
(

] (b)

Debe notarse que S2 es igual a la variancia de los rangos. Si no hay empate, S2


=N(N+1)/12 y la estadstica de prueba se simplifica a:

Cuando el nmero de empates es moderado, habr poca diferencia entre las


ecuaciones, anteriores, (a) y (c), y puede usarse la Ecuacin (c) que es ms simple. Si ni es
razonablemente grande, como sera el caso si ni 5, entonces H tiene una distribucin
aproximadamente 2 -1 si la hiptesis nula es verdadera. Por lo tanto, si:
H > 2 , 1, Hay que rechazar la hiptesis nula.
2.5 Friedman
La prueba de Friedman es la alternativa de anlisis no paramtrica del diseo
bloques al azar. La prueba de Friedman fue diseada para probar la hiptesis nula de que
las distribuciones de probabilidad de los k tratamientos son idnticas, frente a la alternativa
de que por lo menos dos de las distribuciones difieren en su ubicacin. Siegel (1970). Los
datos son colocados en una tabla de dos clasificaciones con N hileras y k columnas. Las
14

hileras representan a los diferentes sujetos o conjuntos de sujetos igualados, y las columnas
representan las diferentes condiciones.
Si se estudian los puntajes de los sujetos utilizados en todas las condiciones, en cada
hilera estn los puntajes de un sujeto en las k condiciones. Los datos de la prueba son
rangos. Los puntajes de cada hilera estn ordenados separadamente. Esto es, con k
condiciones en estudio, los rangos de cualquier hilera van de 1 a k. La prueba de Friedman
determina la probabilidad de que las diferentes columnas de rangos procedan de la misma
poblacin. Siegel (1970).
Existen dos casos para su clculo:
1. Utilizando la comparacin del estadstico de prueba con el valor de tablas de chicuadrada cuando N>5 o k>5.
2. Utilizando las tablas de Friedman cuando N<5 y k<5.
Sea cual sea el caso, la hiptesis a contrastar es:
H 0: Las distribuciones de probabilidad para las k tratamientos son idnticas.
H 1: Por lo menos dos de las distribuciones difieren en su ubicacin. Estadstico de
Prueba, Siegel (1970):

Dnde:

( )

N = nmero de hileras
K = nmero de columnas
( ) = suma de rangos en la columna j

Regin de rechazo:X2 r > X2 con (k-1) grados de libertad. Supuesto N>5 o k>5.
Procedimiento general:
1. Se arreglan los puntajes en una tabla de dos clasificaciones de k columnas
(condiciones) y N hileras (sujetos o grupos).
2. Se ordenan los puntajes de cada hilera de 1 a k.

15

3. Se determina la suma de los rangos de cada columna: R j .


4. Se calcula el valor del estadstico.
5. Calcular la probabilidad de ocurrencia conforme a H 0 dependiendo de los
tamaos de N y k:
a. La tabla N o de Friedman para N<5 y k<5.
b. La tabla de chi-cuadrada con k-1 grados de libertad cuando N>5 o k>5.
6. Si la probabilidad obtenida con el mtodo debido es igual o menor que , se
rechaza H0

16

4. METODOLOGIA

A partir de una poblacin simulada, por la metodologa de Montecarlo se obtuvieron


100 muestras con distribucin normal, estas serviran para las repeticiones de las
condiciones estudiadas. Los Anlisis de Varianzas de las 100 muestras para cada
distribucin, fueron procesadas utilizando el software libre estadstico R Project, aqu se
program la secuencia de pruebas no paramtricas segn las metodologas analizadas,
siguiendo los procedimientos explicados en un siguiente apartado siguiendo el esquema
propuesto.

17

Simulacin de Monte Carlo


Para realizar la simulacin se procedido a resolver el anlisis de bloques al azar en
arreglo de parcelas divididas, extrado del libro de Monzn (ver Cuadro XX), de este se
obtuvieron los parmetros media y varianza (CME) (,2) necesarios para la ejecucin de la
funcin rnorm() del paquete estadstico R Project, obteniendo de esta manera una poblacin
con distribucin normal N~(,2) de 1000 elementos, principio aleatorio necesario para
utilizar la simulacin de Monte Carlo.

Seleccin de las muestras


Para seleccionar las muestras se utiliz la funcin Montecarlo() de la librera
agricolae del paquete R Project, con esta funcin se simularon 100 muestras de 72 datos
cada una para con la finalidad de probar la metodologa propuesta. Este procedimiento
permitir validar los resultados, ya que se espera que sus desviaciones sean mnimas, como
ocurre con todo proceso que proviene de una simulacin. La simulacin de ste
procedimiento se ha realizado mediante el paquete estadstico R Project un software Libre,
por la simplificacin que presenta durante su especificacin y la inmediatez en la
realizacin de los clculos estadsticos. Al ejecutar el modelo computacional, por la propia
naturaleza del mtodo de Monte Carlo, cada rplica dar un resultado diferente e
independiente debido a las componentes aleatorias del modelo.

Si se supone que se realizan R rplicas independientes de una variable aleatoria Y


de inters, se denominar Yri a la isima observacin de la rplica r, para i = 1, 2, ..., n r y r
= 1,2,...,R
Si para un nmero de rplicas r, Yr1 , Yr2 , ..., Yrn es una secuencia
autocorrelacionada de una variable de inters Y, obtenida tras la simulacin, para diferentes
rplicas Yri y Yrj son valores estadsticamente independientes.
Se define como media muestral de las rplicas de simulacin de Y a la expresin:

Por lo que habr R muestras y R medias muestrales. La media muestral general es:

18

La varianza muestral de la simulacin se definira como:

( )

Es importante sealar que el modelo se ejecuta aumentando el nmero de individuos


para disminuir la variabilidad de la variable de respuesta hasta que converge a un valor
(valor de convergencia).Para (Law y Kelton, 1999). Conceptualmente es equivalente a
simular toda la poblacin de entidades de procedencia del modelo de simulacin y puede
resultar til en el caso de estudios observacionales. Se utilizaron tamaos muestrales de
rplicas parecidos a los del ensayo real, ya que se estudia la sensibilidad o robustez de las
pruebas simuladas.

Pruebas de supuestos de normalidad y homocedasticidad


A los diseos resultantes se les aplico la prueba de Kolmogorov-Smirnof para
probar la normalidad de los datos, y la prueba de Levene para la homocedasticidad,
quedando de esta manera clasificados como los que cumplan los supuestos a los cuales se
le aplico la metodologa paramtrica usual del diseo en bloque con arreglo en parcelas
divididas; y a los que no cumplan con los supuestos (especialmente la homocedasticidad)
que se le aplico la metodologa sugerida en esta tesis.
Metodologa sugerida
Aquellos grupos que no cumplieron con los supuestos valores fueron transformados
en variables ordinales, a travs de la trasformacin de rangos de la siguiente manera:
1. Los datos fueron ordenados considerando su valor por parcela principal,
asignado el valor nominal de la posicin que ocupa.
2.

De encontrase empates entre posiciones con valores iguales, se procedi a


sumar las posiciones y encontrar el promedio, el cual se adjudic a cada
elemento del empate.

Una vez transformados, se procedi a aplicar las pruebas sugeridas para probar las
hiptesis de las parcelas principales, las sub-parcelas y la interaccin, esto fue aplicar la
prueba de Kruskal-Wallis entre las parcelas principales, la prueba de Friedman entre las
19

sub-parcelas y el estadstico para evaluar la interaccion cuando se usan constraste de rangos


alineados propuesta por Oliver et al (2009), basada en la prueba F para los gl siguientes: (a1)(b-1);ab(n-1), fue la siguiente:

Todos los procedimientos fueron automatizados usando el lenguaje de


programacin del paquete estadstico R Project, ver Cuadro XXX

CUADRO N XXXX
Codigo R Project
# Librerias a usar
library(agricolae)
library(car)
#
# Cargar datos Originales
ajonjoli<c(1636,1680,1691,1978,1879,1472,1859,1858,1698,1420,1362,1934,1508,1333,1990,1658,
1326,1476,1635,1696,1828,1644,1646,1696,1568,1456,1801,1943,1665,1644,1330,2124,1
639,1608,1627,1326,1898,1744,1479,1981,1549,1515,1293,1653,1559,1717,1429,1796,18
55,1274,1670,1553,1772,1848,1841,1854,1695,1360,1292,1757,1695,1643,1807,1989,160
9,1366,991,1652,1745,1572,1862,1608)
#
#Estructura del diseo en bloques con arreglo en parcela dividida
hileras<-rep(1:3,each=24)
dplantas<-rep(rep(1:3, each=8), 3)
replica<-rep(rep(1:8),9)
#
# Creacion Base de datos b_ajonjoli
b_ajonjoli<-data.frame(hileras,dplantas,replica,ajonjoli)
#
# ANAVA
anava<aov(ajonjoli~factor(hileras)+factor(replica)+factor(hileras):factor(replica)+factor(dplantas)
+factor(hileras):factor(dplantas))
print("ANAVA DATOS ORIGINALES")
print(" ")
summary(anava)
#Coeficiente de variacion del analisis
print("COEFICIENTE DE VARIACION")
cv.model(anava)
a<-as.matrix(anova(anava))
20

# Calculo Media y desvio


Media<-mean(b_ajonjoli$ajonjoli)
Varianza<-a[6,3]
Desvio<-sqrt(Varianza)
#
# Calculo de la poblacion N~(Media,Desvio), 1000 datos
normal<-rnorm(1000,mean=Media,sd=Desvio)
#
# calculo de muestra por Monte Carlo
m_ajonjoli<-montecarlo(normal,k=72,kernel="epanechnikov")
#
#Creacion nueva base bm_ajonjoli
bm_ajonjoli<-data.frame(hileras,dplantas,replica,m_ajonjoli)
attach(bm_ajonjoli)
#
# SUPUESTOS
print("SUPUESTOS BASE NUEVA")
print(" ")
shapiro.test(m_ajonjoli)
leveneTest(m_ajonjoli,factor(dplantas))
# ANAVA parametrico
anava<aov(m_ajonjoli~factor(hileras)+factor(replica)+factor(hileras):factor(replica)+factor(dplant
as)+factor(hileras):factor(dplantas))
print("ANAVA DATOS PARAMETRICOS")
print(" ")
summary(anava)
KW<-kruskal(m_ajonjoli,dplantas,group=T,main="bm_ajonjoli")
print("PRUEBA DE KRUSKAL-WALLIS")
KW
print("PRUEBA DE FRIEDMAN")
FD<friedman(replica,dplantas,m_ajonjoli,alpha=0.05,group=T,console=T,main="bm_ajonjoli")
#FD
b<-as.matrix(anova(anava))
CME<-b[6,3]
CMAB<-b[5,3]
inter<-CMAB/CME
print("INTERACCION")
inter
pval<-1-pf(inter,b[5,1],b[6,1])
print("p")
pval
#Coeficiente de variacion del analisis
print("COEFICIENTE DE VARIACION")
cv.model(anava)
#
21

# Analisi NO PARMETRICO
r_ajonjoli<-rank(m_ajonjoli)
br_ajonjoli<-data.frame(hileras,dplantas,replica,r_ajonjoli)
anava<aov(r_ajonjoli~factor(hileras)+factor(replica)+factor(hileras):factor(replica)+factor(dplanta
s)+factor(hileras):factor(dplantas))
print("ANAVA DATOS ORDINALES")
print(" ")
summary(anava)
print("PRUEBA DE KRUSKAL-WALLIS")
KW<-kruskal(r_ajonjoli,dplantas,group=T,main="br_ajonjoli")
KW
print("PRUEBA DE FRIEDMAN")
FD<friedman(replica,dplantas,r_ajonjoli,alpha=0.05,group=T,console=T,main="br_ajonjoli")
#FD
c<-as.matrix(anova(anava))
CME<-c[6,3]
CMAB<-c[5,3]
inter<-CMAB/CME
print("INTERACCION")
inter
pval<-1-pf(inter,c[5,1],c[6,1])
print("p")
pval
#Coeficiente de variacion del analisis
print("COEFIIENTE DE VARIACION")
cv.model(anava)
CRITERIOS DE COMPARACIN
Las metodologas estadsticas no paramtricas son comparados en este trabajo en
trminos de la tasa de error tipo I y II cometidos en una de las pruebas y la potencia de las
mismas. De acuerdo con la especificacin del modelo y el rea bajo estudio, se podr luego
ofrecer recomendaciones acerca del uso de uno u otro mtodo. El criterio para identificar el
error tipo II, fue no rechazar la prueba, comparado con el anlisis de los datos originales.
Luego se realiz el clculo de las potencias o complemento probabilstico de la tasa de
error tipo II, que permitirn comparar los estadsticos de las pruebas y en consecuencias las
pruebas y realizar recomendaciones de uso bajo las condiciones expuestas en la presente
investigacin.

22

5.- RESULTADOS
En este captulo se entregan las pruebas realizadas y la interpretacin de sus
resultados, as como las comparaciones entre las pruebas paramtricas y no paramtricas.

"ANAVA DATOS ORIGINALES"


gl

SC

CM

PP

9240

4620

0.187 0.8300

Bloque

1022524

146075

5.918 7.98e-05 ***

Error(a)

14

864844

61775

2.502 0.0110 *

SP

239497

119749

4.851 0.0127 *

PP/SP

41201

10300

0.417 0.7952

1036777

24685

Error(b)

42

Pr(>F)

PP: parcela principal, SP: Sub-parcela Sig: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
COEFICIENTE DE VARIACION = 9.54%

En el cuadro de ANAVA de los datos originales se observa que son efectos


significativos: la replicas (p<0,00), las sub-parcelas (p<0,05) y el error delas parcelas
principales (p<0,05). Se podra concluir que: no existe efecto de interaccin entre los
factores, es decir, que las distancia entre hileras y la distancia entre plantas actan en forma
independiente sobre el rendimiento por hectrea de ajonjol; se concluye que no existen
diferencias estadsticamente significativas en los rendimientos de ajonjol observados por la
distancia entre hileras, y que existen suficientes evidencias de diferencias estadstica
significativas entre los rendimientos de ajonjol observado por la distancia entre plantas
estudiadas. El CME, que representa a la varianza de los datos (24684) fueron usado para
crear junto a la media (1646,63 Kg/Ha) la poblacin de distribucin normal a usar. Ver
Cuadro XXX.

23

Cuadro XXX Datos generados con rnorm(1000, mean=1646.63,sd=212,76)


[1] 1585.882 1479.275 1697.526 1815.784 1830.016 1460.432 1727.111
[8] 1835.104 1602.919 1783.214 1728.713 1871.903 1600.218 1317.617
[15] 1761.204 1441.592 1506.647 1762.560 1516.093 1729.256 1595.212
[22] 1689.348 1457.814 1524.718 1564.527 1576.268 1650.807 1961.193
[29] 1485.001 1630.423 1769.240 1793.669 1551.474 1431.361 1483.392
[36] 1777.325 1910.660 1591.167 1541.912 1543.691 1383.775 1731.835
[43] 1641.200 1684.706 1632.665 1732.025 1753.218 1591.407 1529.051
[50] 1383.538 1550.251 1444.103 1811.055 1745.571 1615.586 1651.751
[57] 1784.042 1764.753 1309.950 1541.076 1747.680 1913.786 1356.288
[64] 1602.116 1452.137 1761.298 1530.746 1726.905 1671.418 1605.999
[71] 1723.153 1872.045 1674.419 1649.092 1765.802 1660.133 1632.964
[78] 1511.468 1673.339 1640.970 1562.562 1445.090 1543.301 1750.834
[85] 1732.814 1900.620 1748.135 1736.051 1589.494 1804.503 1749.775
[92] 1999.013 1688.113 1721.593 1768.156 1550.448 1681.000 1912.208
[99] 1668.424 1709.420 1655.181 1533.002 1443.681 1388.010 1760.059
[106] 1582.592 1672.571 1676.860 1241.259 1461.887 1736.718 1741.161
[113] 1932.914 1618.166 1803.013 1538.403 1510.229 1665.875 1935.608
[120] 1806.485 2075.416 1544.658 1640.513 1750.091 1550.855 1632.253
[127] 1742.709 1581.938 1871.302 1648.299 1473.750 1523.075 1678.530
[134] 1972.466 1535.863 1652.513 1358.906 1782.348 1615.363 1598.869
[141] 1862.083 1663.308 1906.803 1835.054 1540.126 1700.637 1617.834
[148] 1767.919 1407.908 1671.664 1574.434 1614.147 1974.123 1865.875
[155] 1605.239 1663.926 1423.266 1865.994 1672.880 1676.302 1428.668
[162] 1642.443 1512.472 1977.169 1548.403 1629.841 1407.322 1583.083
[169] 1424.580 1574.662 1872.190 1778.993 1990.596 1542.824 1368.007
[176] 1837.955 1924.586 1418.076 1656.319 1871.895 1719.791 1868.583
[183] 1939.889 1639.150 1781.373 1822.192 1370.362 1522.249 1723.040
[190] 1917.390 1602.879 1422.987 1781.889 1883.764 1652.992 1351.221
[197] 1643.301 1415.031 1614.379 1660.793 1279.748 1648.840 1788.699
[204] 1554.143 1620.363 1315.389 1575.678 1932.210 1784.969 1645.826
[211] 1525.551 1646.665 1451.297 1619.459 1672.075 1347.076 1435.338
[218] 1590.036 1816.932 1613.238 1513.530 1712.745 1634.293 1531.978
[225] 1554.588 1605.980 1727.787 1503.640 1718.966 1577.316 1772.699
[232] 1400.583 1807.750 1703.070 1675.546 1718.443 1527.236 1518.089
[239] 1534.767 1908.518 1597.563 1595.293 1512.886 1666.608 1892.469
[246] 1853.444 1383.977 1390.910 1625.637 1370.855 1411.997 1468.207
[253] 1596.880 1590.312 1394.176 1338.446 1651.913 1340.848 1704.644
[260] 1349.311 1628.671 1512.829 1279.493 1852.997 1845.465 1531.344
[267] 1697.579 1787.011 1513.540 1361.345 1598.396 1941.122 1892.374
[274] 1455.914 1519.260 1743.701 1815.651 1611.544 1626.220 1662.214
[281] 1416.315 1897.684 1737.008 1577.387 1720.453 1674.995 1653.155
[288] 1634.824 1461.875 1744.460 1507.920 1731.690 1521.018 1828.062
[295] 1687.855 1868.994 1775.472 1508.505 1692.231 1762.207 1556.322
[302] 1589.653 1520.351 1547.676 1553.053 1698.994 1926.314 1808.854
[309] 1870.920 1397.500 1522.241 1714.402 1562.685 1513.231 1677.273
[316] 1484.833 1586.333 1352.373 1865.098 1682.967 1892.197 1760.554
[323] 1873.597 1631.703 1710.008 2080.543 1755.705 1594.453 1549.580

24

[330] 1629.798 1622.603 1611.485 1600.541 1627.047 1656.523 1707.682


[337] 1643.403 1403.897 1376.957 1825.070 1583.986 1577.898 1750.452
[344] 1381.291 1403.348 1619.059 1800.029 1614.983 1736.829 1691.637
[351] 1523.653 1528.164 1594.886 1495.934 1753.695 1832.634 1676.425
[358] 1566.548 1601.193 1783.255 1600.504 1593.409 1596.607 2026.809
[365] 1707.235 1644.377 1853.222 1395.982 1684.916 1699.464 1382.357
[372] 1640.660 1739.263 1440.141 1681.719 1692.392 1666.025 1881.787
[379] 1922.816 1774.927 1763.493 1801.796 1560.785 1527.151 1675.619
[386] 1474.272 1581.136 1810.108 1722.035 1508.722 1659.184 1819.859
[393] 1538.844 1804.541 1680.450 2032.103 1812.714 1624.148 1674.993
[400] 1835.393 1605.281 1693.360 1767.562 1432.774 2125.314 1822.610
[407] 1663.845 1490.134 1567.785 1697.495 1648.625 1552.194 1791.902
[414] 1716.622 1700.567 1871.910 1597.125 1444.940 1915.818 1530.280
[421] 1505.976 1596.663 1712.480 1712.806 1582.401 1462.182 1781.874
[428] 1455.433 1608.791 1538.450 1370.433 1511.360 1825.436 1413.893
[435] 1801.493 1784.009 1376.389 1888.000 1692.415 1954.965 1690.795
[442] 1520.182 1711.052 1383.582 1526.501 1662.815 1576.806 1387.236
[449] 1887.941 1647.615 1717.304 1595.015 1729.813 1837.327 1944.371
[456] 1593.534 1680.218 1462.020 1538.275 1909.559 1385.264 1793.374
[463] 1623.777 1605.010 1634.167 1808.883 1596.549 1712.685 1637.605
[470] 1463.832 2039.514 1630.971 1577.384 1721.237 1517.295 1433.860
[477] 1368.968 1847.915 1794.972 1742.802 1783.489 1580.452 1304.736
[484] 1704.058 1740.794 1707.164 1728.267 1546.438 1606.164 1902.048
[491] 1995.822 1532.773 1738.968 1537.474 1604.077 1583.021 1659.341
[498] 1847.155 1738.450 1584.717 1867.830 1946.642 1458.676 1525.977
[505] 1692.485 1448.631 1672.973 1552.514 1738.929 1478.543 1927.052
[512] 1810.004 1542.612 1525.725 1469.205 1474.237 1730.098 1444.352
[519] 1558.601 1580.632 1667.725 1853.749 1586.897 1884.098 1849.827
[526] 1500.857 1644.062 1568.367 1653.259 1543.882 1294.002 1400.158
[533] 1749.510 1475.439 1756.097 1524.196 1650.887 1481.969 1697.335
[540] 1643.698 1454.127 1485.977 1695.269 1589.040 1621.279 1752.470
[547] 1591.642 1681.061 1592.476 1738.529 1872.403 1782.066 1621.229
[554] 1593.839 1707.652 1896.071 1541.228 1429.771 1568.583 1731.535
[561] 1665.976 1626.942 1704.519 1940.904 1448.563 1681.372 1695.416
[568] 1520.960 1918.021 1660.287 1528.641 1555.413 1790.714 1738.447
[575] 1524.704 1690.765 1766.037 1801.703 1481.413 1766.105 1816.475
[582] 1681.670 1786.056 1592.224 1456.933 1807.401 1840.822 1645.152
[589] 1609.111 1561.400 1556.310 1933.764 1819.409 1733.449 1678.027
[596] 1620.573 1849.198 1637.095 1363.010 1572.239 1763.343 1853.651
[603] 1501.444 1689.991 1852.657 1884.390 1603.933 1465.026 1900.028
[610] 1744.671 1640.529 1546.909 1614.434 1778.716 1406.824 1843.001
[617] 1614.121 1349.565 1615.421 1812.847 1887.985 1599.057 1576.572
[624] 1621.665 1522.343 1406.219 1680.864 1469.925 1619.222 1624.477
[631] 1638.870 2049.806 1650.382 1588.945 1506.698 1597.476 1793.752
[638] 1428.684 1705.845 1654.493 1432.854 1626.159 1549.629 1596.435
[645] 1434.270 1791.807 1690.254 1414.556 1382.511 1721.027 1268.529
[652] 1738.179 1662.939 1511.735 1564.834 1919.317 1817.551 1582.487
[659] 1895.348 1688.520 1855.664 1671.212 1707.814 1459.794 1994.857
[666] 1874.246 1763.958 1488.624 1489.270 1626.615 1630.005 1403.387

25

[673] 1535.361 1425.223 1553.528 1629.678 1532.095 1505.263 1614.482


[680] 1518.138 1713.443 1881.435 1870.457 1897.207 1690.687 1572.371
[687] 1631.256 1805.115 1617.593 1664.071 1553.505 1575.474 1513.199
[694] 1577.873 1572.329 1725.588 1496.576 1717.484 1474.813 1789.417
[701] 1621.603 1824.662 1405.516 1690.941 1729.575 1987.415 1567.883
[708] 1821.520 1529.428 1774.770 1639.407 1795.177 1906.402 1797.798
[715] 1612.329 1619.994 1664.186 1635.903 1636.727 1392.714 1670.186
[722] 1336.126 1533.846 1935.563 1576.414 1877.863 1712.158 1464.128
[729] 1621.585 1488.664 1499.171 1328.373 1710.023 1660.510 1857.088
[736] 1738.542 1714.566 1482.659 1717.829 1518.833 1649.090 1526.304
[743] 1497.175 1543.016 1532.237 1912.335 1578.676 1526.016 1560.998
[750] 1574.029 1475.897 1555.307 1728.995 1714.723 1441.648 1520.436
[757] 1551.965 1693.885 1637.324 1688.491 1680.061 1956.748 1784.156
[764] 1482.271 1939.037 1480.619 1450.096 1523.737 1626.821 1539.718
[771] 1515.029 1673.941 1639.531 1652.625 1603.654 1555.530 1595.467
[778] 1591.915 1667.111 1741.222 1558.134 1840.479 1719.823 1601.797
[785] 1727.624 1680.738 1568.884 1605.126 1553.386 1607.588 1675.571
[792] 1582.311 1442.612 1512.198 1554.713 1688.391 1783.441 1606.444
[799] 1736.160 1613.766 1806.181 1720.224 1325.312 1472.350 1604.646
[806] 1546.773 1600.513 1490.035 1657.767 1642.906 1745.061 1504.742
[813] 1482.441 1586.396 1422.782 1693.149 1629.075 1825.442 1321.651
[820] 1605.602 1399.325 1482.715 1455.119 1697.871 1440.027 1582.644
[827] 1588.166 1721.315 1601.369 1635.454 1818.784 1825.608 1995.919
[834] 1628.731 1702.864 1596.952 1751.002 1620.046 1659.308 1838.311
[841] 1785.661 1654.808 1808.080 1693.970 1731.215 1634.965 1830.998
[848] 1843.889 1750.240 1632.117 1686.703 1765.399 1702.258 1806.428
[855] 1775.870 1717.078 1753.292 1465.432 1632.983 1415.350 1758.870
[862] 1540.942 1528.722 1862.657 1505.429 1675.444 1574.769 1689.965
[869] 1694.576 1738.779 1826.333 1629.920 1761.541 1697.579 1875.532
[876] 1733.527 1705.898 1778.133 1704.437 1688.965 1487.179 1812.047
[883] 2064.463 1755.400 1481.522 1646.454 1725.201 1429.623 1735.855
[890] 1795.299 1890.509 1682.639 1389.571 1328.717 1896.799 1799.089
[897] 1633.922 1624.058 1632.508 1453.935 1522.033 1763.004 1619.733
[904] 1539.528 1546.894 1454.850 1777.249 1618.766 1838.418 1812.619
[911] 1649.367 1504.083 1961.669 1718.791 1716.166 1664.636 1586.209
[918] 1543.016 1483.663 1607.976 1754.133 1477.184 1698.299 1645.833
[925] 1637.779 1706.785 1684.548 1864.804 1869.525 1699.094 1905.334
[932] 1532.643 1603.384 1421.998 1557.264 1727.126 1308.846 1783.027
[939] 1552.353 1624.300 1637.779 1413.056 1439.431 1723.699 1805.233
[946] 1282.343 1820.118 1399.640 1554.683 1780.788 1475.547 1434.733
[953] 1831.373 1767.695 1667.758 1345.347 1676.818 1807.006 1759.484
[960] 1472.647 1855.591 1552.185 1464.510 1527.094 1749.520 2052.897
[967] 1296.775 1638.781 1625.065 1885.702 1763.765 1719.121 1536.961
[974] 1545.131 1609.163 1531.928 1678.462 1974.773 1741.686 1664.966
[981] 1646.983 1626.317 1620.315 1389.022 1759.386 1611.341 1318.084
[988] 1575.018 1617.605 1678.644 1548.431 1584.088 1698.762 1613.316
[995] 1696.982 1719.214 1803.908 1619.590 1561.008 1651.548

26

A partir de esta base de 1000 datos, el procedimiento Montecarlo elige muestras de


72 datos, un nmero de 100 veces, con esto se establece una base de datos de los promedios
muestrales de cada valor por su posicin en el diseo en bloque con arreglo de parcelas
divididas, y a esa base de promedios se le aplico las tcnicas estudiadas. Ver el Cuadro N
XX

Cuadro N XXXX base de promedio muestrales (100 datos cada uno)


hileras dplantas replica m_ajonjoli
1
1
1
1 1389.407
2
1
1
2 1603.138
3
1
1
3 1782.672
4
1
1
4 1705.729
5
1
1
5 1889.537
6
1
1
6 1607.412
7
1
1
7 2047.698
8
1
1
8 1731.376
9
1
2
1 1652.296
10
1
2
2 1560.392
11
1
2
3 1551.842
12
1
2
4 1421.467
13
1
2
5 1549.705
14
1
2
6 1491.998
15
1
2
7 1596.726
16
1
2
8 1393.682
17
1
3
1 1566.804
18
1
3
2 1624.511
19
1
3
3 1539.019
20
1
3
4 1335.974
21
1
3
5 1534.744
22
1
3
6 1799.770
23
1
3
7 1517.645
24
1
3
8 1577.490
25
2
1
1 1707.866
26
2
1
2 1729.239
27
2
1
3 1491.998
28
2
1
4 1748.475
29
2
1
5 1464.213
30
2
1
6 1684.355
31
2
1
7 1571.078
32
2
1
8 1551.842
33
2
2
1 1838.242
34
2
2
2 1872.439
35
2
2
3 1603.138
36
2
2
4 1551.842

37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72

2
2
2
2
2
2
2
2
2
2
2
2
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3

2
2
2
2
3
3
3
3
3
3
3
3
1
1
1
1
1
1
1
1
2
2
2
2
2
2
2
2
3
3
3
3
3
3
3
3

5
6
7
8
1
2
3
4
5
6
7
8
1
2
3
4
5
6
7
8
1
2
3
4
5
6
7
8
1
2
3
4
5
6
7
8

1827.555
1387.270
1915.185
1539.019
1844.654
1633.060
1455.664
1624.511
1515.508
1434.290
1483.449
1547.568
1598.863
1609.550
1477.037
1889.537
1423.604
1677.944
1511.234
1981.441
1688.630
1720.690
1466.350
1628.785
1716.415
1808.319
1547.568
1491.998
1603.138
1955.794
1942.970
1789.084
1761.299
1716.415
1801.907
1765.573

A esta base se le realizaron las pruebas de los supuestos, cumpliendo con los
supuestos estudiados de Normalidad y Homocedasticidad.
27

Cuadro N XXXX Resultados de las prueba de los supuestos


Supuesto

Resultado

Normalidad

W= 0,9734

0,1313

Homocedasticidad

F= 0,1441

0,8661

En el cuadro anterior ninguna de las pruebas lograron rechazar la hiptesis nula, es


decir la muestra de valores promedio muestrales son normales y cumplen con la
homocedasticidad o homogeneidad de las varianzas. Cumpliendo esto, a los datos se les
debe tratar usando la metodologa de anlisis paramtrico usual, el resultados se presenta en
el siguiente Cuadro.

ANAVA DATOS PARAMETRICOS


gl

CM

SC

Pr(>F)

PP

99095

49548

2.196 0.1238

Bloque

71080

10154

0.450 0.8644

Error (a)

14

372841

26632

1.180 0.3247

SP

23145

11572

0.513 0.6024

PPxSP

331733

82933

3.676 0.0118 *

Error(b)

42

947529

22560

PP: parcela principal, SP: Sub-parcela Sig: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
COEFICIENTE DE VARIACION = 9.16%

En el cuadro de ANAVA de los datos paramtricos, no evidencia efectos


independientes sobre el rendimiento de ajonjol de las distancias entre hileras o de la
distancia entre plantas; pro si existe efecto significado (p<0,05) de la interaccin, es decir,
que los valores del rendimiento en kg/Ha de ajonjol depende de la combinacin entre las
distancia de hilera y planta.

Este mismo procedimiento se realiz varias veces hasta encontrar un grupo de datos
que no cumpliese los supuestos, a estos datos, primero se les transformo a una variable

28

ordinal, a travs de la transformacin de rangos (RT-2), considerando las distancias entre


hileras. En el siguiente cuadro se encuentra el resultado de este paso.

Cuadro N XXX Datos para anlisis no paramtrico (Transformados)


hileras dplantas replica r_ajonjoli
1
1
1
1
3.0
2
1
1
2
35.0
3
1
1
3
57.0
4
1
1
4
47.0
5
1
1
5
66.5
6
1
1
6
37.0
7
1
1
7
72.0
8
1
1
8
53.0
9
1
2
1
43.0
10
1
2
2
28.0
11
1
2
3
26.0
12
1
2
4
5.0
13
1
2
5
24.0
14
1
2
6
14.0
15
1
2
7
32.0
16
1
2
8
4.0
17
1
3
1
29.0
18
1
3
2
39.5
19
1
3
3
20.5
20
1
3
4
1.0
21
1
3
5
19.0
22
1
3
6
59.0
23
1
3
7
18.0
24
1
3
8
31.0
25
2
1
1
48.0
26
2
1
2
52.0
27
2
1
3
14.0
28
2
1
4
54.0
29
2
1
5
9.0
30
2
1
6
45.0
31
2
1
7
30.0
32
2
1
8
26.0
33
2
2
1
63.0
34
2
2
2
65.0
35
2
2
3
35.0
36
2
2
4
26.0

37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72

2
2
2
2
2
2
2
2
2
2
2
2
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3

2
2
2
2
3
3
3
3
3
3
3
3
1
1
1
1
1
1
1
1
2
2
2
2
2
2
2
2
3
3
3
3
3
3
3
3

5
6
7
8
1
2
3
4
5
6
7
8
1
2
3
4
5
6
7
8
1
2
3
4
5
6
7
8
1
2
3
4
5
6
7
8

62.0
2.0
68.0
20.5
64.0
42.0
8.0
39.5
17.0
7.0
12.0
22.5
33.0
38.0
11.0
66.5
6.0
44.0
16.0
71.0
46.0
51.0
10.0
41.0
49.5
61.0
22.5
14.0
35.0
70.0
69.0
58.0
55.0
49.5
60.0
56.0

A estos datos se le aplico las metodologas sugeridas, obteniendo los siguientes


resultados:

29

Cuadro N XXX Resultado pruebas sugeridas


Prueba

Probando

Valor

Kruskal-Wallis

PP

2 = 0,7067

0,7023

Friedman

SP

F = 0,1111

0,8951

PPxSP

F= 3,7580

0,010 *

Interaccion

En la tabla anterior se puede evidenciar que a travs de los datos ordinales, se


comprob que las diferentes distancias entre hileras no afecta los rendimientos de ajonjol y
tampoco influye las distancia entre plantas sobre ella. Por otro lado evidencio diferencias
significativas estadsticas (p<0,05) para la interaccin entre las distancias, es decir que la
combinacin entre la distancias entre hileras y entre plantas afecta el rendimiento en Kg/Ha
del ajonjol.

Comparacin de los resultados de todos los anlisis

Para lograr esta comparacin se realiz el anlisis de los datos ordinales a travs de
la metodologa usual, obtenindose los siguientes resultados.

ANAVA DATOS ORDINALES


gl

SC

CM

Pr(>F)

PP

369

184.7

0.413 0.664

Bloque

2433 347.6

0.778 0.609

Error(a)

14

6563 468.8

1.049 0.428

SP

758

378.9

0.848 0.435

PPxSP

2205 551.1

1.233 0.311

Error (b)

42

18767 446.8

PP: parcela principal, SP: Sub-parcela Sig: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1

En el ANAVA anterior donde se utiliz la metodologa tradicional para datos


paramtricos no se evidencian diferencias para ningn parmetro estudiado.

30

Cuadro N XXXX. Diferentes anlisis aplicados a muestras de 72 datos por significancia


nominal a un nivel de significacin del 5% basado en 100 simulaciones por mtodo de
Monte Carlo
Parmetro
Distribucin
Distribucin
Distribucin
Metodologa
evaluado
original
muestral
ordinal
propuesta
PP
0,8300
0,1238
0,6640
0,7023
SP
0,0127
0,6024
0,4350
0,8951
PPxSP
0,7952
0,0118
0,4280
0,0100

Al comparar la significancia nominal de los parmetros estudiados podemos


observar que para el efecto de la parcela principal son ms similares los valores obtenidos
entre la distribucin original y la metodologa propuesta, para el efecto de la sub-parcela
son ms similares la distribucin muestral y la metodologa propuesta y para el efecto de la
interaccin la distribucin muestral y la metodologa propuesta. Es importante resaltar que
la metodologa propuesta alcanza las mismas repuestas que las obtenidas al analizar la
distribucin muestral.

31

6. CONCLUSION Y RECOMENDACIONES

En trminos generales la metodologa propuesta para el abordaje de diseos en


bloque en arreglos de parcelas divididas cuando no cumplen los supuestos de normalidad y
homocedasticidad, en especial el ultimo; se puede concluir que dicha metodologa
propuesta es similar a los resultados de la distribucin muestral (100 rplicas). Al parecer,
emplear este tipo de anlisis mejora la calidad de las conclusiones (siendo stas ms
contundentes) y la presentacin de los resultados de los estudios de simulacin.

La invitacin con este manuscrito es motivar a los investigadores que trabajan en el


rea de la estadstica a implementar la metodologa propuesta como una alternativa al
anlisis de diseos en bloque con arreglo de parcelas divivididas y anlisis de experimentos
en los estudios de simulacin; en otras palabras, aplicar de lo que sabemos, en este tipo de
anlisis.

Se recomienda seguir esta lnea de investigacin utilizando en situaciones reales


para comprobar su uso y en situaciones simuladas con mayor nmero de rplicas.

32

ESQUEMA CONCLUSIONES
Efecto de parcela
principal

NS

Efecto de
parcela

P < 0,05

Datos
Originales

Datos
Muestrales

Conclusiones

Datos
Ordinales

Metodologa
propuesta

sub-

Efecto interaccin

NS

Efecto de parcela
principal

NS

Efecto de
parcela

NS

sub-

Efecto interaccin

P<0,05

Efecto de parcela
principal

NS

Efecto de
parcela

P<0,05

sub-

Efecto interaccin

NS

Efecto de parcela
principal

NS

Efecto de
parcela

NS

sub-

Efecto interaccin

33

P<0,05

7. REFERENCIAS BIBLIOGRFICAS.

AKRITAS, M., 1991. Limitations of the rank transform procedures: a study of repeated
measures designs, Parte I J. Amer. Statist. Assoc. 86, 457-460.

AKRITAS, M., 1993. Limitations of the rank transform procedures: a study of repeated
measures designs, Parte II J. Statist. Prob. Lett. 17, 149-156.

AKRITAS. M.G., ARNOLD, S.F., Y BRUNNER, E., 1997. Nonparamctric hypothesis and
rank statistics for unbalanced factorial designs. J. Amer. Statist. Assoc. 92, 258-265.

ASCANIO, M., Y MONTAA, R (2007). Anlisis estadstico no paramtrico para


experimentos factoriales 2k y 3k, para K: 2 y 3. Tesis de Maestra. Facultad de
Agronoma UCV.

BEASLEY T.M. Y B.D. ZUMBO (2003). Comparison of aligned Friedman rank and
parametric methods for testing interactions in split-plot designs. Computational
Statistics & Data Analysis. 42. 569 593.

BALESTRINI ACUA, MIRAN (1998) Cmo se elabora el Proyecto de Investigacin


(2da Edicin) Caracas: BL Consultores Asociados, servicio Editorial

BERENSON, M.L. Y D.M. LEVENE. 1992. Basic business statistics: Concepts and
applications. 5th Ed. Prentice-Hall, Inc., EE.UU. 953 pp.
BICKEL, P. (1965). On some asymptotically non-parametric competitors of hotellings T2.
Ann. Math. Statist. 36, 160-173.

BIELINSKI M. SANTOS, JAMES P. GILREATH, RAMN ARBONA Y ANGEL R.


PIMENTEL. 2002. La Estadstica no Paramtrica para el Anlisis e Interpretacin de
Estudios de Plagas: Alternativas al Anlisis de Varianza.
BREUSCH, T (1979) Conflict among criteria for testing hypotheses: Extensions y
comments. Econometrica 47 (1): 203-307.
34

BRUNNER Y PURI M. 2000. A class of rank score test in factorial designs. J. Statist.
Plann. Inference (to appear).

BRUNNER, E., Y MUNZEL, U. (2000). Nonparametric methods in multivariate factorial


designs. Journal of Statistical Planning and Inference 88, 117-132.

BRUNNER E., PURI M., Y SUN S., (1995). Nonparametric methods for stratified twosample designs whit application to multiclinic trials. J. Amer. Statist. Assoc. 90,
1004-1014.

CALZADILLA, JOSEFINA.1999. Procedimientos de la estadstica no paramtrica.


Aplicaciones en las Ciencias Agropecuarias. Tesis presentada en opcin al ttulo de
Master en Matemtica Aplicada a las Ciencias Agropecuarias.

CANAVOS, G., (1988). Probabilidad y estadsticas. Mc. Graw-Hill. Mexico, D.F. 651 p

CHACN, F., (2000). Diseo y Anlisis de experimentos. Ediciones del Vicerrectorado


Academico, U.C.V. Caracas-Venezuela.

CONOVER, W.J. Y IMAN, R.L. (1976). In Some Alternative Procedure Using Rank for
the Anlisis of Experimental Desings. Commum. Statist. Theor. Math. A5(14).13491368.

DYKE, G. V., AND H. D. PATTERSON. 1952. Analysis of factorial arrangements when


the data are proportions. Biometrics 8: 1_12.

GEDAM, S.G.; BEAUDET, S.T. (2000): Monte Carlo Simulation using Excel Spreadsheet
for Predicting Reliability of a Complex System. Proceedings Annual Reliability and
Maintainability Symposium.
HETTMANSPERGER, T., MCKEAN, J. y SHEATHER, S., (2000). Robust nonparametric
methods. J. A. S. A., 95, 452, 1308-1312.

JUDGE, G. (1999): Simple Monte Carlo studies on a spreadsheet. Computers in Higher


Education Economics Review (CHEER). Volume 13, Issue 2. Disponible en
http://www.economics.ltsn.ac.uk/cheer/ch13_2/ch13_2p12.htm

35

KEPNER J., Y ROBINSON, D. (1988). Nonparametric methods for detecting treatment


effects in repeated measures designs. J. Amer. Statist. Assoc. 83, 456-461
KOCH GARY G. 1969. Some aspects of the statistical anlisis of Split plot experiments
in completely randomized layouts. J. Amer. Statist. Assoc. 485-505

MANN, H. Y WHITNEY, D.(1947). On a test of whether one of two random variables is


stochastically larger then the other. Annals of Mathematical Statistics 18, 50-60.

MIARRRO, A. 1998. Estimacin no paramtrica de la funcin de densidad. Editorial


Barcelona. Espaa. 5p.
MONTGOMERY, D. (1991). Diseo y Anlisis de experimentos. Grupo Editorial
Iberoamerica Mxico, D.F. 588p.

MOOD, ALEXANDER M. AND GRAYBILL, FRANKLIN A. 1972. Introduccin a la


teora de la Estadstica. Edicin espaola. Aguilar S.A. de ediciones. Madrid. Espaa.
528p.

OTT, L., M.T. LONGNECKER Y R.L. OTT. 2000. An introduction to statistical methods
and data analysis. 5th Ed. Brooks-Cole Publ., EE.UU. 1184 pp.
RESAMPLING STATS, Inc (2007) Resampling Stats add-in for Excel. Users Guide
Version 3.
RUPERT G. MILLAR JR. (1980). Simultaneous Statistical inference. Second Edition.

SHAH, D.A. Y MADDEN, L.V. (2004). Nonparametric Analysis of Ordinal Data in


Designed Factorial. The American Phytophatological Society. Vol 94 N1. 33-44

SIEGEL, S., (2000). Estadstica no paramtrica aplicada a las ciencias de la conducta.


Editorial Trillas, S.A. Mxico, D.F.

STEEL Y TORRIE, J. (1990). Principies and procedures of statistic. Mc Grawhill. Broth


Co. Inc. New York.

THOMPSON, G. Y AMMANN, L (1989). Efficacies of rank-transform statistics in twoway models with no interaction. J. Amer. Statistic. Assoc. 84, 325-330.
36

THOMPSON J Y R. PARMER (1995). A comparison of nonparametric methods with


parametric Methods for the cps cati/capi mode effects analysis. Statist. Theor.
Math. A4 (11).1300-1315.

T. MARK BEASLEYA, BRUNO D. ZUMBO. 2002. Comparison of aligned Friedman


rank and parametric methods for testing interactions in split-plot

VILLEGAS RIVAS, DANNY. 2007. Alternativas de anlisis estadstico no paramtrico en


experimentos con mediciones repetidas en el tiempo.
G. VALLEJO SECO y J.R. ESCUDERO GARCIA. Algunas soluciones aproximadas para
diseos split-plot con matrices de covarianza arbitrarias, QU ESTIIO, vol. 22, 3, p.
443-468, 1998

37

También podría gustarte