0% encontró este documento útil (0 votos)
228 vistas8 páginas

Comparación de Jackknife y Bootstrap

Este documento compara los métodos de remuestreo Bootstrap y Jackknife utilizando los estimadores de Kaplan-Meier y Nelson-Aalen para estimar la función de confiabilidad en situaciones con diferentes porcentajes de censura, tamaños de muestra y distribuciones de probabilidad como la exponencial y Weibull. Los métodos se comparan a través de simulaciones utilizando el error cuadrático medio. El documento concluye que el método de remuestreo más adecuado depende de factores como el porcentaje de censura y la distribución
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
228 vistas8 páginas

Comparación de Jackknife y Bootstrap

Este documento compara los métodos de remuestreo Bootstrap y Jackknife utilizando los estimadores de Kaplan-Meier y Nelson-Aalen para estimar la función de confiabilidad en situaciones con diferentes porcentajes de censura, tamaños de muestra y distribuciones de probabilidad como la exponencial y Weibull. Los métodos se comparan a través de simulaciones utilizando el error cuadrático medio. El documento concluye que el método de remuestreo más adecuado depende de factores como el porcentaje de censura y la distribución
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Javier Ramírez-Montoya - Ignacio Osuna-Vergara - Jessica Rojas-Mora - Stalyn Guerrero-Gó-

mez

Remuestreo Bootstrap y Jackknife en confiabilidad: Caso


Exponencial y Weibull

Bootstrap and Jackknife resampling in reliability: Case


Exponential and Weibull
Reamostragem Bootstrap e Jackknife em confiabilidade: Caso
Exponencial e Weibull

Javier Ramírez-Montoya*
Ignacio Osuna-Vergara**
Fecha de recepción: 15 de septiembre de 2015 Jessica Rojas-Mora***
Fecha de aprobación: 19 de diciembre de 2015 Stalyn Guerrero-Gómez****

Resumen
Se comparan los métodos de remuestreo Bootstrap-t y Jackknife delete I y delete II, utilizando los estimadores
no paramétricos de Kaplan-Meier y Nelson-Aalen, que se utilizan con frecuencia en la práctica, teniendo en
cuenta diferentes porcentajes de censura, tamaños de muestra y tiempos de interés. La comparación se realiza vía
simulación, mediante el error cuadrático medio.

Palabras clave: Bootstrap, Jackknife, Función de confiabilidad.

Abstract
In this paper the resampling methods bootstrap-t, Jackknife delete I and delete II, are compared using the non-
parametric estimators Kaplan-Meier and Nelson-Aalen, frequently used in the practice, taking into account different
percentages of censorship, sample sizes and times of interest. The comparation is carried out by simulation, using
the mean square error.

Keywords: Bootstrap, Jackknife, Reliability Function.

* [Link]. Universidad de Sucre (Sincelejo-Sucre, Colombia). [Link]@[Link].


** Universidad de Córdoba (Montería-Córdoba, Colombia). iosuna@[Link].
*** Universidad de Córdoba (Montería-Córdoba, Colombia). jmrojas@[Link].
**** [Link]. (c) Universidad Santo Tomás (Bogotá-Distrito Capital, Colombia). stalynguerrero@[Link].

Facultad de Ingeniería (Fac. Ing.) Vol. 25 (41). pp. 55-62 Enero-Abril, 2016. Tunja-Boyacá, Colombia.
55
ISSN Impreso 0121-1129, ISSN Online 2357-5328, DOI: [Link]

. pp. 55-62
Remuestreo Bootstrap y Jackknife en confiabilidad: Caso Exponencial y Weibull

Resumo
Comparam-se os métodos de reamostragem Bootstrap-t e Jackknife delete I e delete II, utilizando os estimadores
não paramétricos de Kaplan-Meier e Nelson-Aalen, que se utilizam com frequência na prática, tendo em conta
diferentes porcentagens de censura, tamanhos de amostra e tempos de interesse. A comparação realiza-se via
simulação, mediante o erro quadrático médio.

Palavras chave: Bootstrap, Jackknife, Função de confiabilidade.

Cómo citar este artículo:


[1] J. Ramírez-Montoya, I. Osuna-Vergara, J. Rojas-Mora & S. Guerrero-Gómez, “Remuestreo Bootstrap y
Jackknife en confiabilidad: Caso Exponencial y Weibull”, Fac. Ing., vol. 25 (41), pp. 55-62, ene.-abr. 2016.

Facultad de Ingeniería (Fac. Ing.) Vol. 25 (41). pp. 55-62 Enero-Abril, 2016. Tunja-Boyacá, Colombia.
56
Javier Ramírez-Montoya - Ignacio Osuna-Vergara - Jessica Rojas-Mora - Stalyn Guerrero-Gómez

I. Introducción En caso de desconocimiento distribucional del


tiempo de interés, la estimación no paramétrica
Cuando en la industria, y en particular en ingeniería, resulta de mucha ayuda; en este trabajo se utilizan los
se modela el tiempo de ocurrencia de un evento de estimadores:
interés (tiempo de falla) de un circuito, estructura,
componente, etc., uno de los objetivos principales es A. Kaplan-Meier:
encontrar la mejor estrategia para estimar la función
de confiabilidad o, también llamada, de supervivencia, (2)
para lo cual las técnicas de remuestreo son una buena
alternativa, debido a sus propiedades asintóticas; sin Donde nj es el número de individuos en riesgo en tj, es
embargo, teniendo en cuenta las situaciones extremas decir, el número de individuos vivos y no censurados
de porcentajes de censura altos, las estimaciones son justo antes de tj. Cualquier individuo con tiempo de
afectadas de manera significativa. censura registrado igual a tj será incluido en el conjunto
de nj individuos en riesgo en tj, como individuos que
Este trabajo presenta la situación en la que los tiempos murieron en tj. Esta convención es razonable, puesto
observados y censurados pueden ajustarse a un que un individuo censurado en el tiempo tc falla por
modelo de probabilidad conocido de una distribución evento de interés después de tc [4].
de Weibull y Exponencial, que en el área de la
industria suceden a menudo, debido a las bondades
B. Nelson-Aalen:
del comportamiento de la función hazard de dichas
distribuciones (creciente, decreciente, constante); por
Proponen estimar la función de confiabilidad como:
lo tanto, el interés se centra en la determinación del
método de remuestreo, bootstrap o jackknife delete
I y delete II, que presente los mejores resultados en (3)
dichos escenarios. En la actualidad no se encuentran
trabajos que comparen simultáneamente en cuanto Con
a Confiabilidad estas estrategias de remuestreo; un
trabajo relacionado es el de Arrabal et al. [1], pero en (4)
otro contexto.
Denominada función hazard acumulada. Ramírez
[8] sugiere utilizar el estimador de Nelson-Aalen en
II. Función de confiabilidad muestras pequeñas.

Cuando se tienen tiempos de falla, de los cuales k <


𝑛 son observados, estimar la función de confiabilidad, III. Remuestreo Bootstrap en
dada por: confiabilidad

(1) Usando remuestreo bootstrap, propuesto por Efron


[2], en los estimadores definidos en (2) y (3) se siguen
definida como la probabilidad de que un sistema o los siguientes pasos:
componente desarrolle sus funciones bajo condiciones
de operación, por un período específico de tiempo [5]. 1. Dada la muestra de tamaño 𝑛, estime .

Todos los tiempos de falla en confiabilidad no siempre 2. Genere B remuestras bootstrap de tamaño n
se recogen durante un corto período de tiempo, ya mediante muestreo con reemplazamiento de la
que ocurre un fenómeno llamado censura, que hace muestra original, asignando a cada tiempo una
que solo se tenga información parcial del tiempo de probabilidad y calcular los correspondientes
falla, afectando considerablemente la estimación. valores para cada
Existen diferentes tipologías de censura; este trabajo
trata el caso de la censura a derecha, representando una de las B muestras bootstrap.
los experimentos en los que al finalizarlos, a algunas
unidades estudiadas no les ocurre el evento de interés.

Facultad de Ingeniería (Fac. Ing.) Vol. 25 (41). pp. 55-62 Enero-Abril, 2016. Tunja-Boyacá, Colombia.
57
Remuestreo Bootstrap y Jackknife en confiabilidad: Caso Exponencial y Weibull

3. Estimar el error estándar del parámetro estimado La expresión de la estimación del error estándar del
, calculando la desviación estándar de las B jackknife delete-d es:
réplicas bootstrap. Así, obtenemos que el error
estándar está dado por: (8)

(5) Donde

Donde * corresponde al promedio de la estimación (9)


de la función de confiabilidad evaluada en cada tiempo
ti de las muestras bootstrap; el procedimiento se es el promedio de las estimaciones de todos los
realiza con base en el tiempo de interés primer cuartil. subconjuntos s de tamaño (n - d) sin reemplazo para
𝑥1, 𝑥2, … , 𝑥n.
IV. Remuestreo Jackknife en
confiabilidad V. Estudio de simulación
Se generaron muestras artificiales mediante un
A. Jackknife Delete - I algoritmo en R, considerando tiempos observados y
censurados Exponencial, Weibull y combinaciones,
Una de las primeras técnicas para obtener los estimadores con tiempo de interés el primer; luego, se generaron
estadísticos fiables es Jackknife. Supongamos que muestras de tamaño con porcentajes de censura
tenemos una muestra 𝑋 = (𝑥1, 𝑥2, … , 𝑥n) y un estimador correspondientes al, y finalmente se calculó el de
= s(t). La técnica jackknife se centra en las muestras la función de supervivencia con los métodos de
que dejan de lado una observación a la vez: remuestreo en el estudio.
(6) Se generaron 200 muestras mediante simulación de
Monte Carlo, con 500 remuestras bootstrap. Teniendo
Para i=1,2,…,𝑛, estas son llamadas muestras en cuenta que los métodos de remuestreo Bootstrap
Jackknife. La i-ésima muestra Jackknife consiste en el y Jackknife a los estimadores no paramétricos tienen
conjunto de datos eliminando la i-ésima observación. funcionalidades diferentes en el cálculo de estimación
Sea la i-ésima replicación Jackknife de . de error estándar, la comparación de dichas estrategias
mediante simulación se considera la más adecuada en
La estimación del error estándar Jackknife se define: este estudio.

(7)
VI. Resultados
Donde
Para mostrar la eficiencia que tienen los métodos de
remuestreo se presentan inicialmente los resultados de
B. Método Jackknife delete-d los intervalos de confianza mediante la amplitud y las
coberturas reales de simulación. En la situación más
En lugar de dejar una observación a la vez, dejamos extrema, con menor tamaño muestral, utilizando un
de lado las observaciones d; por lo tanto, el tamaño de nivel nominal del 95%.
delete-d muestras Jackknife es (𝑛 - d).

Facultad de Ingeniería (Fac. Ing.) Vol. 25 (41). pp. 55-62 Enero-Abril, 2016. Tunja-Boyacá, Colombia.
58
Javier Ramírez-Montoya - Ignacio Osuna-Vergara - Jessica Rojas-Mora - Stalyn Guerrero-Gómez

Tabla I
Amplitud de los I.C primer cuartil, n=25
% de censura [Link] [Link] [Link] [Link] [Link] [Link]
0 0,1753192 0,2096854 0,1931827 0,1687640 0,2048649 0,188630
5 0,2645543 0,294564 0,2822439 0,2552640 0,2882814 0,2760016
10 0,3211105 0,3449007 0,3349442 0,3105559 0,3382819 0,3281966
20 0,3422287 0,3637719 0,3555481 0,3319456 0,3573434 0,3488726
35 0,3496017 0,3703001 0,3644397 0,3394571 0,364055 0,3578778
60 0,3554676 0,3752485 0,3702493 0,3458087 0,3692161 0,3638336
80 0,3571909 0,3728129 0,3728129 0,3475298 0,371300 0,3664939

En la Tabla I se observa que los I.C. mediante de Kaplan-Meier; esto indica que los I.C. mediante
remuestreo bootstrap al estimador de Nelson-Aalen bootstrap en muestras pequeñas presentan los mejores
resultan ser un poco más precisos que los de las resultados.
demás estrategias, seguidos de bootstrap al estimador

Tabla II
Cobertura de los I.C primer cuartil, n=25
% de censura [Link] [Link] [Link] [Link] [Link] [Link]
0 0,994556 0,99976 0,9994267 0,997116 0,99976 0,9995
5 0,995658 1 0,99957 0,997816 1 0,99991
10 0,996834 0,99972 0,9999967 0,998212 1 1
20 0,998146 1 1 0,999208 1 1
35 0,999342 1 0,9999967 0,99979 1 1
60 0,999904 1 1 0,999982 1 1
80 0,999976 1 1 1 1 1

Por otra parte, es de destacar que, con las estrategias


de remuestreo a través de cualquier estimador, las
coberturas reales de simulación son mayores a las
nominales, debido a la amplitud de los intervalos,
sin embargo, teniendo en cuenta los dos criterios
simultáneamente se pueden sugerir como intervalos
las mejores estrategias de la Tabla I. Finalmente, para
tener más objetividad en la escogencia de las mejores
estrategias de remuestreo, ya que los intervalos
pueden ser sesgados, como este caso en la que la
opción utilizada en el argumento de R, type=norm, se
recomienda calcular los errores cuadráticos medios
como medida general de eficiencia.

Estos comportamientos se presentan de forma similar


en tamaños de muestra n = 50 y 100.
Fig. 1. Error cuadrático Medio, n=25.
Luego, ilustrando los resultados para los errores En la Gráfica 1, cuando se aumentan los porcentajes
cuadráticos medios se obtiene lo siguiente: de censura las estimaciones son considerablemente

Facultad de Ingeniería (Fac. Ing.) Vol. 25 (41). pp. 55-62 Enero-Abril, 2016. Tunja-Boyacá, Colombia.
59
Remuestreo Bootstrap y Jackknife en confiabilidad: Caso Exponencial y Weibull

afectadas; además, la estrategia de remuestreo


Jackknife delete II a través del estimador de Nelson-
Aalen presenta mejores resultados, seguida de
Jackknife delete II a través del estimador de Kaplan-
Meier; esto indica una mejoría en las estimaciones
sobre las estrategias comunes usadas en confiabilidad,
independientemente del porcentaje de censura.

Por otra parte, se notan unas posibles agrupaciones


sobre los resultados de los errores cuadráticos medios,
es decir, un grupo de estrategias de remuestreo
Bootstrap y otro de estrategias de remuestreo
Jackknife.

Fig. 3. Error cuadrático medio, n=25, 50,100

Fig. 2. Error cuadrático medio, n=50

En la Gráfica 2 se observa que cuando se aumenta


el tamaño muestral a n=50, se enmarcan de forma
más clara las agrupaciones de los resultados de los
Fig. 4. Error cuadrático medio, n=25, 50,100
errores cuadráticos medios, para los casos Bootstrap y
Jackknife, siendo los últimos más eficientes.

Para resumir la ilustración de los resultados en cada


estrategia de remuestreo, se presentan las Gráficas 3,
4, 5, 6, 7 y 8. Notando que en las Gráficas 3, 4, 6 y 7
la velocidad de disminución de los errores cuadráticos
medios es mayor frente a las Gráficas 5 y 8, lo que
confirma que la ganancia en la disminución del error
cuadrático medio del método de remuestreo Jackknife
frente al método Bootstrap se obtiene en muestras
pequeñas.

Fig. 5. Error cuadrático medio, n=25, 50,100

Facultad de Ingeniería (Fac. Ing.) Vol. 25 (41). pp. 55-62 Enero-Abril, 2016. Tunja-Boyacá, Colombia.
60
Javier Ramírez-Montoya - Ignacio Osuna-Vergara - Jessica Rojas-Mora - Stalyn Guerrero-Gómez

VII. Conclusiones
Cuando se tienen muestras pequeñas y observaciones
completas, la técnica de remuestreo Jackknife delete I
presenta mejores resultados a través del estimador de
Nelson-Aalen.

Cuando se tienen observaciones censuradas, los


mejores resultados se obtienen con la técnica de
remuestreo Jackknife delete II a través del estimador
Nelson-Aalen.

Las amplitudes de los intervalos de confianza mediante


remuestreo bootstrap resultan ser mejores.

Fig. 6. Error cuadrático medio, n=25, 50,100 La velocidad con que disminuyen los errores
cuadráticos medios mediante la técnica de remuestreo
Bootstrap es mayor a Jackknife.

Los métodos de remuestreo en las condiciones de este


estudio resultan ser muy eficientes sobre la cobertura
de los Intervalos de confianza.

Agradecimientos
Los autores del presente trabajos agradecen de manera
muy especial a la Universidad de Sucre, Universidad
de Córdoba y Universidad Santo Tomás por todo
el apoyo, además de los árbitros por sus valiosas
sugerencias.

Fig. 7. Error cuadrático medio, n=25, 50,100 Referencias


[1] C. Arrabal, R. Da Rocha, R. Nonaka, S. Meira.
“Comparison of resampling method applied
to censored data”, International Journal of
Advanced Statistics and Probability, Vol. 2,
No. 2, pp. 48-55. 2014. DOI: [Link]
org/10.14419/ijasp.v2i2.2291.
[2] B. Efron. “Bootstrap methods: Another look
at jackknife”, The Annals of Statistics, Vol. 7,
pp. 1-26. 1979. DOI: [Link]
aos/1176344552.
[3] E. Kaplan and P. Meier. “Estimation from
Incomplete Observations”, American Statistical
Association, Vol. 53, pp. 457-481. 1958. DOI:
[Link]
1452.
Fig. 8. Error cuadrático medio, n=25, 50,100

Facultad de Ingeniería (Fac. Ing.) Vol. 25 (41). pp. 55-62 Enero-Abril, 2016. Tunja-Boyacá, Colombia.
61
Remuestreo Bootstrap y Jackknife en confiabilidad: Caso Exponencial y Weibull

[4] J. Lawless. Statistical Models and Methods [7] R. Development Core Team. R: A Language
for Lifetime Data. New York: Wiley and Sons, and Environment for Statistical Computing”.
2003. 2007. R Foundation for Statistical Computing,
[5] W. Meeker, L. Escobar. Statistical Models and Vienna, Austria. Avalaible: [Link]
Methods for Reliability Data. N.Y. John Wiley [Link].
& Sons. 1998. [8] J. Ramírez. “Comparación de intervalos de
[6] W. Nelson. “Hazard plotting for incomplete confianza para la función de supervivencia con
failure data”. Journal of Quality Technology, censura a derecha”. Revista Colombiana de
Vol. 61, pp. 27-52. 1969. Estadística, Vol. 34, pp. 197-209. 2011.

Facultad de Ingeniería (Fac. Ing.) Vol. 25 (41). pp. 55-62 Enero-Abril, 2016. Tunja-Boyacá, Colombia.
62

También podría gustarte