0% encontró este documento útil (0 votos)
139 vistas116 páginas

Texto - Bioestadística

El texto básico de bioestadística, escrito por la Dra. Rosa del Carmen Saeteros Hernández, tiene como objetivo proporcionar herramientas a los profesionales de la salud para facilitar la investigación y el análisis de problemas médico-sociales. Se abordan conceptos fundamentales de estadística, su clasificación, y su aplicación en el ámbito de la salud, enfatizando la importancia de la recolección y análisis de datos para la planificación y control de actividades sanitarias. El documento incluye ejercicios integradores para aplicar los conocimientos adquiridos en cada capítulo.

Cargado por

joel cando
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
139 vistas116 páginas

Texto - Bioestadística

El texto básico de bioestadística, escrito por la Dra. Rosa del Carmen Saeteros Hernández, tiene como objetivo proporcionar herramientas a los profesionales de la salud para facilitar la investigación y el análisis de problemas médico-sociales. Se abordan conceptos fundamentales de estadística, su clasificación, y su aplicación en el ámbito de la salud, enfatizando la importancia de la recolección y análisis de datos para la planificación y control de actividades sanitarias. El documento incluye ejercicios integradores para aplicar los conocimientos adquiridos en cada capítulo.

Cargado por

joel cando
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

ESPOCH

FACULTAD DE SALUD PÚBLICA


ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

ESCUELA SUPERIOR POLITÉCNICA DE


CHIMBORAZO

FACULTAD DE SALUD PÚBLICA

ESCUELA DE PROMOCION Y CUIDADOS DE LA


SALUD

TEXTO BÁSICO

BIOESTADÍSTICA

Rosa del Carmen Saeteros Hernández.


Doctora en Ciencias de la Salud (PhD)
Doctora en Promoción de la Salud
Máster en Atención Primaria de Salud
Máster Educación Sexual
Especialista en Educación Virtual
Especialista en Computación Aplicada a la Docencia

Docente Cátedra de Bioestadística

Riobamba - Ecuador

Dra. Rosa Saeteros Hernández. M.Sc. 1


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

TEXTO BÁSICO

BIOESTADÍSTICA

Rosa del Carmen Saeteros Hernández.


Docente Cátedra de Bioestadística

Doctora en Promoción de la Salud


Master en Atención Primaria de Salud
Magister en Educación Sexual
Especialista en Computación

Primera Edición.
Centro de Reproducción Digital ESPOCH. 2009
Riobamba - Ecuador

Dra. Rosa Saeteros Hernández. M.Sc. 2


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

Se prohíbe la reproducción parcial o total del los contenidos de este texto


TEXO BASICO DE BIOESTADÍSTICA
CONTENIDOS

CAPITULO I INTRODUCCIÓN A LA ESTADÍSTICA 1


Concepto de Estadística 1
Estadística. Clasificación 1
Usos de la Estadística 2
Ejercicio Integrador I 2
CAPITULO II EL MÉTODO CIENTÍFICO Y LA ESTADÍSTICA 3
Método Científico 3
Etapas del Método Científico 3
La Estadística y el Método Científico 4
El Método Estadístico y sus Etapas 9
Ejercicio Integrador II 10
CAPITULO III PRINCIPIOS BÁSICOS DE LA RECOLECCIÓN DE LA 11
INFORMACIÓN 12
Fuentes de Obtención de la Información 12
Principales Métodos de Recolección de la Información 14
Reglas Básicas para la Construcción de los Formularios 14
Opciones en la Formulación de Preguntas 16
Ejercicio Integrador III 19
CAPITULO IV 20
TÉCNICAS DE MUESTREO 20
Universo y Muestra 20
Ventajas del Empleo de muestras 21
Desventajas del empleo de muestras 21
Condiciones de una buena muestra 21
Cantidad de unidades del estudio en una muestra 23
Calidad de la Muestra 23
Clases de Muestras 26
Ejercicio Integrador IV
CAPITULO V CLASIFICACIÓN Y COMPUTACIÓN DE LOS DATOS 27
ESTADÍSTICOS
Variables o Escalas de Clasificación 28
Tipos de Variables o Escalas de Clasificación 28
Condiciones para Elaborar una Escala Cuantitativa 29
Clasificación de los Datos 30
▪ Distribuciones de Frecuencias 30
Redondeo de Datos 30
Tipos de Frecuencias 31
Tablas de Intervalos o Clases 32
Tipos de Intervalos o Clases 35
Regla de Sturges 36
Límites de clase 38
Punto Medio o Marca de clase 38
Amplitud de Clase 39
▪ Datos de Asociación 39
▪ Series Cronológicas 39
Ejercicio Integrador V 40

Dra. Rosa Saeteros Hernández. M.Sc. 3


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

CAPITULO VI FORMAS DE ORGANIZAR, RESUMIR Y PRESENTAR LA 43


INFORMACIÓN ESTADÍSTICA
Presentación Tabular o Cuadros Estadísticos 43
Tipos de Tablas Estadísticas 43
Partes de una Tabla Estadística 44
Errores en la Presentación Tabular 44
Formas de Leer Tablas Estadísticas 45
Formas de Presentación Gráfica 46
Formas de Presentación Gráfica, Variables Cualitativas 46
Y Cuantitativas Discretas con Clases de Igual Amplitud
Formas de Presentación Gráfica, Variables Cuantitativas 51
Continuas y discretas con clases de desigual amplitud
Gráfico de Frecuencias Acumuladas 56
Gráfico Aritmético Simple 58
Ejercicio Integrador VI 62
CAPITULO VII MEDIDAS DESCRIPTIVAS 62
Medidas de Resumen para Variables Cualitativas(Razón, Índice, 62
Proporción, Porcentaje y tasas)
Medidas de Resumen para Variables Cuantitativas. 65
Medidas de tendencia central en series no agrupadas y en series 66
agrupadas: media o promedio aritmético, mediana, moda. Gráficos
de Cajas.
Medidas de dispersión en series no agrupadas y agrupadas 71
:desviación estándar, varianza, coeficiente de variación
Ejercicio Integrador VII 74
CAPITULO VIII 76
CALCULO DE PROBABILIDADES 76
Probabilidades 76
Utilización de la desviación estándar (Distribución Normal) 78
Cálculo de las áreas por debajo de la curva normal 78
Calculo de la distribución normal o típica 79
Ejercicio Integrador VIII
CAPITULO IX INFERENCIA ESTADÍSTICA 80
ESTIMACIÓN DE PARÁMETROS Y PRUEBAS DE HIPÓTESIS
Parámetros
Límites de Confianza para el promedio y porcentaje
Ejercicio Integrador IX 80
81
83
CAPITULO X PRUEBAS DE HIPÓTESIS 84
Hipótesis 84
Hipótesis Nula y Alternativa 84
Pasos a tomar en cuanta para el planteamiento de una Hipótesis
Prueba z (n>30 datos)Ejercicio Integrador 85
Comparación de una media de la muestra con una media de la población 85
IX Ejercicio Integrador X 87

88
CAPITULO XI PRUEBAS PARAMÉTRICAS 89
Prueba “t” de student. 89
Prueba “t” de student para muestras pequeñas (< 30 datos) 89

Dra. Rosa Saeteros Hernández. M.Sc. 4


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

Prueba “t” de student para dos muestras independientes con 92


varianzas no homogéneas.
Prueba “t” de student para datos relacionados (muestras 95
dependientes)
Ejercicio Integrador XI 98
CAPITULO XII PRUEBA NO PARAMÉTRICA 99
“Ji” Cuadrado 99
Ejercicio Integrador XII 102
CAPITULO XIII CORRELACIÓN Y REGRESIÓN LINEAL SIMPLE 103
Correlación 103
Regresión 103
Ejercicio Integrador XIII 108

BIBLIOGRAFÍA CITAS BIBLIOGRAFICAS 109


BIBLIOGRAFIA CONSULTADA 110
ANEXOS ANEXO No. 1 Tabla de Números al azar 111
ANEXO No 2 Tabla de valores z 112
ANEXO No. 3 Tabla t student 113
ANEXO No. 4 Tabla Ji Cuadrado 114
ANEXO No. 5 Programa Analítico Bioestadístic 115

Dra. Rosa Saeteros Hernández. M.Sc. 5


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

INTRODUCCIÓN

El propósito de este texto básico de bioestadística, es el de proporcionar a los


profesionales de la salud una herramienta sencilla y simplificada, que les permita
desarrollar sus funciones de investigación, así como las de conocer los problemas médico
sociales de la comunidad, la morbi - mortalidad de esta, planificar, organizar, dirigir y
controlar las diferentes actividades de salud.

La medicina actualmente posee un amplio campo de actividades que incluyen la


curación de enfermedades, la prevención y promoción de la salud, el control higiénico
ambiental de la comunidad, la protección del trabajador y la planificación, ejecución y
control de los programas sanitarios que garanticen un óptimo estado de salud de la
población. Este universo abarca la actuación no solo sobre el hombre enfermo, sino que
integra además el hombre sano y el medio en que este desenvuelve su vida.

La amplitud e importancia que se le confieren en la actualidad a la medicina social


conlleva la necesidad de utilizar técnicas que difieren de las que comúnmente utiliza el
personal de salud para tratar de realizar un diagnóstico y prescribir un tratamiento que
devuelva la salud a su paciente.

La salud de la población, tratada en este amplio marco requiere del uso de indicadores
que revelen la realidad en cuanto al desarrollo del proceso salud – enfermedad en su
dimensión social. A partir de esta necesidad se plantea la recolección y elaboración de
grandes volúmenes de datos que exigen para su análisis y tratamiento, de métodos
adecuados al resumen, presentación y evaluación de esta información

Dra. Rosa Saeteros Hernández. M.Sc. 6


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

CAPÍTULO I
INTRODUCCIÓN A LA BIOESTADÍSTICA
OBJETIVOS
• Definir conceptualmente a la estadística y bioestadística
• Identificar las aplicaciones de la bioestadística en el ámbito de la salud

CONTENIDOS
• Concepto de Estadística y Bioestadística
• Estadística. Clasificación
• Usos de la Bioestadística para el Profesional de Salud
• Ejercicio Integrador I

Concepto de Estadística y Bioestadística

La palabra estadística tiene dos diferencias: “la palabra estadísticas con minúsculas y
en plural se entiende como cualquier conjunto de datos así: estadísticas vitales, estadísticas de
población. Mientras que la Estadística con mayúscula y en singular es la ciencia que
proporciona diferentes técnicas y procedimientos que permiten recolectar, organizar, procesar,
resumir, presentar, analizar e interpretar la información recogida” 1.

De estas diferencias presentadas se puede observar los campos de acción de la


estadística, pudiendo decirse que no hay prácticamente rama del saber humano en donde no
tenga utilización. Al aplicar estas técnicas y procedimientos al campo de la salud y las
ciencias biológicas toma el nombre de BIOESTADISTICA.

Bioestadística

“Las Herramientas de la estadística se emplean en muchos campos: negocios, educación,


psicología, agricultura y economía para mencionar sólo unos cuántos. Cuando los datos que se
están analizando se obtienen de las ciencias biológicas y de la medicina, se utiliza el término
bioestadística para diferenciar a esta aplicación particular de herramientas y conceptos
estadísticos”2.

Estadística Clasificación.

La estadística se divide en dos ramas, la Estadística Descriptiva y la Estadística


Inferencial.

Estadística Descriptiva.

Es aquella que brinda los métodos y procedimientos para recolectar, procesar y


presentar la información recogida sobre un determinado aspecto.

Estadística Inferencial.

Dra. Rosa Saeteros Hernández. M.Sc. 7


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

Ofrece las técnicas y procedimientos para realizar el análisis de los datos recogidos, y
nos permiten hacer inferencias o sacar conclusiones de un aspecto estudiado. La estadística
inferencial basa estudio en una muestra y estos resultados se infieren a una población.
Usos de la Bioestadística para el Profesional de Salud

Para el personal de salud, el método estadístico en un instrumento invalorable, al investigador


que trata de probar una hipótesis de trabajo, la estadística le ayudará a decidir sobre el
número de pacientes que debe estudiar para que sus conclusiones tengan validez, a recoger
adecuadamente los datos pertinentes, a resumir y analizar convenientemente el material
reunido y a presentar a otros el resultado de sus investigaciones.

En el campo de la clínica, al diagnostico de una enfermedad es posible llegar mediante la


experiencia ganada a través del análisis estadístico de un conjunto de síntomas y signos
observados en muchos individuos.

Un pronóstico a su vez no es más que la aplicación y cálculo de probabilidades, por ejemplo


en un paciente que presenta Fiebre Tifoidea podemos predecir que se salvará, pues el estudio
estadístico de innumerables enfermos, demuestra que la enfermedad cuando se trata
correctamente, sólo es fatal en u 3% de los casos.

Así como también solo a través de la Estadística podemos analizar el efecto de un nuevo
tratamiento, se deben a la casualidad o si pueden ser lógicamente atribuidos al nuevo
tratamiento.

En el campo de la Salud Pública, solo mediante procedimientos estadísticos podrá conocerse


la composición y principales características de la población que se va ha servir, los cambios
que acontecen en ella, los riesgos a que está sometida y las necesidades que presentan.

La planificación de las actividades de Salud Pública, el control de los programas que se estén
desarrollando y la evaluación final de sus rendimientos y eficiencia solo podrá llevarse a cabo
mediante procedimientos estadísticos.

EJERCICIO INTEGRADOR I.

A continuación se presentan algunas situaciones problémicas:

1. Un investigador posee un análisis de un fenómeno biomédico determinado y expresa sus


resultados a través de tablas y gráficos estadísticos, además de realizar un comentario donde
resalta las diferencias porcentuales. Ante que tipo de análisis nos encontramos?

2. En el análisis de los resultados de determinado fenómeno biomédico el investigador resalta


en muchas partes las diferencias existentes entre los valores hallados y los valores que se
deberían esperar, de acuerdo a estudios anteriores de esa población de la que se tomó una
porción. Puede Usted clasificar el tipo de análisis estadístico de que se trata?

3 Señale varios usos de la estadística como herramienta de trabajo para la Atención Primaria
de Salud y la Promoción y Educación para la Salud.

"La mayoría de las ideas fundamentales de la ciencia son esencialmente sencillas y,


por regla general pueden ser expresadas en un lenguaje comprensible para todos."
Dra. Rosa Saeteros Hernández. M.Sc. 8
Albert Einstein
ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

CAPÍTULO II
EL MÉTODO CIENTÍFICO Y LA ESTADÍSTICA
OBJETIVOS
• Analizar los elementos teóricos y conceptuales sobre los cuáles se fundamenta el
estudio de la estadística

CONTENIDOS
• Método
• Método Científico
• Etapas del Método Científico. Como Abordar el Problema. Formulación de Problemas
• La Estadística y el Método Científico

Método

“La palabra método deriva del griego meta que significa hacia y odos que significa camino,
etimológicamente significa un camino que conduce a una meta” 1.

Por lo tanto el método nos proporciona un conjunto de pasos ordenados, basados en un


aparato conceptual determinado y reglas que nos permiten avanzar en el conocimiento.

Filosóficamente hablando el método se define como un instrumento de cognición, que permite


reproducir en el pensamiento la realidad objetiva del hecho que se estudia.

Existen métodos universales, generales y particulares del conocimiento científico, los mismos
que se basan principalmente en el método universal del conocimiento que se resume en el
sistema y leyes del materialismo dialéctico.

Método Científico.

“El método científico es aquel que proporciona a todas las ciencias una serie de etapas que
permiten comprobar hechos a través de la observación objetiva de diferentes fenómenos” 1.

Sin embargo no puede hablarse del método científico como un único camino que conduce al
descubrimiento de la verdad y mucho menos como un esquema rígido e inmodificable fuera
del cuál la investigación pierde su carácter científico.

En realidad no hay reglas fijas que indiquen al científico cuál debe ser el punto de partida para
su investigación o que limiten la escogencia de los procedimientos que se debe utilizar, ya que
ellos variarán de acuerdo a sus intereses e inquietudes, a su preparación previa y a los recursos
y presupuesto con que cuenta.

Dra. Rosa Saeteros Hernández. M.Sc. 9


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

Etapas del Método Científico.

Las Etapas del método científico son las siguientes:

1. Planteamiento del problema.


2. Observación del fenómeno que se estudia
3. Planteamiento de Hipótesis, mediante la cual pueden explicarse los hechos
observados.
4. Verificación de las Hipótesis, mediante nuevas observaciones.

1. Planteamiento del Problema

Es muy importante como punto de partida y es un elemento esencial en el proceso de


investigación.

El problema es un eslabón intermedio entre el conocimiento que se tiene y el conocimiento


que se busca.

Conocimiento que PROBLEMA Conocimiento que


se tiene se busca

Es una pregunta o duda ante algo, que no esta


claro o profundamente estudiado y que no
puede resolverse automáticamente, por lo
tanto debemos realizar una investigación
científica para alcanzar la solución.

Otras definiciones de problema son:

“Es la pregunta relativa a una situación que el investigador desconoce o desea conocer y es el
punto de partida de la investigación”3.

"Algo que tiene que resolverse"

"Es una necesidad de conocimiento, es una incógnita o duda que requiere una respuesta
científica.

En general se puede hablar de tres tipos de necesidades de conocimiento que dan salida a
problemas:

 DESCRIPTIVOS.
 EXPLICATIVOS.

Dra. Rosa Saeteros Hernández. M.Sc. 10


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

 PREDICTIVOS.

 DESCRIPTIVOS. (Estudio Descriptivo)

Son aquellos problemas que me permiten medir o evaluar la magnitud y frecuencia de una
situación. Ejemplo:

¿Cuál es la Situación de Salud existente en la comunidad "La Inmaculada" Riobamba 2000?

¿Cuál es la mortalidad Infantil en el Ecuador 2000?

¿Cuál es la incidencia de Enfermedades Respiratorias en la Ciudad de Riobamba 2000?

 EXPLICATIVOS. (Estudios Analíticos)

Son aquellos que buscan las causas que producen un efecto, es decir que para plantearnos este
tipo de problemas debemos hacernos la siguientes preguntas.

¿Qué fenómenos, hechos determinan una situación? Ejemplo:

¿Cuáles son los factores sociales que influyen en el inicio temprano del consumo de alcohol,
en los estudiantes de los sextos cursos del Colegio Maldonado, Riobamba 2000?

¿ Cuál es la relación entre Tabaquismo en mujeres embarazadas y bajo peso al nacer, en el


Hospital Docente Riobamba, 2000?

¿La suplementación de Hierro en los pre- escolares, disminuye la frecuencia de anemia


ferropenica. Escuelas Urbano Marginales Riobamba, 2000?

Para formular el problema explicativo se debe ser minucioso y específico si de lo contrario el


problema está formulado en forma general se fracasa. Por ejemplo un problema explicativo no
adecuado sería:

¿ Qué factores de riesgo son responsables del peso bajo al nacer?

Este problema debe ser formulado más específicamente, por ejemplo:

¿Es la anemia un factor de riesgo para el bajo peso al nacer?

¿Es el tabaquismo para el bajo peso al nacer?

Es decir que si se quieren investigar cinco factores de riesgo, se debe formular para cada uno,
un problema diferente. Pues una investigación puede tener más de un problema, y por lo tanto
por cada problema una conclusión y una recomendación.

La selección del aspecto a estudiar se realiza en dependencia de los recursos materiales,


humanos de tiempo, etc.

Dra. Rosa Saeteros Hernández. M.Sc. 11


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

 PREDICTIVOS. (Estudios Experimentales y Cuasi Experimentales)

Son aquellos que predicen una situación, estos implican que el investigador sea un
protagonista, para facilitar su confección podemos preguntarnos:

¿Qué resultados obtendría si yo intervengo en una situación?

¿La administración de estatina es eficaz para reducir el colesterol LDL en los pacientes
hipercolesterolémicos del servicio de cardiología del Hospital Docente Riobamba 2000?

¿La Capacitación en Métodos de Planificación Familiar, dirigida a mujeres en edad Fértil,


reduce los embarazos en el Barrio "Villa María ", Riobamba 2000?

En la formulación de este tipo de problema es necesario desagregar los efectos deseados las
predicciones o desenlaces que se desea estudiar.

Además que para cada desenlace esperado debe haber un problema, y formular en el estudio
tantos problemas como se requiera y como la factibilidad de recursos, tiempo, lo permitan.

¿Cómo abordar el problema?

A los problemas los podemos abordar desagregándolos en componentes que pueden ser
denominadas: áreas y subáreas, con el objetivo principal de que lo problemas se traten de
aspectos concretos y dimensionen un aspecto que se pueda abordar para estudiarlo
minuciosamente. Por Ejemplo:

Si nosotros queremos estudiar y nuestro problema es, "la desnutrición " presente en un Lugar
X,

▪ La desnutrición, constituye el área problema.


▪ Esta "gran" área se la puede desagregar en componentes, como: la epidemiología,
genética, frecuencia y magnitud de la desnutrición, así como también podríamos
probar un alimento que permita disminuir la desnutrición (fortificación de un
alimento), estos constituirán las subáreas del problema que se pretende abordar en el
estudio.

De esto nosotros podemos concluir que cuando se limita el problema, este se vuelve más
completo, específico.

Otra de las dimensiones que nos permiten limitar adecuadamente un problema de estudio, es
tomar siempre en cuenta las variables de PERSONA, LUGAR Y TIEMPO, esto
principalmente cuando se trata de un problema de tipo descriptivo.

Formulación de los Problemas

Dra. Rosa Saeteros Hernández. M.Sc. 12


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

Los problemas deben ser formulados en forma de preguntas, como reglas generales podemos
seguir las siguientes:

1. Introducir en el problema los fenómenos que se pretenden estudiar.

Por ejemplo: "Bajo peso", "Edad materna", "Tabaquismo", "Exposición al Plomo", etc.

2. Es necesario establecer la relación que existe entre los problemas.

En los problemas Descriptivos, no existe relación entre fenómenos, pues es una simple
descripción.

En los problemas Explicativos y Predictivos siempre se establece relación (causa - efecto) en


el caso de los explicativos e (intervención - desenlace) en los problemas Predictivos.

3. El planteamiento del problema debe dejar claro la intención de la pregunta, es decir poder
establecer si se trata de un problema descriptivo, explicativo o predictivo.

4. En el problema se debe definir o dar respuesta a las preguntas: ¿Qué? ¿Cómo? ¿Cuándo?
Y ¿Dónde?

2. OBSERVACION.

Es un proceso perceptual, mediante el cuál se dirige o enfoca la atención sobre algunas cosas
o fenómenos que estamos interesados en conocer.

La observación científica debe hacerse de forma tal que la misma pueda ser repetida por
diferentes observadores.

Se pueden establecer diferentes elementos que forman parte de la estructura del Método de
Observación Científica:

 El Objeto.

Es decir lo que se observa.

 El Sujeto.

En este caso, el o los que observan.

 Los Medios.

Abarcan los sentidos, así como instrumentos y recursos capaces de ampliar las capacidades,
perfeccionando la imagen senso - perceptiva del mundo que nos rodea.

 Condiciones del Entorno y Medio.

Incluye las circunstancias que se dan alrededor del sujeto y el objeto de la observación.

Dra. Rosa Saeteros Hernández. M.Sc. 13


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

 El Sistema de Conocimientos.

Sirve de base a los objetivos trazados para la observación y permite explicar e interpretar sus
resultados.

Es importante acotar que en este complejo proceso, pueden producirse errores en las
observaciones y que estos están determinados por los factores o elementos que intervienen en
toda observación.

3. HIPÓTESIS.

Una Hipótesis es una proposición que se refiere a hechos no sujetos hasta ahora a la
experiencia o, en general, no sometibles a la misma, esta puede ser susceptible de corrección
o rectificación en función de un nuevo conocimiento adquirido. Su característica principal es
su capacidad de predecir hechos no observados.

La elaboración de las hipótesis juega un papel decisivo en el desarrollo científico, ya que


constituyen herramientas teóricas, ideas científicas llamadas hipótesis, teorías y leyes.

En resumen una hipótesis bien formulada guía y orienta una investigación, y luego de su
comprobación contribuye a la generación de conocimientos y pasa a formar parte de un
campo del saber humano

Un ejemplo de hipótesis para el problema anteriormente citado, puede ser:

"El nivel socio - económico de los estudiantes de los sextos cursos del Colegio Maldonado,
influye en el consumo temprano de alcohol".

Existen diferentes tipos de hipótesis, sin embargo no es objeto de este texto profundizar en
ello, sin embargo es necesario plantear algunos aspectos generales del proceso de
formulación, que pueden ser las siguientes:

 Las hipótesis deben ser redactadas en términos claros y sencillos, es decir que la propuesta
deber ser explícita y comprensible.
 Las hipótesis deben ser específicas. Este lineamiento está ligado al anterior y significa
que cuanto más concreta sea la relación entre variables es más fácil su comprobación.
 Las hipótesis deben formularse como aseveraciones y evitar expresiones de valor o de
juicio. Estos postulados no deben comenzar con verbos ni exponerse en forma
interrogativa.
 Las hipótesis formuladas deben ser congruentes con hechos confirmados. Se estima que
los hechos deben tener relación con los principios o postulados ya comprobados en una
teoría, en algunos casos cuando no existe una teoría desarrollada de un tema en particular,
es necesarios fundamentar la investigación con la información existente sobre el
problema.

4. DEMOSTRACIÓN O VERIFICACIÓN DE LA HIPÓTESIS.

Dra. Rosa Saeteros Hernández. M.Sc. 14


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

Es el proceso donde sometemos a contrastación nuestras hipótesis. Este proceso puede


realizarse a través de experimentos o investigaciones, pero siempre las hipótesis deben ser
sometidas a pruebas.
En la investigación estos pasos están íntimamente relacionados, sin embargo es imposible que
todos los investigadores sigan siempre el anterior esquema en la secuencia señalada. Por
ejemplo la formulación de una hipótesis previa es generalmente necesaria para saber cuáles
hechos se deben observar, y a su vez la formulación de hipótesis requiere de conocimientos
sobre el problema que se estudia.

Ejemplo: (El descubrimiento del bacilo de Koch)

Primer Paso: Observó ciertas formaciones bacilares en los esputos de pacientes tuberculosos.

Segundo paso: Como hipótesis de trabajo, atribuyó a las formaciones bacilares la causa de la
enfermedad.

Tercer paso: Comprobó que el bacilo se encontraba en los esputos de individuos tuberculosos
y nunca en los procedentes de individuos sin la enfermedad.

No hay que creer que los pasos esbozados son privativos de las grandes investigaciones
solamente, pues no es difícil entrever como ellos se siguen rutinariamente, quizás
inconscientemente, aún en algo tan sencillo como una historia clínica de cualquier paciente,
ejemplo:

Primero se recogen los datos sobre los antecedentes de la enfermedad, se complementan con
inspección, palpación, percusión, auscultación. Es decir se realizan varias Observaciones.

En segundo lugar se hace el diagnóstico clínico (provisional), es decir una hipótesis de


trabajo.

Finalmente se hará la verificación de la hipótesis, en este caso de el diagnóstico, mediante


nuevas observaciones, con la ayuda del laboratorio y de otras técnicas especializadas, u
observando los resultados del tratamiento, los cuáles serán favorables cuando el diagnóstico
fue correcto.

La Estadística y el Método Científico.

La Estadística cumple diferente papel en cada uno de los pasos del método científico, siendo
importante en la observación de los fenómenos y en la verificación de las hipótesis. En la
formulación de las hipótesis también tiene importancia, aunque ello es un proceso en el cual
intervienen sobre todo la intuición y la imaginación de los investigadores.

La Estadística interviene en el primer paso de la investigación científica ayudando a


que las observaciones sean fidedignas y exactas, en una función esencialmente descriptiva,
permite presentar y resumir la información.

En la verificación de las hipótesis, que se hacen siempre mediante nuevas


observaciones, es necesario resumir adecuadamente los resultados de éstas, pues la mente
humana es incapaz de desentrañar la verdad que se encuentran en una gran cantidad de datos,
si estos no han sido previamente ordenados y clasificados.

Dra. Rosa Saeteros Hernández. M.Sc. 15


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

Finalmente, aunque la formulación de hipótesis es ante todo un proceso de


imaginación en intuición, la Estadística puede ayudar a ese proceso, puede al resumir
convenientemente el resultado de las observaciones, facilita el razonamiento que puede a
conducir a la formulación de hipótesis racionales.

El Método Estadístico y sus Etapas.

Los principios generales del método estadístico son universales en su utilización, no importa
cuál sea la investigación que se realice o ramo de la ciencia que se aplique

El método estadístico comprende las siguientes etapas:

1. Planificación de la investigación.
2. Recolección de la Información.
3. Elaboración de los datos recogidos.
4. Análisis e interpretación.

Analizaremos en forma general cada una de las etapas:

1. Planificación de la Investigación. Consiste en la confección de un esquema organizativo


que nos permita evaluar la factibilidad de la investigación.

El punto de partida en la formulación del problema científico u objeto de la investigación.


Otro aspecto importante en la Formulación de Objetivos, que son los fines que se desean
alcanzar en la investigación.

2. Recolección de la Información. Es un paso importante, debe brindarse una especial


atención, ya que solo si la información ha sido recogida de manera correcta, efectuada con
gran escrupulosidad y objetividad científica, evitando la introducción de fuentes de error,
podrán tener validez las conclusiones que de ellas se deriven. Hay que señalar la importancia
de recoger solo la información estrictamente necesaria y no más que esta, ya que la
recolección de una mayor cantidad de información conspira contra la correcta obtención de
aquellos que son realmente necesarios, contra el costo y el tiempo invertido y en general con
el proceso de investigación. En esta etapa se debe considerar los siguientes aspectos:

• Errores que pueden cometerse en la recolección de la información, y los métodos


para controlarlos.
• Los métodos y procedimientos empleados para la recolección de la información.
• El universo y la muestra de estudio.
• El diseño de formularios que se utilizarán para registrar la información.

3. Elaboración de los datos recogidos. La revisión y la corrección de la información


recolectada debe ser obligatoriamente el paso previo a la clasificación y computación de los
datos que se realizan con vistas a su posterior resumen y presentación.

La elaboración de la información sigue los siguientes pasos:

Dra. Rosa Saeteros Hernández. M.Sc. 16


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

• Revisión y recolección de la información.


• La clasificación y computación de los datos.
• La presentación de la información.

4. Análisis e interpretación. Una vez organizada, sintetizada y presentada adecuadamente la


información, se interpretan los datos y se llega a determinadas conclusiones.

EJERCICIO INTEGRADOR II

1. Formule 3 problemas de cada tipo e identifique sus partes.


2. Formule la o las hipótesis de los problemas analíticos y explicativos del ejercicio
anterior.
3. Con un ejemplo explique los elementos de la observación.

"No se puede amar nada que antes no sea conocido."


Aristóteles

Dra. Rosa Saeteros Hernández. M.Sc. 17


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

CAPÍTULO III
PRINCIPIOS BÁSICOS DE LA RECOLECCIÓN DE
INFORMACIÓN
OBJETIVO

• Analizar los elementos teóricos y conceptuales sobre los cuáles se fundamenta el estudio de
la estadística

CONTENIDOS
• Fuentes de Obtención de la Información
• Principales Métodos de Recolección de la Información
• Reglas Básicas para la Construcción de los Formularios
• Opciones en la Formulación de Preguntas
• Esta temática presenta una importancia capital, debido a que los datos que en ella se
recogen serán la base a partir de la cuál se obtendrán los resultados.

Fuentes de Obtención de la Información

Es preciso plantear algunos elementos básicos a tener en cuenta en el proceso de recogida de


la información, que de no observarse, pueden afectar en diversos grados a la validez de las
conclusiones que de esta información se puedan obtener. Si los datos han sido recogidos
según principios racionales que garanticen al máximo la validez de los mismos, se justifica el
empleo de los métodos estadísticos, ya que en caso contrario los errores en que se haya
incurrido no podrán ser salvados por más sofisticadas que sean la técnicas a emplear.

Se define como fuentes de obtención de información a los elementos que originan los datos.
Las fuentes de obtención de información, pueden ser: Primarias y Secundarias.

Fuentes Primarias.

Son aquellas en las que el dato se recoge directamente del elemento que la origina, es decir de
los individuos en donde puede suceder el fenómeno o encontrarse la característica que se está
estudiando.

Para recoger los datos de una fuente primaria, se pueden utilizar dos procedimientos:

 La Observación.
 El Interrogatorio.

La Observación.

La Observación, considerado como el Método Clásico de Investigación Científica, es el que


permite la observación directa de los hechos o fenómenos que se desea estudiar.

Dra. Rosa Saeteros Hernández. M.Sc. 18


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

Las características de este método son las siguientes:

- Es un método Objetivo, permite la comprobación de hechos o fenómenos en la


realidad, por lo tanto debe ser utilizado siempre que sea aplicable.
- Requiere para su aplicación de personal previamente entrenado para este fin.
- No es conveniente cuando se estudian grandes masas humanas, pues la observación es
un procedimiento caro.
- No es aplicable para estudiar las manifestaciones subjetivas de los individuos.

El Interrogatorio.

Se aplica el interrogatorio, en los casos en que la observación no es idónea, por lo


tanto las ventajas del interrogatorio no son otras que las limitaciones señaladas en la
observación.

Las características principales del Interrogatorio, son las siguientes:

- Este es el único método a emplear, cuando se averiguan las manifestaciones subjetivas


de los individuos, es decir hechos pasados, presentes y futuros de los individuos.
- La desventaja del interrogatorio es que apela a la memoria y a la buena fe de los
interrogados, la misma que puede dar diferentes resultados según el tipo de preguntas
y la manera como son formuladas.
- Al interrogar a los individuos las preguntas que se formulen deben ser claras,
concisas; su estructura debe evitar ambigüedades o sugerencias para una posible
respuesta, o las que a su vez presuponen o sugieren la respuesta.

El Interrogatorio, puede ser de dos formas: Interrogatorio Directo e Indirecto.

Interrogatorio Directo.

Es aquel en el que el investigador realiza la entrevista, encuesta, y su ventaja principal es que


el interrogatorio puede complementarse con la aplicación de la observación directa.

Interrogatorio Indirecto.

En este caso no es necesaria la presencia del investigador, se realiza mediante un


cuestionario postal o encuesta que es llenada por el interrogado, es un método barato y rápido,
aunque se utiliza para preguntas sencillas, la desventaja es que son muy pocas personas las
que envían la contestación.

Fuentes Secundarias.

Son aquellas fuentes en las cuáles el dato no se recoge directamente de su origen, sino
media un instrumento que permite la recolección de dicho dato. En este caso el o los datos se
encuentran registrados o publicados en textos, revistas, periódicos, fichas, etc.; por lo tanto es
fácil encontrarlo en bibliotecas, departamentos estadísticos.

Dra. Rosa Saeteros Hernández. M.Sc. 19


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

Principales Métodos de Recolección de la Información.

El método que se utilice, dependerá del propósito del estudio y naturaleza de la investigación,
podemos clasificar en tres principales métodos de recolección de la información: Encuestas,
Censos y Sistema de Registros.

Encuestas.

Se aplican ocasionalmente, se recogen mediante el interrogatorio, los datos ya existen, por lo


tanto solo es necesario recogerlos, ya que no existen registrados. Se pueden realizar para una
parte de la población y para toda la población.

Los Censos.

Se aplican periódicamente, cada 5 o 10 años, estos censos buscan datos generales de la


población, y se realizan para el total de la población t también para una parte de ella, se
considera un medio seguro para conocer la composición y características de las poblaciones
humanas.

Sistema de Registros.

Se recoge la información continuamente a medida que se produce la misma, sirve para


conocer cada vez los cambios que acontecen en la población, de igual manera se aplican a
toda la población y también para una parte de ella.

Reglas Básicas para la Construcción de Formularios.

Se denomina formulario a todas las formas impresas, destinadas a la recolección de datos,


dentro de ellos tenemos: historias clínicas, fichas médicas, tarjetas especiales, entrevistas,
encuestas, guías de observación, entre otras.

Son útiles porque ayudan a recoger la información de manera completa y eficiente,


permitiendo uniformidad en las diferentes observaciones y evitando la recolección de datos
inútiles o irrelevantes al estudio.

Los formularios permiten recoger dos tipos de datos:

 Datos administrativos o de identificación (Características Demográficas)

Estos datos incluyen: el nombre, la edad, sexo, resistencia, fecha de estudio, estado civil, etc.,
hay que tener en cuenta que el algunos estudios no se requieren este tipo de datos, pues según
la característica o propósito del estudio, esta puede mantenerse en el anonimato.

 Datos sobre el problema que se estudia.

Dra. Rosa Saeteros Hernández. M.Sc. 20


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

Incluyen los ítems referentes al propósito mismo del estudio, se basan en los indicadores y
variables que se estén investigando, puede ser: conductas y actividades, juicio, motivaciones,
participación social, predisposiciones a actuar, respecto de personas, objetos, situaciones o
procesos sociales.

Reglas:

Para elaborar o construir un formulario en el que se recogerán datos, existe un conjunto de


recomendaciones prácticas que debe cumplir todo investigador al abordar este tema.

A continuación se señalan las que se consideran fundamentales:

1. En primer lugar, se parten de la construcción de indicadores de cada variable que se


realiza. Una vez seleccionados debidamente los indicadores, pasamos a "traducir" dichos
indicadores en preguntas específicas.

2. Establecer la Demanda de Cooperación, esto constituye algo importante, desde el


momento mismo en que de ella dependerá, en sumo grado, que los individuos participen o
no, o contribuyan o no favorablemente en la investigación. Se plasma en la primera parte
del formulario y puede también ser expresado por el investigador antes de iniciar con las
preguntas. Esta debe convencer de:

 Lo valioso que resultará la información que se solicita.


 Que no existe ningún motivo encubierto o no-confesado en la finalidad perseguida, es
decir explicar claramente los propósitos del estudio, así como a nombre de qué entidad
se lleva a cabo el estudio en cuestión.
 El uso confidencial que se hará de la información que se facilita.
 De lo fácil y rápido que podrá contestarse el cuestionario.

3. Las preguntas deben ser claras, es decir:

 Cada término debe ser comprendido.


 No se debe plantear dos preguntas en una.
 La pregunta no debe formularse de manera negativa.
 La construcción de la respuesta no debe incluir expresiones ambiguas.

4. Las preguntas no deben ser tendenciosas, es decir, no deben estar confeccionadas de


manera tal que lleven al individuo a responder de una manera determinada o que lo
predispongan en contradicción con su sentir ante una pregunta a responder.

5. Las preguntas no deben exigir mucho esfuerzo de la memoria, siempre que haya
necesidad de pedir este tipo de esfuerzo al interrogado, debe ser el mínimo posible.

6. Cuando haya que abordar aspectos controvertidos o embarazosos, las preguntas deben ser
construidas de forma tal que no constituyan un conflicto para el "yo" del sujeto.

7. El orden de las preguntas a lo largo del cuestionario debe disponerse con arreglo a las
características psicológicas de las preguntas, en primer lugar, cuando el caso lo requiera,
se deben preguntar datos sociodemográficos, como sexo, edad, nombre, que tienen un
carácter periférico respecto al tema central que se aborda; luego las preguntas generales

Dra. Rosa Saeteros Hernández. M.Sc. 21


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

que le van llevando hacia las preguntas más complejas, por lo tanto debemos ir desde lo
más simple a lo más complejo, de lo más impersonal a lo más personal.

8. Se debe contrarrestar el efecto de monotonía, esto se produce cuando generalmente en las


preguntas son en su mayor parte de tipo cerradas, en este caso el interrogado no se siente
motivado a responder. Repetidas las mismas alternativas de respuestas en sucesivas y
diferentes preguntas una tras otra, esto produce lo que se denomina, "efecto de
monotonía". Para eliminar y minimizar este fenómeno hay que motivar la participación de
los entrevistados y además variar el orden de las alternativas de respuesta en cada
pregunta.

9. Se debe incluir una pregunta final que recoja la impresión del interrogado respecto al
estudio, esto permite, además de saber su opinión sobre el cuestionario, controlar su
interés y que efecto produjo en él.

10. Es de suma importancia probar la operatividad del formulario, es decir validar antes de
que sea impreso, es conveniente probarlo en el terreno mediante un estudio piloto, para
darse cuenta de las fallas que aún pueden presentar y hacer las correcciones necesarias.

11. No se debe olvidar de redactar las instrucciones necesarias, estas pueden imprimirse en el
mismo formulario cuando no son muy extensas, o en una hoja a parte en el caso contrario.

Opciones en la Formulación de Preguntas.

Las preguntas en los formularios las podemos clasificar de acuerdo a tres criterios:

a) Según el grado de libertad de las respuestas.

▪ Abiertas.
▪ Cerradas.
▪ Mixtas.

b) Según la función que cumple en el formulario.

▪ Filtro.
▪ Control.
▪ Contenido.

c) Según el contenido o la naturaleza de lo preguntado.

▪ Subjetivas.
▪ Objetivas.

a) Según el Grado de Libertad de lo preguntado

Abiertas.

Son aquellas en las cuáles se da completa libertad al interrogado para que responda, es decir
no se limita la respuesta y explora el mundo subjetivo del interrogado.

Dra. Rosa Saeteros Hernández. M.Sc. 22


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

Ejemplo:
Según su criterio: ¿Cómo se ve reflejado la posición de la mujer en el actual Código de la
familia?

Cerradas.

Son aquellas que, en contraposición con las abiertas, les limita las posibilidades de respuesta a
los individuos, producto de que se determinan, previamente, diferentes opciones de respuesta
que aparecen acompañando a la pregunta., y a las cuales los interrogados deben
circunscribirse de manera estricta, Las respuestas cerradas pueden clasificarse, a su vez en dos
tipos: Dicotómicas y Politómicas.

Cerradas Dicotómicas.

Son aquellas que admiten dos respuestas. Por Ejemplo:

¿Le gustan los servicios del Instituto Ecuatoriano de Seguridad Social?


Sí ------- No -------

Cerradas Politómicas.

Son aquellas que admiten más de dos respuestas. Por Ejemplo:

¿Cree usted que para contraer matrimonio es necesario tener en cuenta la diferencia de
escolaridad en la pareja?
Sí ------- No -------- Depende -------

En las respuestas politómicas hay un tipo especial que expresan gradaciones y son aquellas
cuyas respuestas plantean diferentes valoraciones sobre una misma pregunta. Por Ejemplo:

¿Cuál es su criterio en relación con los servicios de Emergencia del Hospital Policlínico de
Riobamba?

▪ Me gusta mucho -------


▪ Me gusta algo -------
▪ Me es indiferente -------
▪ No me gusta -------
▪ No me gusta nada absolutamente -------

Como vemos, cada una de las alternativas de respuesta posible, expresa un grado diferente de
preferencia, en este caso respecto al servicio en cuestión, que va desde la preferencia mayor,
hasta el mayor rechazo.

Mixtas.

Son las preguntas en las que se combinan las preguntas abiertas con las cerradas. Por ejemplo:

¿Le gusta el servicio de emergencia del Hospital Policlínico de Riobamba?


Si ------- No -------
¿Porqué?------------------------------------------------------------------------------------.

Dra. Rosa Saeteros Hernández. M.Sc. 23


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

b) Según la función que realiza la pregunta en el cuestionario

Filtro.

Son aquellas que permiten al investigador saber si el interrogado conoce o no acerca de la


materia sobre la que se quiere recoger su opinión o su criterio. Es decir, que este tipo de
pregunta va a tener como función el facilitar una información previa que garantice determinar
si el individuo sabe o no acerca de la materia o asunto sobre la que más adelante se va a
preguntar, y determinar así su puede o no preguntársele sobre ello. Por Ejemplo:

Antes de preguntarle a una persona:


¿Cuál es su opinión sobre el Servicio de Emergencia en el Hospital Policlínico de Riobamba?

Se le puede hacer la siguiente pregunta filtro:


¿Conoce Usted el Servicio de Emergencia del Hospital Policlínico de Riobamba?

Control.

Son aquellas preguntas que tienen la función de comprobar la consistencia de la respuesta, es


decir, comprobar las veracidades de las respuestas del entrevistado sobre la pregunta del
cuestionario.

Para dicho fin se redacta una pregunta sobre los temas que nos interesa y luego se redacta otra
pregunta sobre el mismo tema y contenido, pero cambiando su forma de expresión.

Estas preguntas deben ir bien separadas entre sí en el cuestionario para lograr así su
efectividad. Comparando sus respuestas entre sí podemos comprobar la veracidad del
entrevistado al responder a la preguntas. Por ejemplo:

¿Conoce Usted el Servicio de Emergencia del Hospital Policlínico de Riobamba?


Si ------- No -------

¿Marque con una cruz una característica del Servicio de Emergencia del Hospital Policlínico
de Riobamba?

Contenido.

Son todas aquellas que se realizan en el cuestionario y que están directamente relacionadas
con los indicadores que se manejan en la investigación, o aquellas que recogen información
sobre el propósito mismo del estudio además de datos complementarios sobre el
entrevistados, y que son de interés para el investigador.

c) Según el contenido o naturaleza de lo preguntados

Subjetivas.

Dra. Rosa Saeteros Hernández. M.Sc. 24


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

Son aquellas relacionadas con las actividades, opiniones y motivaciones de los individuos
entrevistados. Por Ejemplo:
¿Cuál su opinión con relación a las causas de violencia intrafamiliar?

Objetivas.

Son aquellas encaminadas a buscar datos o información que, por su naturaleza tienen una
existencia independientemente de la voluntad, motivos, opiniones o deseos de los
entrevistados. Por Ejemplo:

¿Cuál es su ingreso promedio mensual?


¿Cuál es su edad y estado civil?

EJERCICIO INTEGRADOR III.

1. La Facultad de Salud Pública de la ESPOCH requiere recolectar información para


investigar el consumo de alcohol en jóvenes universitarios, realice un formulario con todas
sus partes, que incluya una pregunta de cada tipo.

2. Escoja un problema que pueda ser observado en la realidad, elabore una guía de
observación, recolecte la información y presente los resultados de la misma.

"La vida humana representa, la mayor parte de las veces, una ecuación entre el pasado
y el futuro."
José Ingenieros

Dra. Rosa Saeteros Hernández. M.Sc. 25


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

CAPÍTULO IV
TÉCNICAS DE MUESTREO
OBJETIVOS
• Identificar y aplicar las técnicas de muestreo

CONTENIDOS

• Universo o Población y Muestra


• Ventajas del Empleo de muestras
• Desventajas del empleo de muestras
• Condiciones de una buena muestra
• Cantidad de unidades del estudio en una muestra
• Clases de Muestras

Universo o Población y Muestra

En los problemas que se presentan en la práctica, se suele encontrarse en la necesidad de


estudiar el comportamiento de una enfermedad, las conductas y prácticas de los individuos,
una nueva metodología de trabajo en promoción y educación en salud, un programa de
prevención, etc, en los elementos de determinado colectivo o población, para lo cual se
tendría que examinar cada uno de los elementos de dicho grupo y observar en todos el
conjunto de variables que sean de interés.

En la práctica, ocurre muy a menudo que tales colectivos de elementos a observar son a veces
muy grandes, lo que hace casi imposible el observar a cada uno de sus componentes. Por
ejemplo, si se quiere estudiar el comportamiento de la talla de los estudiantes de secundaria en
el país, se tendría que emplear un tiempo excesivamente grande en hacerlo. En casos como
este y en otros semejantes lo que se debe hacer es tomar una parte o un número determinado
de individuos u objetos.

Universo o Población
“Una población de elementos se define como el mayor grupo de elementos por los cuáles
se tiene un cierto interés en un memento dado”2. Las poblaciones pueden ser finitas o
infinitas , son finitas cuando consta con un número fijo de valores y es infinita cuando
consta de una sucesión sin fin de valores.

Muestra
“Es una parte de la población” 2

Ventajas del empleo de muestras

Existen algunas razones por las cuales es preferible el estudio en una muestra que en la
totalidad del universo, así tenemos:

Dra. Rosa Saeteros Hernández. M.Sc. 26


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

• Es el único practicable cuando se trata de universos infinitos o de universos limitados


pero muy extensos.
• Incluso cuando los universos son limitados es preferible trabajar con una muestra por:

1. Ahorra esfuerzo, tiempo dinero y trabajo. I queremos conocer alguna característica de


la salud de los estudiantes de la ESPOCH, el universo esta representado por 10000
estudiantes, si decidimos trabajar en 1000 estudiantes, estaríamos estudiando una
décima parte, lo significa una reducción del tiempo, del dinero y del esfuerzo en la
investigación.
2. Permite una mayor exactitud en la recolección de los datos, aunque no parecería
lógico, los datos recogidos en una muestra son más exactos, pues se cometen menos
errores de la recolección, es decir los errores que puede cometer el observador, el
objeto o sujeto de observación y el método mediante el cual se observa.

Desventajas del uso de muestras

La única desventaja es el “error de muestreo”, el que puede invalidar el estudio, este es un


error que se comete debido a la variabilidad de la población, en la misma que se pueden
formar varias muestra y variar una de la otra y como solamente se estudia en una muestra
estos datos son los que se infieren o generalizan a la población o universo. La diferencia de
los resultados entre el valor de la muestra y el valor del universo se conoce con el nombre de
muestreo.

Este error por muestreo es una consecuencia de la variabilidad de las poblaciones. Como los
individuos de toda población soy muy variables, los diferentes grupos o muestras que
podemos formar con ellos diferirán también unos de otros y como nosotros solamente
estudiamos una muestra para generalizar luego a toda la población , los resultados serán algo
distintos según la muestra que hayamos escogido, esta diferencia entre el valor dado por la
muestra y el verdadero valor del universo, constituye el error de muestreo” 4.

Por ejemplo si tenemos los siguientes datos referentes a la edad de estudiantes en la ESPOCH,
19 20 21 22 23 24 25 años. El promedio de edad de los estudiantes es 22 años, si d estos
obtenemos una muestra de 3 estudiantes y tenemos: 19 24 25 el promedio es 23 años, la
diferencia de los promedios en la muestra y el universo son debidas al error de muestreo.

Sin embargo el error por muestreo suele ser menor al error que se puede cometer por el
observador, lo observado y el método de observación. Además que el error por muestro puede
medirse estadísticamente y disminuirse a voluntad, tan solo con aumentar el tamaño de la
muestra. “La variación natural se llama error termino que en este caso no significa
equivocación, sino variación entre los sujetos, y no se puede eliminar” 5.

Condiciones de una buena muestra


La condición más importante para escoger una muestra es que en la misma contenga las
características del universo, en este sentido las dos características importantes de una muestra
son:

• Cantidad de unidades de estudio en la muestra

Dra. Rosa Saeteros Hernández. M.Sc. 27


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

Que la muestra sea buena en cantidad significa que debe incluir el número óptimo y mínimo
de los individuos. El tamaño va a depender de:

• Grado de homogeneidad de los datos (problemas de alta frecuencia, muestras más


pequeñas, problemas de menor frecuencias se requiere de muestras más grandes)
• Tamaño de la población
• Su calculo debe tomar en cuenta un nivel de confianza (99%-95% de confiabilidad)
• Disponibilidad de recursos económicos, materiales y humanos.

Para determinar la cantidad de individuos en la muestra tenemos algunas fórmulas que nos
pueden ayudar a calcular el tamaño de la muestra:

• Primera: se aplica cuando conocemos el tamaño de la población y no conocemos la


varianza. Es preciso indicar que el error admisible en los estudios descriptivos puede
ser hasta de un 30%.

PQN n = tamaño de la muestra


n= ------------------------- N =tamaño de la población
(N-1) E2 P = 0,50 probabilidad a favor
------ + PQ Q = 0,50 probabilidad en contra
K2 PQ =constante de la varianza de la población (0.25)
E= error máximo admisible (0.01…….10%)
K= Coeficiente de Corrección del Error (2), o (1,96)

• Segunda: se aplica cuando conocemos el tamaño de la población, no conocemos la


varianza y el error admisible es 5%.

m n= tamaño de la muestra
n=------------------------- m=tamaño de la población
e2 (m-1) + 1 e=error máximo admisible (0.05)

• Tercera: se aplica cuando conocemos el tamaño de la población y la varianza.

n = tamaño de la muestra
NZ2S2
N =tamaño de la población
n=-------------------------
Z = Si P=68.3%, Z=1
Z2S2 +Nd2
Si P=95.5%, Z=2
2
S = varianza
d= error admisible en términos absolutos

• Cuarta: se aplica cuando tenemos poblaciones infinitas y conocemos la varianza.

Z2S2 n= tamaño de la muestra


Z= Si P=68.3%, Z=1
Si P=95.5%, Z=2
Dra. Rosa Saeteros Hernández. M.Sc. S2= varianza 28
d= error admisible en términos absolutos
ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

n= -------------------------
d2

• Calidad de la muestra

La calidad de la muestra significa que las muestra debe ser representativa cualitativamente, es
decir que debe reflejar fielmente las características del universo, por ejemplo debe tomar en
cuanta la composición de acuerdo a características como la edad, el sexo, el estado civil el
nivel de ocupación, instrucción, etc, debe ser diferente al universo solo en número. Si
quisiéramos estudiar las características de los estudiantes en la ESPOCH y si estudiamos
únicamente a los estudiantes de la facultad de Salud Pública, aunque los estudiemos a todos,
la muestra no sería representativa.

Clases de Muestras

• Muestras por conveniencia

Significan que las muestras son escogidas en base a la opinión de expertos, a los que se les
considera como representantes del universo. Si quisiéramos estudiar la composición de los
estudiantes por sexo en la ESPOCH, podríamos escoger a una Facultad que nos parezca más
representativa en función al sexo, sin embargo la validez de los resultados dependerá del
acierto de haber escogido la Facultad.

• Muestras Probabilísticas

Una muestra es probabilísticas cuando todos los individuos o elementos a ser estudiados en
una muestra tienen una probabilidad conocida de participar en la investigación y donde no
interviene el hecho de que el investigador escoja a sus elementos de estudio, sino que estos se
escogen por sorteo sin que intervenga la voluntad del investigador. Es similar a un juego de
lotería, bingo o sorteó en donde es la suerte o el azar el que define las unidades de estudio.
Es importante indicar que los resultados dados por el azar son muy variables sin embargo la
variación no es anárquica, sino perfectamente ordenada y previsible y generalmente presentan
cierta simetría.

Métodos para obtención de una muestra probabilística

Se pueden obtener mediante dos procedimientos:

1. La lotería o sorteo. Consiste en colocar en un recipiente con los nombres de todos


los integrantes de la población que se estudia y luego de revolverlos bien, se extraerán
tantas fichas como unidades de estudio se deseen obtener.

2. La tabla de números al azar. Son tablas con miles de números obtenidos por un
procedimiento como lotería. Para utilizar estas tablas se deben numerar a las unidades
de estudio desde el número 1 y luego se extráen tantos números según el tamaño de la
muestra. La tabla puede empezarse a leer en cualquier parte, pero debe escogerse al
azar la columna y fila de comienzo, para lo cual es suficiente colocar a ciegas un dedo

Dra. Rosa Saeteros Hernández. M.Sc. 29


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

sobre el cuerpo de la tabla y empezar desde ese sitio la lectura. (Ver ANEXO 1.
Tabla de números al Azar)

Tipo de Muestras Probabilísticas

Para escoger las unidades de estudio de la muestra de entre todas las unidades de la población
se puede proceder a usar los siguientes tipos de muestras probabilísticas:

1. Muestreo al azar simple


2. Muestras Sistemáticas
3. Muestreo estratificado
4. Muestras por conglomerados
5. Muestras por procedimiento combinado

Muestreo al azar simple.

Es un sorteo simple, en donde colocamos a todas las unidades del universo en un recipiente y
luego extraemos tantas fichas según el número de unidades determinadas en la muestra.

Si queremos escoger a 100 estudiantes del total de 1000 estudiantes de la Facultad de Salud
Pública, entonces en un recipiente colocamos a los 1000 nombres de los estudiantes y luego
procedemos a extraer 100 nombres.

Muestras Sistemáticas

Si de 1000 estudiantes perfectamente numerados y enlistados queremos estudiar 100, significa


que de cada 100 debo escoger 10 y de cada 10 debo escoger 1, por lo tanto al azar o por sorteo
debo escoger un número del 1 al 10, supongamos que escogemos el 5, indica que es el primer
estudiante que estudiaremos y completamos la lista con el décimo alumno, en este caso se
estudiará al estudiante 5, 15, 25, 35, hasta completar los 100.

Muestreo estratificado

Consiste en dividir a nuestra población en estratos, por ejemplo en una universidad, los
estratos pueden ser las facultades y dentro de ella las escuelas y si queremos podemos seguir
estratificando la muestra en cada escuela según sexo, en fin según las características de
interés. En cada uno de los estratos se escoge a las unidades de la muestra al azar. Ejemplo:

“El universo estuvo constituido por 6630 estudiantes de Escuela Superior Politécnica de
Chimborazo, matriculados para el período Octubre – Abril de 2002”6.

Para el cálculo del tamaño de la muestra se aplicó la siguiente fórmula:

N. p. q
N = Universo n =
p = Probabilidad a favor (0.5) (N – 1) E2 / K2 + p . q
q = Probabilidad en contra (0.5)

Dra. Rosa Saeteros Hernández. M.Sc. 30


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

E = Error (10%)
K = Nivel de Confianza. (1.96) 6630 (0.50) (0.50)
n =
(6630-1) 0.0006507 + (0.50) (0.50)

n = 363
Luego de obtener el tamaño de la muestra, el procedimiento para elegir a los individuos se
realizó utilizando un muestreo probabilístico estratificado. Cada Facultad de la Politécnica de
Chimborazo constituyó un estrato, del cual se tomaron los datos de una parte representativa
de cada una de las Facultades, al multiplicar el número de estudiantes de cada facultad por el
factor n / N, de esta manera se obtuvo el tamaño de cada estrato.

n/N 363/6630 = 0.055

FACULTADES No. TAMAÑO DEL


FACTOR ( n / N)
(Estratos) ESTUDIANTES ESTRATO
Facultad Salud Pública 210 0.0547511 12
Facultad Administración 1762 0.0547511 97
Facultad de Mecánica 753 0.0547511 40
Facultad Ciencias 557 0.0547511 31
Facultad de Informática 1641 0.0547511 90
Facultad de Ciencias Pecuarias 757 0.0547511 41
Facultad de Recursos Naturales 950 0.0547511 52
TOTAL ESTUDIANTES 6630 0.0547511 n = 363
FUENTE: Secretaría Facultades. ESPOCH. Octubre – Marzo 2002.

Muestreo de Conglomerados

Cuando se aplica este tipo de muestreo no se escogen a los individuos sino que se escogen a
grupos o conglomerados. Un conglomerado puede ser entendido como una población en
miniatura.
Supongamos que necesitamos estudiar en escuelas primarias de una país en donde estén 400
escuelas con un mínimo de 50 alumnos en cada escuela y necesitamos estudiar 2000
estudiantes, basta con escoger 40 escuelas y tendremos a los 2000 estudiantes. La ventaja es
que no se necesita contar con una lista detallada de los alumnos, pues basta con numerar las
400 escuelas del país para mediante un procedimiento al azar escoger las que se estudiarán.
Además de evitar la dispersión, pues por más lejana que quede una escuela al llegar al lugar
se lo hará por 50 estudiantes y no por unos o dos, esto significa un ahorro de tiempo, dinero y
esfuerzos. Sin embargo no suelen dar resultados tan precisos como cuando se trabaja con el
muestreo estratificado

Muestreo por procedimiento combinado

Esta combinación de estudio resulta muy ventajoso, pues si las muestra por conglomerados
evitan la dispersión de la muestra y como a su vez las muestras estratificadas aseguran la
representatividad de los estratos o sectores de la población, entonces su combinación elimina
las desventajas de cada uno.

Dra. Rosa Saeteros Hernández. M.Sc. 31


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

En el ejemplo anterior una muestra estratificada de conglomerados sería si escogemos


separadamente 10 escuelas de cada una de las zonas del país, 10 de la sierra, 10 de la costa 10
de la región oriental y 10 de las Islas Galápagos y 50 estudiantes de cada escuela y asi
obtendríamos los 2000 alumnos.

EJERCICIO INTEGRADOR IV

1. ¿Calcular el tamaño de la muestra para la población de estudiantes de la ESPOCH?

N = 9800
E = 4% (0,04)
PQ = 0,25
K= 2

2.¿Calcular el tamaño de la muestra si no se conoce la varianza y con un error admisible


máximo del 5%?

N = 9800

3. ¿Calcular el tamaño de la muestra cuando conocemos el tamaño de la población y la


varianza?

N= 5600
S2 = 1200
P= 68,3
d = 30%

4. Se requiere realizar una investigación en la ESPOCH para caracterizar los estilos de vida
los empleados politécnicos, el universo de estudio es de N = 392 empleados.
(4 puntos)

a) Calcule el tamaño de la muestra, con un 95% de confiabilidad.


b) Diga que procedimiento utilizaría para escoger los individuos de la muestra y justifique su
respuesta.

“El saber es la única propiedad que no puede perderse”


Bías de Priene

Dra. Rosa Saeteros Hernández. M.Sc. 32


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

CAPÍTULO V
CLASIFICACIÓN Y COMPUTACIÓN DE LOS DATOS
ESTADÍSTICOS
OBJETIVO

Clasificar los datos estadísticos de acuerdo a características extrínsecas e intrínsecas que le son
comunes

CONTENIDOS
• Variables o Escalas de Clasificación
• Tipos de Variables o Escalas de Clasificación
• Condiciones para Elaborar una Escala Cuantitativa
• Clasificación de los Datos
o Distribuciones de Frecuencias
• Redondeo de Datos
• Tipos de Frecuencias
• Tablas de Intervalos o Clases
• Tipos de Intervalos o Clases
• Regla de Sturges
• Límites de clase
• Punto Medio o Marca de clase
• Amplitud de Clase
o Datos de Asociación
o Series Cronológicas

Una vez captada la información de cada uno de los elementos en estudio, esta tiene que ser
revisada, clasificada, presentada de forma resumida para permitir su análisis e interpretación.

La revisión y corrección de la información recolectada obligatoriamente debe ser el paso


previo de este proceso, ya que no existe ningún análisis estadístico que suministre la respuesta
adecuada a un problema científico si este se basa en una información incorrecta.

Por lo tanto se deben seguir los siguientes pasos.

1. - Revisión de Datos. (Control de calidad)

- Determinar si se ha recibido todos los datos o cuando menos en una proporción que sea
suficiente para no invalidar las conclusiones.
- Verificar que estén registradas todas las respuestas requeridas.

Dra. Rosa Saeteros Hernández. M.Sc. 33


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

- Localizar posibles incongruencias (malas interpretaciones).

2. Tener en cuenta las causas que pueden producir error.

• Errores atribuibles al sujeto que hace la observación.


• Imputables al instrumento que recoge la información.
• Propios del objeto o sujeto de estudio.

Cuando la información satisface los requerimientos antes mencionados, se hace necesario


cierto ordenamiento de los elementos de acuerdo con las categorías de una determinada
característica, es decir formando grupos, para esto se requiere identificar ciertas propiedades
intrínsecas de cada característica para definir el criterio, la variable o escala de clasificación.

Lo anterior permite distinguir dos tipos de variables o escalas de clasificación. Las


cuantitativas y las cualitativas.

Variables o Escalas de Clasificación.

Concepto de Variables.

Son características presentes en un individuo o elemento que estamos estudiando y que tienen
diferentes valores para cada objeto o individuo estudiado.

“Una Variable es una características que toman distintos valores en los diferentes sujetos
, eventos lugares o momentos. Cuando esa variable solo puede ser medida acorde con
una cierta catalogación o categorización recibe el nombre de variable categórica o
cualitativa. Si las variables pueden ser designadas con una cifra que permite una
medición numérica reciben el nombre de variables numéricas o cuantitativas” 7

Tipos de Variables y Escalas de clasificación.

• Nominales - Dicotómicas
• Variables Cualitativas. - Politómicas
• Ordinales

• Continuas
• Variables Cuantitativas
• Discretas o discontinuas.

Variable Cualitativa.

Son aquellas que clasifican a las personas u objetos de estudio de acuerdo a características o
cualidades que le son comunes. Ejemplo. Al clasificar a un grupo de personas por el sexo,
raza, estado civil, etc. Esta se subdivide en:

Variable Cualitativa Nominal. Son aquellas características que no presentan categorías


ordenadas, es decir que no existe relación de subordinación. Estas a su vez pueden ser:

• Dicotómicas. Cuando la variable toma únicamente dos valores. Ejemplo:

Dra. Rosa Saeteros Hernández. M.Sc. 34


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

Sexo: Masculino------- Femenino--------


Región de nacimiento: Urbana------- Rural--------

• Politómicas. Son aquellas variables que toman más de dos valores. Ejemplo:

Estado Civil: Soltero(a)----- Casado(a)----- Divorciado(a)----- Viudo(a)-----

Variable Cualitativa Ordinal. Son aquellas variables que presentan categorías ordenadas,
existe relación de subordinación. Es decir que sirven para establecer relaciones de
comparación. Ejemplo.

La Escolaridad: Primaria, Secundaria, Superior.


Estado de algún hecho o fenómeno que se puede categorizar en: óptimo, bueno, regular,
malo.

Variables Cuantitativas. Son valores en cantidades numéricas, en esta se puede establecer


cuanto y en que cantidad existe una determinada característica. Son mas precisas, porque a
más de permitir la diferenciación entre unos individuos y otros señalas cual grandes son las
diferencias observadas. Ejemplo: Determinación del peso, talla, pulso, presión arterial,
número de hijos, etc.

Las variables cuantitativas se dividen en continuas y discretas o discontinuas.

Variables Cuantitativas Continuas. Son aquellas variables que toman un infinito número de
valores entre dos números enteros, surgen por medición. Ejemplo: La edad de una persona,
puede ser 40 años, 40 años y 10 meses, o aun podrían expresarse como 40 años, 10 meses, 5
días, 18 horas, 14 minutos, etc.

Variables Cuantitativas Discretas o Discontinuas. Son aquellas que toman valores finitos o
enteros, surgen por conteo de las personas u objetos que posean determinada característica.
Ejemplo: Las familias clasificadas según el número de hijos, los escolares según el número de
caries dentales, el número de abortos, etc. En estas variables ningún valor fraccionado tendrá
significado.

Ejemplo de clasificación de variables:

• Presencia de Diabetes...............................Cualitativa nominal dicotómica.


• Escolaridad...............................................Cualitativa ordinal.
• Trimestre de captación de embarazo........Cualitativa ordinal.
• Estado civil...............................................Cualitativa nominal politómica.
• Edad Materna............................................Cuantitativa continua.
• Paridad......................................................Cuantitativa discreta.
• Peso y talla materna..................................Cuantitativa continua.

Condiciones para elaborar una escala cuantitativa correcta.

Para que se considere una correcta escala debe reunir las siguientes condiciones.

Dra. Rosa Saeteros Hernández. M.Sc. 35


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

1. Ser exhaustiva significa que debe permitir la clasificación de cualquier individuo y


no debe dejar dudas sobre donde incluir a cada una de las unidades en estudio.

2. Que sean mutuamente excluyentes es decir, que cada objeto o individuo se cuentan
una sola vez. Ejemplo:

TABLA No. 1 Escalas cuantitativas


Escala Incorrecta Escala Correcta
Edad Edad
0-5 0-4
5-10 5.9
10-15 10-14
15-20 15-19
Etc. Etc.

Una escala como la de la izquierda es incorrecta, porque es ambigua y en un momento dado


no se sabría dónde incluir a un niño que tuviera exactamente 5 ó 0 años de edad. La escala de
la derecha evita tal confusión y es la preferida por su sencillez y exactitud.

Clasificación de los datos.

Se comprende fácilmente que los individuos que se estudian pueden clasificarse según una
escala única variable o de acuerdo a dos o más escalas o variables a la vez. Teniendo en
cuenta esta noción los datos estadísticos podrán clasificarse en los tres tipos que a
continuación se describen:

• Distribuciones de Frecuencias.
• Datos de Asociación.
• Series Cronológicas.

Distribuciones de Frecuencias. Es la clasificación de individuos u objetos de acuerdo a una


única escala de clasificación, sea edad, peso, raza o estatura. Ejemplo:

TABLA No. 2 Individuos según sexo


SEXO No. %
Hombres 45 43.7
Mujeres 58 56.3
Total 103 100

Tipos de Frecuencias.

Existen cuatro tipos de frecuencias que son:

• Frecuencias Simples o Absolutas (f). Están asociadas al conteo del número de


observaciones en cada una de las clases.

Dra. Rosa Saeteros Hernández. M.Sc. 36


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

• Frecuencias Simples Relativas (fr o f %). Es la relación de la frecuencia absoluta


con el total.

• Frecuencias Acumuladas Absolutas (fc). Es la suma de frecuencias absolutas en


cada una de las clases.

• Frecuencias Acumuladas Relativas (fcr o fc%). Es la relación de cada frecuencia


acumulada relativa con el total de observaciones.

Las frecuencias más utilizadas son las simples, sin embargo la ventaja de utilizar las
frecuencias acumuladas, es que nos permite conocer en un momento dado de la distribución la
suma parcial o los porcentajes de datos hasta ese momento.

Para elaborar la tabla de frecuencias, los datos o posibilidades (X), deben estar
necesariamente ordenados. Por otra parte la tabla puede ser ascendente o descendente.

Cada uno de los grupos, valores o datos que se adoptan en una tabla de frecuencias se
denominan posibilidades (x1, x2, x3,.........Xn) las veces que se repite una posibilidad se
denomina frecuencia (f), la suma de frecuencias siempre será igual al total de los datos
investigados el mismo que se señala con una (n).

Ejemplo:

TABLA No. 3 Tabla de frecuencias, según grupo de edad


Grupo de SIMPLES ACUMULADAS
edades(X) Absolutas Relativas Porcentuales Absolutas Relativas Porcentuales
(f) (fr) (f %) (fc) (fcr) (fc%)
15 – 19 5 0.05 5 5 0.05 5
20 – 24 18 0.18 18 23 0.23 23
25 – 29 42 0.42 42 65 0.65 65
30 – 34 27 0.27 27 92 0.92 92
35 – 39 8 0.08 8 100 1.00 100
TOTAL 100 1.00 100

Si analizamos el significado de los datos de la tercera fila, diríamos que existen 42


personas con una edad entre 25 y 29 años, el 0,42 de probabilidad de que los estudiantes
tengan entre 25 y 29 años, el 42% de los estudiantes tienen entre 25 y 29 años de edad, y las
frecuencias acumuladas se podrían leer de la siguiente manera, hasta ese momento 65
personas o el 0,65 de probabilidad o el 65 % de individuos hasta ese momento tienen menos
de 29 años.

Tablas de Intervalos o clases.

Las razones para hacer este tipo de agrupamiento son: por una parte es antieconómico y poco
práctico tratar con un gran número de datos distribuidos en muchas posibilidades a menos que
se disponga de tecnología adecuada, y por otra parte algunos de los datos tienen asociada una
frecuencia tan baja que no justifica mantenerlos como entidades distintas y separadas. Como
factor negativo podemos indicar que si el número de clases o intervalos de clase que
escogemos es muy grande, tendrá el inconveniente de que habrá tantos detalles, que
relaciones importantes entre las observaciones estudiadas pasarán inadvertidos, por el

Dra. Rosa Saeteros Hernández. M.Sc. 37


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

contrario si determinamos muy pocas clases, probablemente pasaremos por alto importantes
características de los individuos.

Por tanto el número de clases debe ser tal que se evite el detalle innecesario pero que no
conduzca a la perdida de información.

Algunos autores señalan que deben tomarse entre 10 y 20 clases, otros que entre 8 y 15 y
algunos dicen que no deben ser menos de 6, ni más de 15, pero en definitiva, cualquier
selección del número de intervalos de clase o clases, dependerá de las características de los
datos.

Tipos de Intervalos o clases.

Se tienen dos tipos de intervalos: Desiguales e Iguales

1. Intervalos Desiguales. En estos únicamente interviene el criterio de la persona que realiza


el trabajo, quién da cada una de las clases que cree conveniente de acuerdo a sus necesidades.

Ejemplo: Tabla de 5 Intervalos Desiguales

TABLA No. 4 Tabla de frecuencias, según edad


Edad f fc
38 7 7
45 25 32
50 3 35
54 50 85
59 115 200
76 16 216
81 26 242
85 30 272
97 15 287
n 287

Ejemplo:

TABLA No. 5 Tabla de intervalos, según edad.

Edad f fc f% fc%
38-50 35 35 12.20 12.20
51-77 181 216 63.10 75.30
78-81 26 242 9.04 84.34
82-93 30 272 10.44 94.78
94-100 15 287 5.22 100.00
287 100.00

2. Intervalos Iguales. Se puede realizar de dos maneras, la una de acuerdo al número de datos
que se desea que intervengan en el intervalo y la segunda de acuerdo al número de intervalos

Dra. Rosa Saeteros Hernández. M.Sc. 38


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

que se deseen obtener, en este segundo caso se puede trabajar con la denominada Regla de
Sturges.

Primer Caso. El procedimiento es el siguiente:

Para el primer intervalo se añade al límite inferior de los datos el número que se requiere que
intervenga en cada intervalo, obteniéndose el límite superior del primer intervalo, para el
segundo intervalo, se toma el límite superior y se le suma 1, e igualmente se le añade el
número de datos propuesto.

Para saber previamente cuántos intervalos nos van ha resultar al aplicar este método,
utilizamos la siguiente fórmula:

a
No. Intervalos = + 1
i

Donde,

a = Amplitud de la muestra (dato mayor – dato menor).


i = Número de datos que se requieren que intervengan en el intervalo.

El valor resultante es el número de intervalos o clases que se obtendrá.

Ejemplo:

TABLA No.6 Cantidad de Hidratos de Carbono que consume


Peso (gr.) f fc
342 20 20
349 15 35
362 150 185
366 215 400
370 200 600
377 15 615
385 120 735
403 35 770
409 5 775
415 150 925
428 100 1025
432 25 1050
n 1050

TABLA : 15 datos por intervalo.

a
No. Intervalos = + 1
i

Dra. Rosa Saeteros Hernández. M.Sc. 39


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

432 – 34
No. Intervalos = + 1
15

No. Intervalos = 7

Este resultado quiere decir que al sumar 15 datos por intervalo, vamos a obtener 7 intervalos
iguales.

(i – 1 = ) 15 – 1 = 14

Dato menor del intervalo + 14 = límite superior del intervalo.


342 + 14 = 356

Límite superior del primer intervalo + 1 = límite inferior del segundo intervalo + 14.

356 + 1 = 357

TABLA No.6.1 Cantidad de Hidratos de Carbono que consume


Peso (gr) f
342 - 356 35
357 – 371 565
372 – 386 135
387 – 401 0
402 – 416 190
417 – 431 100
432 - 446 25
n 1950

Segundo Caso. Se sigue el siguiente procedimiento:

1. Se encuentra la diferencia entre el valor mayor y el valor menor de los datos que se
analizan, y ha este resultado le sumo 1.

2. El valor obtenido se divide para el número de intervalos que se han considerado en el


trabajo; como es general que casi nunca tengamos un número entero en la división
antes indicada, se acostumbra a aproximar este número a la cifra impar más cercana,
de modo que obtengamos intervalos de clase con un número impar de datos ( sin
embargo no es erróneo trabajar con intervalos que tienen números pares de datos., al
número aproximado se simboliza con la letra i.

3. Se toma el valor más bajo de los datos originales y se le añade i - 1, a fin de obtener
el primer intervalo de clase; para el segundo intervalo se toma el número consecutivo
superior, al resultado antes obtenido también se le añade i – 1, para los otros
intervalos se sigue el mismo procedimiento.
Ejemplo:

Dra. Rosa Saeteros Hernández. M.Sc. 40


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

Con los datos de la Tabla No.6 obtenga una tabla de 11 intervalos iguales.

Dato mayor – Dato menor


i = +1
No. Intervalos

432 – 342
i= + 1 = 91/11
11

8.27 Valor que aproximo al impar más cercano (i) = 9

i–1 = 9 -1 =8

Valor menor + 8 = Primer intervalo.


342 + 8 = 350

TABLA No.6.2 Cantidad de Hidratos de Carbono que consume


Peso (gr) f
342 - 350 35
351 - 359 0
360 - 368 365
369 - 377 215
378 - 386 120
387 - 395 0
396 - 404 35
405 - 413 5
414 - 422 150
423 - 431 100
432 - 440 25
n 1050

Regla de STURGES. Se aplica cuando en un trabajo cualquiera se desea conocer el número


aproximado de intervalos a emplearse y generalmente se utiliza cuando investigamos ciencias
de carácter bioestadísticas, esta regla se aplica en concordancia con el segundo caso para
intervalos iguales, o sea cuando se quiere definir el número de intervalos. Esta regla se utiliza
cuando no existen muchos datos, preferiblemente cuando existen entre 15 y 500 datos
aproximadamente, de lo contrario es preferible utilizar el primer método de intervalos iguales.

Su fórmula es:

K = 1 + 3, 3 log n

K = Número aproximado de intervalos iguales.

Dra. Rosa Saeteros Hernández. M.Sc. 41


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

n = Número de Observaciones.

log n = Logaritmo de n.

Ejemplo:

TABLA No.7 Valores


I f
0.71 7
0.79 15
0.91 2
0.94 1
0.02 3
1.10 7
1.18 1
1.25 10
1.36 15
1.52 7
1.60 1
n 69

K = 1 + 3,3 lg. n
K = 1 + 3.3 lg. 69
K = 1 + 3.3 (1,838849)
K = 1 + 6,o68202
K = 7.07

K = 7 Intervalos Iguales.

Dato mayor – Dato menor


i = +1
No. Intervalos
1,60 - 0.71 = 0.89 / 7
0,12 + 0,01
= 0.13

i - 0.01 0.13 - 0.01 = 0.12.

TABLA No.7.1 Valores


I f
0.71 – 0.83 22
0.84 – 0.96 3
0.97 – 1.09 3
1.10 – 1.22 8
1.23 – 1.35 10
1.36 – 1.48 15
1.49 – 1.61 8

Dra. Rosa Saeteros Hernández. M.Sc. 42


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

n 69

Límites de Clase. Cada uno de los intervalos de clase consta de sus límites inferiores y
superiores.

Al primer valor de cada clase se le denomina límite inferior, y al segundo valor, límite
superior.

TABLA No. 8 Tabla de Peso en Kilogramos de Estudiantes Universitarios

Peso en Kg. No. de escolares


30 – 39 2
40 – 49 3
50 – 59 4
60 – 69 5
70 – 79 6
80 - 89 4
n 24

Esta es una tabla de distribución de frecuencias de la variable cuantitativa continua peso.


Consta como vimos de 6 clases o intervalos, ahora bien cada clase consta de sus límites
inferiores y superiores. En este caso son límites inferiores los valores 30, 40, 50, 60, 70, 80; y
límites superiores 39, 49, 59, 69, 79, 89.

Límites aparentes o de notación y límites reales de los intervalos.

Cuando al presentar la tabla existe la diferencia de una unidad (según el grado decimal con
que se trabaja) entre uno y otro intervalo, se dice que tenemos los límites aparentes o de
notación, estos son los que están propiamente en el intervalo.

Se denominan límites reales simplemente aquellos en los cuáles no existe dicha diferencia. Si
consideramos que el valor de un número varía en forma real desde la mitad de la unidad
anterior, hasta la mitad de la unidad posterior, podemos indicar que el límite real inferior de
un intervalo será el mismo número menos la mitad de la unidad que se consideró en el trabajo,
y el límite real superior, será el mismo número más la mitad de dicha unidad.

Ejemplos:
TABLA No. 9 Límites aparentes de la variable edad
EDAD
68 – 72
73 – 81
82 – 84
85 – 96
97 – 100

TABLA No.10 Límites reales de la variable edad


EDAD
67.5 – 72.5
72.5 – 81.5

Dra. Rosa Saeteros Hernández. M.Sc. 43


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

81.5 – 84.5
84.5 – 96.5
96.5 – 100.5

Otra forma de obtener el límite real, es sumando el límite aparente superior más el límite
aparente inferior y dividiendo para 2. Así el primer intervalo de esta tabla sería:

72 + 73 / 2 = 72.5

Otro Ejemplo, utilizando decimales.

TABLA No.11 Límites reales de la variable peso


PESO (gr)
3.252 – 3.256
3.257 – 3.262
3.263 – 3.270
3.271- 3.280

En este caso la unidad sería 0.001, la mitad de esta es 0.0005.

TABLA No.12 Límites aparentes de la variable edad


PESO (gr)
3.2515 – 3,2565
3.2565 – 3.2625
3.2625 – 3.2705
3.2705 – 3.2805

El conocimiento de los límites aparentes y reales me permite hallar el punto medio o marca de
clase.

Punto Medio o Marca de Clase. Se simboliza (mc) y es la semisuma de los límites reales de
clase y dividido para dos.

mc = Suma de los límites reales de cada clase


2

Ejemplo:
TABLA No.13 Límites aparentes, reales y marca de clase de la variable edad

LIMITES APARENTES LIMITES REALES MARCA DE CLASE


68 – 72 67.5 – 72.5 67.5 + 72.5 / 2 = 70
73 – 81 72.5 – 81.5 72.5 + 81.5 / 2 = 77
82 – 84 81.5 – 84.5 81.5 + 84.5 / 2 = 83
85 – 96 84.5 – 96.5 84.5 + 96.5 / 2 = 90.5
97 – 100 96.5 – 100.5 96.5 + 100.5 / 2 = 98.5

Dra. Rosa Saeteros Hernández. M.Sc. 44


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

Amplitud de Clase. Sirve para determinar de dónde a dónde irá cada una de las clases.
Existen intervalos de igual amplitud y otros en los que la amplitud es diferente para cada
clase.
Amplitud de clase = Diferencia entre los límites reales de cada clase

Nota. La amplitud de clase siempre es positiva.

En el caso anterior sería:

TABLA No.14 Amplitud de clase de la variable edad


AMPLITUD DE CLASE
67.5 - 72.5 = 5
72.5 - 81.5 = 9
81.5 - 84.5 = 3
84.5 - 96.5 = 12
96.5 - 100.5 = 4

Otra forma de obtener la amplitud de clase es restando los límites aparentes o de


notación o aparentes y sumando 1. Así en el ejemplo anterior tenemos:

TABLA No.15 Límites reales de la variable edad


Resta de límites aparentes + 1

AMPLITUD DE CLASE
68 – 72 + 1 = 5
73 – 81 + 1 = 9
82 – 84 + 1 = 3
85 – 96 + 1 = 12
97 – 100 + 1 = 4

Datos de Asociación. Son aquellos datos en donde se clasifican simultáneamente a los


datos de acuerdo a dos o más escalas, como puede ser raza y sexo, o edad y sexo,
estatura y edad, etc. Ejemplo:

Tabla No. 16 Individuos por sexo y raza.

SEXO RAZA TOTAL


BLANCA NEGRA
Hombres 36 9 45
Mujeres 44 11 55
TOTAL 80 20 100

Series Cronológicas. Sirven para cuando se utiliza la escala de tiempo, para mostrar la
evolución de un fenómeno en relación con él. Ejemplo:

Dra. Rosa Saeteros Hernández. M.Sc. 45


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

Tabla No. 17 Mortalidad por Tuberculosis. Ecuador, 1952 – 1955

AÑO NÚMERO DE DEFUNCIONES


1952 459
1953 325
1954 270
1955 252

EJERCICIO INTEGRADOR V.

Clasificación de Variables.

1. Los datos que aparecen a continuación corresponden a las variables que se estudiaron en
un grupo de trabajadores de la Industria Azucarera para determinar la frecuencia de accidentes
del trabajo y enfermedades profesionales, así como se relaciona con el resto de la información
obtenida.

Variables o datos que se pidieron:

• Edad
• Sexo
• Nivel de escolaridad
• Estatura
• Estado Civil
• Número de hijos
• Años de trabajo en la ocupación actual
• Número de Accidentes sufridos.
• Existencia de Enfermedad profesional

Clasifique cada una de las variables.

2. En un estudio realizado sobre número de accidentes en los trabajadores de una industria


sideromecánica, se dispone de datos para 300 obreros de los 5000 con que cuenta la industria.

El interés de los autores era observar las diferencias en el número de accidentes en


trabajadores de diferentes ocupaciones dentro de la industria, según tipo de adiestramiento
previo y años de trabajo en esa ocupación.

a) Identifique las variables en estudio y clasifíquelas

3. Realice un ejemplo de cada una de las variables.

4. Con un ejemplo demuestre las condiciones de una escala correcta.

5. De los siguientes datos, construya una tabla de frecuencias simples y acumuladas.


(X1 200, X2 235................................ X104 280). (n = 104)

200 280 232 250 230 230 200 260 251 260 232 217 246
235 256 241 216 256 217 232 261 261 230 215 228 248

Dra. Rosa Saeteros Hernández. M.Sc. 46


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

241 260 266 226 280 217 241 262 217 255 208 232 228
260 217 243 226 271 221 217 230 220 255 217 215 232
208 209 217 208 266 230 220 241 215 266 210 221 212
217 241 221 200 277 266 232 252 208 217 208 272 280
217 250 250 215 240 217 217 230 209 217 209 217 230
232 261 232 220 221 208 258 251 215 220 215 220 280
245 262 246 221 222 209 258 230 215 222 221 231 200

6.Construya los siguientes intervalos de clase.

X f
126 132
130 204 a) 7 Intervalos Desiguales
138 315 b) 13 Intervalos Desiguales
150 121 a) 5 Datos por Intervalo
155 58 b) 17 Datos por Intervalo
166 33 c) 4 Intervalos Iguales
171 170 d) 13 Intervalos Iguales
177 258
194 43
205 120
210 70
219 18
228 150
247 52
250 26
n 1770

7. Realice los siguientes intervalos de clase

X f
0,0072 25
0,0084 15 a) 3 y 12 Intervalos
0,0096 10 Desiguales.
0,0099 30 b) 17 y 8 Datos por Intervalos.
0,0108 150 c) 5 y 11 Intervalos Iguales.
0,0125 250 d) Aplicar la regla de Sturges.
0,0144 15
0,0156 43
0,0170 25
0,0180 15
0,0193 100
0,0200 150
n 828

8. Si tenemos los pesos en Kg. De 20 niños:


52 45 47 31 35
43 44 49 53 41
44 39 37 40 47

Dra. Rosa Saeteros Hernández. M.Sc. 47


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

43 39 43 47 50

a) Realice una tabla de frecuencias con 6 intervalos o clases.


b) Obtenga las frecuencias simples y acumuladas.
c) Señale los límites aparentes y los límites reales.
d) Obtenga la marca de clase.
e) Obtenga la amplitud de clase.
9. Los siguientes valores son de ácidos grasos totales (mg / 100 cm 3) en suero de 91
individuos definidos como normales.

Ácidos Grasos Totales No. de individuos.


(mg. / 100 cm3)
190 – 229 8
230 - 269 12
270 - 309 19
310 - 349 23
350 - 389 18
390 - 429 11
Total 91

a) ¿ Qué tipo de variable es la estudiada?


a) ¿ Cuáles son los límites reales superior e inferior de cada clase?
b) ¿ Cuál es la amplitud de cada clase?
c) ¿ Determine el punto medio de cada clase?
d) ¿ Construya una distribución de frecuencias simples y acumuladas?

10. Se dan a continuación los resultados de la determinación de gamma – globulina en líquido


cefalorraquídeo en 57 personas consideradas sanas.

Globulina (mg, / 100 cm3) No. De individuos.


1.2 - 1.9 4
2.0 - 2.3 18
2.4 - 2.9 21
3.0 - 3.8 12
3.9 - 4.5 2
Total 57

a) ¿ Cuáles son los límites reales de cada clase.


b) ¿ Qué proporción de personas tiene 2.9 mg,/ 100 cm3 o menos de gamma globulina?
c) ¿ Qué proporción tiene hasta 2.9 mg, / 100 cm3?
d) ¿ Qué proporción de personas tiene 2.4 mg, / 100 cm3 o más de gamma - globulina?

"El hombre encuentra a Dios detrás de cada puerta que la ciencia logra abrir."
Albert Einstein

Dra. Rosa Saeteros Hernández. M.Sc. 48


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

CAPITULO VI
FORMAS DE ORGANIZAR, RESUMIR Y
PRESENTAR LA INFORMACIÓN ESTADÍSTICA
OBJETIVOS

▪ Identificar las principales formas de presentar la información estadística.


▪ Aplicar las reglas para la construcción adecuada de tablas y gráficos
▪ Interpretar cualitativamente la información presentada en tablas y gráficos estadísticos

CONTENIDOS
▪ Presentación de datos mediante texto
▪ Presentación Tabular o Cuadros Estadísticos
▪ Tipos de Tablas Estadísticas
▪ Partes de una Tabla Estadística
▪ Errores en la Presentación Tabular
▪ Formas de Leer Tablas Estadísticas
▪ Formas de Presentación Gráfica
▪ Formas de Presentación Gráfica, Variables Cualitativas y Cuantitativas Discretas con
Clases de Igual Amplitud
▪ Formas de Presentación Gráfica, Variables Cuantitativas Continuas y discretas con
clases de desigual amplitud
▪ Gráfico de Frecuencias Acumuladas
▪ Gráfico Aritmético Simple

Presentación de datos

“Las tres formas fundamentales de presentación de la información son: texto, las tablas o
cuadros estadísticos y los gráficos, que se combinan generalmente para lograr mayor claridad,
transparencia e interpretabilidad de la información” 8

Presentación de datos mediante texto

“Corresponde a la forma más sencilla de presentar datos. Como su nombre lo indica, se hace
una descripción narrativa de la información. Las dos formas más comunes de la presentación
textual de la información corresponden a:
Presentación de todos y cada uno de los datos obtenidos, para lo cuál se presenta un pequeño
párrafo que explica el origen de los datos y a continuación una nube de datos” 8 Esta forma
de presentación es poco práctica cuando se pretende describir el comportamiento de una
variable de interés en uno dos o más grupos, pues no se puede determinar a simple vista
diferencias entre los grupos ni la magnitud de la diferencia.

Dra. Rosa Saeteros Hernández. M.Sc. 49


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

Presentación Tabular o Cuadros Estadísticos.

“Si el volumen de información es grande y no parece conveniente una presentación textual, la


mejor alternativa consiste en la presentación de datos por medio de tablas, Una tabla se
define como un arreglo ordenado de filas y columnas clasificadas según el propósito y el tipo
de datos que se presenten”8.

Tiene como objetivo presentar de manera resumida y comprensible, determinado material


numérico.

Aunque la disposición del cuadro variará de acuerdo a los datos que se intenta resumir, hay
algunos principios comunes que deben tenerse en cuenta.

Tipos de Tablas Estadísticas.

La presentación se realiza de acuerdo a la complejidad y son:

• Tablas Simples o de una entrada. Para distribución de frecuencias y series


cronológicas (una sola variable).
• Tablas de Contingencia o de doble entrada. Para datos de asociación. (al menos
dos variables).

Partes de una tabla Estadística.

En todo cuadro debe considerarse:

1. Identificación.
2. El título.
3. El cuadro propiamente dicho.
4. Las notas explicativas.

1. Identificación. Siempre se tiene que poner una identificación a la tabla, que indique el
número, así: Tabla No. 1 o Cuadro No. 1, se pueden utilizar números arábicos o romanos.

2. Título. Como los cuadros deben entenderse fácilmente, sin necesidad de recurrir al texto
que acompañan, el título debe reunir dos condiciones:

a. Ser completo,

Un título que sea completo, debe indicar claramente cuál es el contenido del cuadro. En
otras palabras, debe responder a las preguntas:

QUE? COMO? DONDE? CUANDO?

• QUE se estudia, o sea, cuál es el universo que se investiga.


• COMO se estudia, es decir, de acuerdo a que características se clasifican los individuos
investigados.
• DONDE o a que lugar se refieren los datos.
• CUANDO o sea la época a que se refiere el estudio.

Dra. Rosa Saeteros Hernández. M.Sc. 50


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

b. Ser lo más conciso posible.

El título debe ser breve, lo más conciso posible, aunque no debe sacrificarse la claridad y
la concisión. Observe como el primero de los dos títulos siguientes es completo, pero le falta
brevedad y no añade nada nuevo al segundo de ellos.

Título no recomendable:

“Cuadro que muestra la distribución de las defunciones habidas en el Hospital general


Docente “Alfonso Chávez”, durante el año 2005, clasificadas de acuerdo con la edad y sexo
de los fallecidos”

Título correcto:

“Defunciones por edad y sexo. Hospital General Docente “Alfonso Chávez”. Riobamba,
2005”.

3. El cuadro propiamente dicho:

Consiste en un conjunto de casillas, dispuestas en columnas y filas. La primera fila es la de los


encabezamientos, los cuales indican a que se refieren los datos que son inscriptos en las
celdas subyacentes. Deben ser breves y explícitos.

La primera columna es la columna matriz, se destina a asentar las diferentes clases de la


escala de clasificación utilizada. Al resto, se les denomina columnas auxiliares y al resto de
las filas simplemente filas. Al entrecruzamiento de filas y columnas, donde están alojados
los datos numéricos, se les denomina: celda o casilla. Al resumen de las columnas (total) se
les denomina: pie de la tabla.

4. Notas explicatorias o calce.

Contiene habitualmente la fuente de los datos representados y cualquier nota aclaratoria


sobre el contenido de la tabla. Las partes de un gráfico son las mismas que las enunciadas
para la tabla estadística. Escoger entre uno u otro depende del tipo de variable a representar.

Ejemplo:
Tabla No.18
Distribución de Camas, Según Servicio de Atención. Hospital General Docente
Riobamba. 2005
SERVICIO DE ATENCIÓN No. CAMAS PORCENTAJE
Medicina General 267 25.1
Cirugía 266 25.0
Gíneco-Obstetricia 221 20.8
Emergencia 45 4.2
Otros Servicios 263 24.8
TOTAL 1062 100
FUENTE: Estadísticas del Hospital General Docente. Riobamba. 2005.

Dra. Rosa Saeteros Hernández. M.Sc. 51


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

Errores en la presentación Tabular.

Entre los errores que se cometen al elaborar un cuadro estadístico, deben evitarse
especialmente los siguientes:

a. Disposición incorrecta de los datos.


b. Títulos y encabezamientos incompletos o inadecuados, estos deben comprenderse
claramente, sin necesidad de recurrir al texto que lo acompaña.
c. Cuadros que muestran solamente porcentajes. Por lo general, los cuadros no deben
mostrar solamente porcentajes, sin indicar las cifras de donde proceden.
d. Cuadros sobrecargados. Cuadros que intentan mostrar muchos datos a la vez,
resultan confusos e inadecuados. En tales ocasiones es preferible hacer varios
cuadros separados

Formas de leer las Tablas Estadísticas.

La lectura de un cuadro estadístico no debe hacerse de manera desordenada. Existen


ciertas reglas resumidas y son las siguientes:

1. Leer cuidadosamente el título, con el fin de comprender perfectamente a qué se


refiere el cuadro.
2. Leer las notas explicativas, estas permiten a menudo su mejor comprensión.
3. Averiguar las unidades de medida utilizadas, el encabezamiento de la primera
columna explica que se trata de años de edad, meses, días, peso en kilogramos, etc.
4. Fijarse en el promedio o porcentaje general del grupo, para ver el comportamiento
general de las variables.
5. Relacionar el promedio General del Grupo con cada una de las variables que se
estudian.
6. Relacionar entre sí los promedios o porcentajes de las variables que se estudian.

A la hora de describir cualitativamente los datos, no se debe detallar todo lo que se


muestra en la tabla, sino dar a notar lo más significativo.

Formas de presentación gráfica.

Los gráficos son la representación del fenómeno que se estudia por medio de figuras
geométricas, por lo tanto es una forma auxiliar para presentar los resultados, su propósito
fundamental es dar la idea general del comportamiento del fenómeno que se estudia. Al ser
una forma de presentación auxiliar la fuente de un gráfico es la tabla de donde procede y se
utilizan cuando los datos de la tabla no son comprensibles a simple vista.

“La utilidad de los gráficos es doble , ya que pueden servir no solo como sustitutos de las
tablas, sino que también constituyen una poderosa herramienta para el análisis de datos ,
siendo en ocasiones el medio más efectivo no sólo para describir y resumir la información,
sino también para analizarla”8

Dra. Rosa Saeteros Hernández. M.Sc. 52


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

Partes de un gráfico estadístico.

Las partes de un gráfico son los siguientes:

1. Identificación
2. Título
3. Gráfico Propiamente dicho.
4. Notas aclaratorias.
5. Fuente.

1. Identificación. Siempre se debe poner la identificación que indique el número, así


puede ser: Gráfico No. 1, utilizándose de igual forma números arábicos o romanos.

2. Título. Puede llevar el mismo título que la tabla.

3. Gráfico propiamente dicho. Se refiere al gráfico que se realice tomando en


cuenta las reglas para escoger el tipo de gráfico de acuerdo al tipo de variable.

4. Notas. Se ponen aclaraciones, constantes por las cuáles se multiplican

5. Fuentes. Es obligatorio en los gráficos y específicamente se pone de que número


de tabla procede.

Cuando se presenta los resultados de una investigación, se puede poner tabla y gráfico,
también se puede poner solo la tabla sin gráfico, pero no puede haber gráfico sin tabla.

Formas de presentación gráfica para variables cualitativas y cuantitativas discretas,


con clases de igual amplitud.

Los gráficos que se utilizan para presentar estas variables son: el gráfico de barras y el de
sector o pastel.

Gráficos de Barras. Son aquellos gráficos en el cual los fenómenos que se estudian quedan
representados por una serie de rectángulos o barras, los cuáles pueden dibujarse horizontal o
verticalmente. En estos gráficos es la longitud de la figura (altura) la que es proporcional a la
magnitud del valor que representamos.

Recomendaciones para la construcción de gráficos:

Para todos los tipos de gráficos en el eje de las X se representa la Categoría de las Variables y
en el eje de las Y se representan las frecuencias.

En el gráfico de barras no se debe interrumpir el eje, por lo que siempre debe empezar desde
0, se pueden presentar frecuencias absolutas o relativas.

Los gráficos de barras se pueden clasificar en: simples, múltiples (dobles, triples, etc.) y
compuestos o proporcionales.

Dra. Rosa Saeteros Hernández. M.Sc. 53


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

Gráfico de Barras Simples. Se utilizan para distribución de frecuencias de una sola variable
o una sola escala de clasificación, se pueden presentar series cronológicas cuando no son
muchos años o períodos que se quiere presentar. Ejemplo:

Tabla No.19
Distribución de Camas, Según Servicio de Atención. Hospital General Docente
Riobamba 2005.

SERVICIO DE No. CAMAS PORCENTAJE.


ATENCIÓN
Medicina General 267 25.1
Cirugía 266 25.0
Gíneco Obstetricia 221 20.8
Emergencia 45 4.2
Otros Servicios 263 24.8
TOTAL 1062 100
FUENTE: Estadísticas del Hospital General Docente. Riobamba. 2005.

Gráfico No. 1
Distribución de Camas, Según Servicio de Atención. Hospital
General Docente Riobamba.2005
300
250
Número de Camas.

200
150
100
50
0
Medicina Cirugía Gíneco Emergencia Otros
General Obstetricia Servicios
Servicio de Atención.

FUENTE: Tabla No.2

Si quisiéramos representar el número de camas según el servicio de atención, tendríamos el


gráfico siguiente:

Siempre que sea posible se deben ordenar las frecuencias de mayor a menor antes de
representarlas en el gráfico.

Dra. Rosa Saeteros Hernández. M.Sc. 54


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

Gráfico de Barras Múltiples. . Se utilizan para datos de asociaciones decir cuando


tenemos mas de una variable o escalas de clasificación, los gráficos serán de barras dobles,
triples y así sucesivamente.

Ejemplo:

Tabla No. 20
Estudiantes, según el color de la piel y el sexo. Escuela Nutrición. ESPOCH.
Riobamba 2005.

Sexo
Color de la Piel Masculino Femenino
No. % No. %
Blanca 56 42.4 40 32.8
Negra 30 22.7 34 27.8
Mestiza 36 27.3 44 36.1
Amarilla 10 7.6 4 3.3
Total 132 100 122 100
FUENTE: Entrevistas aplicadas. Escuela de Nutrición. ESPOCH. 2005

Grafico No.2
Distribución de los estudiantes, según color de la piel y el
sexo. Escuela Leonardo Favio. Riobamba. 1995.
60
50
No. de estudiantes.

40
30
20
10
0
Blanca Negra Mestiza Amarilla
Color de la Piel.

Masculino No. Femenino No.

FUENTE: Tabla No. 20

En este caso es necesario incluir la leyenda para expresar a lo que se refieren cada uno de los
rectángulos. De esta misma forma se podría entonces representar 3,4 o más características y
entonces construir gráficos de barras triples, cuádruples, etc.

Gráfico de Barras Compuestas o Proporcionales. Se usan para variables cualitativas y


cuantitativas discretas de igual amplitud, en este caso se trata de una sola figura geométrica
(rectángulos), estos muestran la proporción de las partes de una variable con relación al total.
La altura de la figura siempre es el 100 % y se representan los porcentajes.

Dra. Rosa Saeteros Hernández. M.Sc. 55


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

En relación con la Tabla No.3, si queremos representar los diferentes tipos de piel en un
mismo rectángulo, indicando que proporción de cada color de la piel teníamos en relación con
el sexo, el gráfico quedaría de la siguiente forma:

Grafico No. 3
Distribución de los estudiantes, según color de la piel y sexo. Escuela Nutrición.
ESPOCH. Riobamba 20055.
120
100 7,6 3,3
80 Amarilla
Porcentaje.

27,3 36,1
60 22,7
Mestiza
27,8
40 Negra
20 42,4 32,8 Blanca
0
Masculino Femenino
Sexo.

FUENTE: Tabla No. 20

Gráfico de Pastel o Sectores. Otro de los gráficos que se utiliza para representar las
variables cuantitativas discretas y cualitativas es el de sector o pastel. Su uso más frecuente es
con fines comparativos, cuando se quiere mostrar los diversos componentes de una serie. La
figura geométrica utilizada es la circunferencia, se usa cuando la tabla no tiene muchas clases
o intervalos, ya que puede haber muchas divisiones y no se logre divisar lo que se quiere. Este
círculo se divide en sectores tales que sus medidas angulares sean proporcionales a las
magnitudes de los valores que representan. Para hallar la medida angular de cada sector
representativo de los datos se procede así:

Calculamos el porcentaje correspondiente a cada valor, ya que solamente sé grafican las


frecuencias relativas, de igual manera el total siempre será el 100 %.

Ahora, la circunferencia está dividida en grados y no en porcentaje, por esto debemos llevar
de porcentaje a grados.

Sabemos que los 360 grados de la circunferencia deben corresponder con el cien porciento de
los datos. Aplicando la regla de 3 tenemos:

Dra. Rosa Saeteros Hernández. M.Sc. 56


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

360 grados 100%


X grados ?

Es decir que si multiplicamos el porcentaje por 3,6 obtenemos el número de grados


correspondiente.

Ejemplo:

Tabla No. 21
Distribución de Camas en los servicios de Ginecología y Obstetricia. Hospital
General Docente. Riobamba. 1995.

Servicio No. de Camas Porcentaje


Ginecología 172 77.83
Obstetricia 49 22.17
Total 221 100.00
FUENTE: Estadísticas del Hospital General Docente de Riobamba. 2005.

X grados Ginecología = 77.83 x 3,6 = 280.188 280 grados.

X grados Obstetricia = 22.17 x 3,6 = 79.812 80 grados.

Elaborado el gráfico tendríamos:

GRAFICO No. 4
Distribución de camas según servicio de Ginecologia y
Obstetricia. Hospital Policlínico. Riobamba. 1995.

22%

Ginecología
Obstetricia
78%

FUENTE: Tabla No. 21

Formas de Presentación Gráfica para Variables Cuantitativas Continuas y


discretas, con clases de desigual amplitud.

Estos datos pueden ser presentados en dos tipos de gráficos: histogramas, polígonos de
frecuencias, gráfico de frecuencias acumuladas y gráfico aritmético simple.

Dra. Rosa Saeteros Hernández. M.Sc. 57


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

Histogramas. Se usa cuando queremos representar una distribución de frecuencias en escala


cuantitativa continua, es un gráfico representado por una serie de rectángulos, semejante al de
barras, pero las barras del histograma siempre se colocan verticalmente y una al lado de la
otra sin que haya un espacio que las separe.

La base del rectángulo es la amplitud de la clase de la variable correspondiente. La altura del


rectángulo es la frecuencia de la clase respectiva en el eje de las ordenadas.

Para elaborar el histograma tenemos que:

1. Hallar la amplitud de clase.


2. Se obtiene las frecuencias por unidad de medida cuando la amplitud de la clase de la
variable es desigual, dividiendo las frecuencias absolutas para la amplitud.
3. Se traza el eje de coordenadas, en el eje de la X la variable y en el eje de la Y las
frecuencias por unidad, si la amplitud de clase es igual se dibujan las frecuencias
absolutas.
4. Se rompe el eje de la X, ya que no empieza en 0, y en este colocamos los límites
inferiores, y en el último punto, el último límite superior de las clases. Ejemplo:

Tabla No.22
Pacientes con Tuberculosis por grupos de edades. Chambo 2005.

Grupos de edad No de Pacientes Porcentaje Amplitud de Clase Frec. Por Unidad


25 - 29 18 3.7 (29 –25) + 1 = 5 18/5 =3.6
30 – 34 48 9.2 (34 – 30) + 1 = 5 48/5 =9.6
35 – 39 79 16.2 5 79/5 =15.8
40 – 54 226 46.1 15 226/15 =15.1
55 – 59 63 12.9 5 63/5 =12.6
60 – 69 45 9.2 10 45/10= 4.5
70 – 90 13 2.7 20 13/20 = 0.6
Total 488 100
FUENTE: Estadísticas Centro de Salud Chambo. 2005.

Construido el gráfico nos quedaría de la siguiente manera:

Dra. Rosa Saeteros Hernández. M.Sc. 58


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

Grafico No. 5
Pacientes con Tuberculosis según grupo de edad. Chambo.
2005

250

200
Frecuencias

150

100

50

0
25 - 29 30 – 34 35 – 39 40 – 54 55 – 59 60 – 69 70 – 90
Edad

FUENTE: Tabla No. 22

Caso Especial del Histograma.

Es aquel en el que, las clases tienen la misma amplitud y en ese caso no es necesario la
transformación de los datos en frecuencias por unidad, ya que al dividir todos son
proporcionales al porcentaje y se realiza el Histograma con las frecuencias relativas o
porcentajes.

TABLA No. 23
EDAD DE PADRES Y MADRES DE ADOLESCENTES. ENTRE 12 Y 18 AÑOS.
RIOBAMBA 2005

EDAD No. %
28 - 33 39 20
34 - 39 77 39
40 - 45 59 30
46 - 51 18 9
52 - 57 7 4
TOTAL 200 100
FUENTE: Encuesta Educación Sexual Familiar. ESPOCH. 2005

Dra. Rosa Saeteros Hernández. M.Sc. 59


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

GRAFICO No. 6
Edad de padres y Madres de familia de adolescentes entre
12 y 18 años de edad. Riobamba. 2005
90
80
70
FRECUENCIA

60
50
40
30
20
10
0
28 - 33 34 - 39 40 - 45 46 - 51 52 - 57
EDAD

FUENTE: Tabla No. 23

Polígono de Frecuencia.

Son gráficos de líneas se realizan cuando se tiene que presentar más de una característica en
el mismo gráfico. Se procede de la misma manera que para realizar el histograma:

➢ Hallar la amplitud de clase.


➢ Se obtiene la frecuencia por unidad de medida, dividiendo las frecuencias absolutas para
la amplitud.
➢ Se traza el eje de coordenadas, en el eje de la X la variable y en el eje de la Y las
frecuencias por unidad.
➢ Se rompe el eje de la X, ya que no empieza en 0, y en este colocamos los límites
inferiores, y en el último punto, el último límite superior de las clases.

Y luego:

➢ Se toman los puntos medios de cada clase.


➢ Se marca un punto en el gráfico en donde se intercepta el punto medio de la clase con
su frecuencia.
➢ Se unen mediante líneas estos puntos marcados.

“Un ejemplo puede ser la variable edad de la primera relación sexual de los estudiantes de la
ESPOCH según el sexo”6.

Dra. Rosa Saeteros Hernández. M.Sc. 60


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

TABLA No. 24

EDAD DE LA PRIMERA RELACIÓN SEXUAL. ESPOCH. 2002


SEXO
MASCULINO FEMENINO TOTAL
EDAD
No. % No. % No. %
10 2 100.00 0 0.00 2 0.91
11 1 100.00 0 0.00 1 0.46
12 3 100.00 0 0.00 3 1.37
13 10 90.99 1 9.01 11 5.02
14 27 96.43 1 3.57 28 12.79
15 28 96.55 1 3.45 29 13.24
16 31 86.11 5 13.89 36 16.44
17 18 75.00 6 25.00 24 10.96
18 27 72.97 10 27.03 37 16.89
19 5 41.67 7 58.33 12 5.48
20 3 17.65 14 82.35 17 7.76
21 5 50.00 5 50.00 10 4.57
22 1 25.00 3 75.00 4 1.83
23 2 66.67 1 33.33 3 1.37
24 0 0.00 2 100.00 2 0.91
TOTAL 163 74.43 56 25.57 219* 100
FUENTE: Encuesta de comportamientos, conocimientos, opiniones y predisposiciones en sexualidad. ESPOCH 2002
*El total corresponde a estudiantes que tienen relaciones sexuales.

GRÁFICO No. 7
EDAD DE LA PRIMERA RELACIÓN SEXUAL. ESPOCH. 2002

35
ESTUDIANTES SEGÚN SEXO

30

25

20 MASCULINO
FEMENINO
15

10

0
10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
EDAD PRIMERA RELACIÓN

FUENTE: Tabla No. 24

Si se desea se pueden también agrupar los datos en intervalos de clases y obtener el gráfico de
la misma forma, tomando en cuenta la amplitud igual para los intervalos.

Dra. Rosa Saeteros Hernández. M.Sc. 61


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

Gráfico de Frecuencias Acumuladas.

Se utiliza para representar frecuencias en escala cuantitativa con fines analíticos para resumir
series cronológicas cuando se tiene interés en el efecto acumulado a través del tiempo, es
decir la situación del fenómeno en un momento determinado.

Para su elaboración se deben seguir los pasos siguientes:

1. Obtener las frecuencias acumuladas.


2. Trazar el sistema de coordenadas y numerar las escalas en la X o abscisa se ponen las
clases de la variable (límites inferiores), la ordenada empieza en 0 y en el último
punto se inscribe el número mayor del intervalo.
3. Puede construirse una doble escala, donde se presente al un lado los porcentajes
acumulados y en la otra las frecuencias acumuladas simples.
4. Se inscriben las frecuencias acumuladas en donde se intercepta la clase de la variable
y su frecuencia o porcentaje acumulado.
5. Unir los puntos inscritos con una línea continua, para facilitar la lectura.

Ejemplo:

Tabla No. 25
Defunciones por accidentes. Frecuencias acumuladas por grupos de edad.
Ecuador 2003.

EDAD No. DEFUNCIONES FRECUENCIAS ACUMULADAS


No. %
0 - 9 748 748 23.3
10 - 19 457 1205 37.6
19 - 29 642 1847 57.6
30 - 39 466 2313 72.1
40 - 49 340 2653 82.7
50 - 59 241 2894 90.2
60 - 69 156 3050 95.1
70 - 79 76 3126 97.5
80 - 89 81 3207 100.0
TOTAL 3207
FUENTE: Estadísticas Ministerio de Salud Pública. Ecuador. 2003

Dra. Rosa Saeteros Hernández. M.Sc. 62


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

GRAFICO No. 8
Defunciones por accidentes. frecuencias acumuladas por grupos de
edad. Ecuador. 2003
3500
3000
Frecuencias Acumuladas

2500
2000
1500
1000
500
0
0 - 9 10_18 19 - 29 30 - 39 40 - 49 50 - 59 60 - 69 70 - 79 80 - 89

Edad

FUENTE: Tabla No. 25

Este gráfico permite responder las siguientes preguntas:

1. ¿Cuántas defunciones hubo en menores de determinada edad?

Si queremos saber cuantas muertes ocurrieron en menores de 35 años, trazamos una


vertical a esta edad hasta la curva del diagrama y se proyecta en la escala vertical izquierda o
derecha, en nuestro ejemplo indica que por debajo de esta edad hay aproximadamente 2100
defunciones.

2. ¿ De las defunciones totales, qué porcentaje ocurrió por debajo de determinada edad?

En este caso trazamos una vertical ha la curva y se proyecta a la escala de los porcentajes, si
observamos en el ejemplo anterior, aproximadamente las muertes ocurridas en menores de 35
años representan un 65 % de las defunciones.

3. ¿Por debajo de qué edad ocurrió determinado porcentaje de las defunciones?

Si nosotros queremos saber antes de que edad ocurrió el 50% de las defunciones se traza una
horizontal desde esta cifra hasta la curva del diagrama y bajando luego una vertical hasta la
clase de la variable, en este caso vemos que el 50 % de las defunciones ocurrieron antes de los
26 años.

Gráfico Aritmético Simple.

Sirve para representar variables cuantitativas y principalmente series cronológicas, es decir


cuando se analiza la evolución de un fenómeno en el tiempo.

Dra. Rosa Saeteros Hernández. M.Sc. 63


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

Este gráfico es usado para series cronológicas, pues su curva estadística presenta las
oscilaciones de los datos presentados.

Este gráfico esta compuesto por dos escalas aritméticas:

1. El eje horizontal (eje x), se llama escala cronológica, aquí se inscribe el tiempo
(años, meses, días, horas, etc.).
2. El eje vertical (eje y) llamado escala numérica de valores, aquí se inscriben las
frecuencias simples absolutas, las frecuencias simples relativas o las tasas.

En el mismo gráfico se puede representar la evolución en el tiempo de una variable o más de


una variable.

Un ejemplo sería:

Tabla No. 26
Casos de Tosferina. Área de Salud Chambo. Riobamba. 1956 - 1960.

AÑOS CASOS %
1956 2824 17.20
1957 1420 8.64
1958 938 5.71
1959 4476 27.25
1960 6764 41.20
TOTAL 16422 100.0
FUENTE: Anuario Estadístico. Ecuador 1961.

GRAFICO No. 8
Casos de Tos Ferina. Area de Salud Chambo.Riobamba. 1956 -
1960
8000
7000
6000
5000
Número

4000
3000
2000
1000
0
1956 1957 1958 1959 1960
Años

FUENTE: TABLA No. 26

EJERCICIO INTEGRADOR VI.

1. Cuando se realizan tablas de datos se pueden encontrar los siguientes casos:

Realice una tabla con todas sus partes, considerando las siguientes combinaciones:

Dra. Rosa Saeteros Hernández. M.Sc. 64


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

1. Una tabla simple con una variable cualitativa nominal dicotómica.


2. Una tabla simple con una variable cualitativa nominal politómica (de 6 categorías)
3. Una tabla simple con una variable cualitativa ordinal
4. Una tabla simple con una variable cuantitativa discreta de igual amplitud
5. Una tabla simple con una variable cuantitativa discreta de desigual amplitud
6. Una tabla simple con una variable cuantitativa continua de igual amplitud
7. Una tabla simple con una variable cuantitativa continua de desigual amplitud
8. Una tabla de contingencia con 2 variables cualitativas nominales dicotómicas y/o
politómicas.
9. Una tabla de contingencia con dos variables cualitativas ( una nominal y otra ordinal)
10. Una tabla de contingencia con dos variables ( una cuantitativa discreta de igual
amplitud y una variable cualitativa (nominal y/o ordinal)
11. Una tabla de contingencia con dos variables ( una cuantitativa discreta de desigual
amplitud y una variable cualitativa (nominal y/o ordinal)
12. Una tabla de contingencia con dos variables ( una cuantitativa continua de desigual
amplitud y una variable cualitativa (nominal y/o ordinal)
13. Una tabla de contingencia con dos variables ( una cuantitativa continua de igual
amplitud y una variable cualitativa (nominal y/o ordinal)
14. Una tabla simple con datos de una serie cronológica
15. Una tabla de contingencia con datos de una serie cronológica y una variable cualitativa
nominal dicotómica y/o politómica.

Nota. Cada una de estas condiciones que se pueden observar en la presentación tabular son
importantes, pues de estos detalles depende el tipo de gráfico que se realizará para la
presentación tabular.

2. En una investigación sobre riesgos profesionales en los trabajadores de la industria del


cromo en 1975, se encontró en una muestra de 897 trabajadores, que 509 de ellos presentaban
perforación de tabique nasal.

Del total de trabajadores de la muestra, 41 habían trabajado menos de 6 meses en la industria


del cromo; 117 lo habían hecho por un lapso de 6 meses a 3 años; 370 se habían mantenido
en ese trabajo por un período de 4 a 10 años; 369 llevaban más de 10 años trabajando en la
industria.

Entre los 509 trabajadores portadores de perforación del tabique nasal, solo 1 había
permanecido en la industria durante menos de 6 meses; 46 lo habían hecho durante un período
de 6 meses a 3 años; 205 habían trabajado durante 4 a 10 años en ambientes saturados de
derivados crómicos; y 257 estaban hacía más de 10 años en la industria del cromo.

a. Presente estos datos en una tabla estadística completa.


b. Describa la información presentada.
c. Construya el gráfico apropiado.

3. En una muestra de trabajadores derechohabientes de una institución de seguridad social se


observó en 1990 que se habían producido 245750 accidentes de trabajo. De ellos, 97680
fueron heridas; 58343 sé diagnosticaron como contusiones; 12.126 correspondieron a

Dra. Rosa Saeteros Hernández. M.Sc. 65


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

fracturas; 6346 tuvieron el diagnóstico de lumbago; y el resto se distribuyó entre 19 tipos


diversos de lesión, con frecuencias poco significativas.

a. Presente estos datos en una tabla completa.


b. Describa los datos presentados.
c. Construya el gráfico apropiado.

4. Un Hospital dispuso en 1993 de un total de 1062 camas. De ellas, 267 correspondían al


servicio de Medicina y se distribuían a su vez en: 130 de Medicina General; 38 de
Cardiología; 19 de Endocrinología; 32 de Nefrología; 24 de Gastroenterología; 8 en
Reumatología; 8 en oncología; y 8 en Neurología.

El servicio de cirugía contó con 266 camas. El servicio de Gíneco – Obstetricia, dispuso de
221 camas, de las cuales 172 pertenecían a Obstetricia. Hubo además 50 camas de Urología;
de Neurología; 29 de Otorrinolaringología; 28 de Dermatología; 45 de Oftalmología; 45 del
servicio de Emergencias; 58 Psiquiatría; y 12 de la Unidad de Cuidados Intensivos.

a. Construya el o los cuadros adecuados para presentar esta información.

b. Interprete la información presentada.

5. En 1993 nacieron en un servicio de Obstetricia 11429 niños. De ellos, 5911 fueron


hombres y 5518 mujeres. Los pesos de los niños fueron: de menos de 1000 gms, 16 nacidos
vivos; 82 nacidos vivos entre 1001 y 1500 gms; 143 entre 1501 y 2000 gms; 1469 entre 2501
y 3000 gms; 427 entre 2001 y 2500 gms; 2116 niños entre 3001 y 3500 gms; 1285 entre 3501
y 4000 gms; 293 niños entre 4001 y 4500 gms; 45 pesaron más de 4500 gms; no se conoció
el peso de 25 nacidos vivos de sexo masculino.

Los pesos de las niñas fueron: más de 4500 gms: 20 casos; 133, entre 4001 y 4500 gms; 855,
entre 3501 y 4000; 2079 entre 3001 y 3500 gms; 1656 pesaron entre 2501 y 3000 gms; 522,
entre 2001 y 2500 gms; 153 nacidas vivas entre 1501 y 2000 gms; 72, entre 1001 y 1500 gms;
11 casos de niñas menos de 1000 gms, en 17 casos de nacimientos de niñas no se conoció el
peso.

a. Construya la tabla más adecuada para presentar estos datos.


b. Interprete la Información presentada.
c. A partir de la tabla confeccione el gráfico más adecuado.

6. Según datos reflejados en el anuario estadístico del MSP del año de 1974. Las tasas de
fecundidad por edades de la madre por 1000 mujeres para los años 90, 93 y 94 se
comportaron de la siguiente forma.

Para el año 1990, para el grupo de 15 – 19 años la tasa fue de 77.5 de 20 – años, 113.0 de 97.4
para el grupo de 25 – 29 años, 56.1 para el de 30 – 34 años, para el grupo de 35 – 39 años,
17.5 para el de 40 – 44 años, 3.3 y para el de 45 – 49 años, 0.3. la tasa global total fue de 62.1

Para los años 93 y 94 siguiendo el mismo ordenamiento de los grupos etáreos las tasas fueron:

1993 1994
68.0 63.9

Dra. Rosa Saeteros Hernández. M.Sc. 66


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

95.0 93.7
79.0 78.2
39.5 39.4
15.5 14.9
2.3 2.1
0.4 6.4
49.9 48.2

Además en el anuario se aclara que los datos del año 94 son provisionales.

a. Construya una tabla estadística para presentar estos datos.


b. Construya el gráfico más adecuado.
d. Conteste brevemente el comportamiento de la fecundidad.

7. Las 5 primeras causas de muerte según los datos del Anuario Estadístico del año 1996 para
Cuba expresado en tasas por 100000 habitantes, fueron:

Enfermedades del corazón en una tasa de 217.9 para hombres y 172.5 para las mujeres.
Tumores Malignos. Con tasas de 153 para el sexo masculino y 112.2 para el femenino.
Enfermedades Cardiovasculares donde los hombres presentan una tasa de 67.5 y 73.4 las
mujeres. Accidentes con tasas de 0.6 y 30.9 para varones y hembras y por último Influenza y
neumonía con 30.7 y 29.2 tasas para hombres y mujeres.

a. Construya una tabla estadística para representar estos datos.


b. Construya el gráfico más adecuado.
c. Realice un análisis de la información presentada.
8. La Mortalidad por enfermedades Diarreicas Agudas repartido para Cuba desde el año 1989
hasta el año 1995 aparecen en el Anuario Estadístico de 1995. En el mismo se aclara que las
tasas por 100000 habitantes y que los datos del año 1995 son provisionales.

Los datos se muestran a continuación.

1989 2.1
1990 3.5
1991 4.0
1992 4.2
1993 6.6
1994 6.5
1995 5.6

a. Presente estos datos en una tabla estadística.


b. Presente un gráfico que considere adecuado.
c. Realice un análisis de la información presentada.

9. Los datos sobre los casos positivos de cáncer cérvico uterino en las mujeres examinadas
para el programa en las diferentes etapas clínicas para Cuba en el año 1995 aparecen en el
anuario estadístico del mismo años. En la etapa I se encuentra el 1.5 % de los casos, estaban
en etapa II el 0.7%, en la III, o.4% y el la IV etapa el 0.1 %.

a. Construya un cuadro estadístico adecuado para presentar esta información.

Dra. Rosa Saeteros Hernández. M.Sc. 67


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

b. Realice el gráfico más adecuado.

"No hay un solo tema científico, que no pueda ser explicado a nivel popular."
Sagan, Carl

CAPITULO VII
MEDIDAS DESCRIPTIVAS
OBJETIVO

• Calcular e interpretar las principales medidas que resumen variables cualitativas y


cuantitativas

CONTENIDOS

• Medidas de Resumen para Variables Cualitativas(Razón, Índice, Proporción,


Porcentaje y tasas)
• Medidas de Resumen para Variables Cuantitativas.
• Medidas de tendencia central en series no agrupadas y en series agrupadas: media o
promedio aritmético, mediana, moda. Gráficos de Cajas.
• Medidas de dispersión en series no agrupadas y agrupadas :desviación estándar,
varianza, coeficiente de variación

Medidas de Resumen para Variables Cualitativas.

Dra. Rosa Saeteros Hernández. M.Sc. 68


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

Las variables cualitativas se resumen y se analizan por medidas que en general son: razones,
índices, proporciones, porcentajes y tasas.

Razón. (Expresa relación). Es la relación entre 2 partes sin tener en cuenta el total es decir
independientemente de este, es una fracción de la forma: a/b donde a y b se refieren a hechos
diferentes.

Ejemplo: Una determinada población de 396 estudiantes está formado por 297 hombres y 99
mujeres, aunque es evidente el predominio de hombres, la intensidad de esa relación se
apreciará mejor, al dividir el número de hombres por el de mujeres, así:

297 / 99 = 3

Con lo cuál esta razón expresa que hay 3 hombres por cada mujer en dicho grupo de
estudiantes.

Índice. Es el producto de multiplicar una razón por 100. Es una fracción de la forma: a/b x
100. En el ejemplo anterior sería:

297 / 99 x 100 = 300

Este índice nos indica que existen 300 hombres por cada 100 mujeres.

Proporción. ( Expresa importancia relativa). Es la relación o cociente entre el número de


individuos con una característica y el total de individuos que se estudian. Es una fracción de
la forma: a / a + b.

En el ejemplo anterior tendríamos:

Hombres / Hombres + Mujeres

297 / 297 + 99 = 297 / 396 = 3 / 4.

Quiere decir que de cada 4 estudiantes de esa población, 3 son hombres.

Porcentaje. Es una proporción multiplicada por 100.

% = a / total x 100.

En el ejemplo tomado anteriormente sería:

% = 297 / 396 x 100 = 75 %.

Lo que indica que es esa población existe un 75 % de hombres.

Tasas. (Expresan riesgo). Es la relación por cociente entre el número de veces en que sucede
un determinado fenómeno y la población expuesta al riesgo de ocurrencia de ese fenómeno.

Dra. Rosa Saeteros Hernández. M.Sc. 69


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

Expresa por lo tanto la probabilidad de ocurrencia de un fenómeno en una población


determinada y en un período determinado. Se puede decir que una tasa es una fracción de la
forma

a/a+b x 10 a la n.

Donde a es la frecuencia con la cual ha ocurrido un evento durante algún período de tiempo
especificado. a + b es el número de personas expuestas al riesgo durante el mismo
período de tiempo.

Para mayor claridad podemos resumir en lo siguiente:

No. De veces que ocurre un determinado fenómeno. n


Tasa = -------------------------------------------------------------- x 10
Población en la cual ocurre el fenómeno.

Para que el denominador sea correcto hay que tomar en cuanta la población a mitad de
período es decir la del primero de Julio, pues se considera que dicha población es la
intermedia entre la de principios y final de año, pues esta continuamente esta cambiando
producto de los nacimientos, la mortalidad y las migraciones.

Las principales tasas utilizadas en Salud Pública son las siguientes:

▪ Tasa de Mortalidad. (Expresa el riesgo de morir)


▪ Tasa de morbilidad (Expresa el riesgo de enfermar)
▪ Tasa de letalidad (Expresa la gravedad de una enfermedad, el riesgo de morir de los
enfermos)
▪ Tasa de Natalidad (Como Componente de cambio poblacional)

Estas tasas pueden calcularse para toda la población y por todas las causas las que se llaman
ha estas se las denomina tasas crudas, totales, globales y generales o separadamente para
algunos de sus segmentos, por ejemplo para un determinado grupo de edad o sexo, y por
alguna causa se conocen con el nombre de tasas específicas. Una tasa puede hacerse tan
específica como se quiera.

Fórmulas de las Principales Tasas

NOMBRE DE LA TASA FORMULA CONSTANTE


Tasa Cruda de Mortalidad Defunciones por todas las causas y en todas
las edades, ocurridas en determinada región
durante determinado año
X 1000

Dra. Rosa Saeteros Hernández. M.Sc. 70


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

Población de la mencionada región para el


primero de Julio del año que se estudia

Tasa Cruda de Natalidad Total de Nacimientos vivos habidos en


determinada región durante determinado año
X 1000
Población de la mencionada región para el
primero de Julio del año que se estudia

Tasa Cruda de Morbilidad Esta generalmente no se calcula, ya que es


imposible conocer la morbilidad total en una
región
Tasa de Incidencia Casos Nuevos de una enfermedad en
determinada región durante determinado
tiempo
X 100000
Población de la mencionada región para el
primero de Julio del año que se estudia
Tasa de Prevalencia Casos Nuevos más casos viejos de una
enfermedad en determinada región durante
determinado tiempo
X 100000
Población de la mencionada región para el
primero de Julio del año que se estudia
Tasa de Mortalidad Específica Defunciones por determinada causa habidas
por causa en determinada región durante el año en
estudio X 100000
Población de la mencionada región para el
primero de Julio del año que se estudia
Tasa de Mortalidad Específica Defunciones por todas las causas en
por Edad determinada edad habidas en determinada
región durante el año en estudio X 100000
Población del correspondiente grupo de edad
de la mencionada región para el primero de
Julio del año que se estudia
Tasa de Mortalidad Específica Defunciones por determinada causa en
por causa y por edades determinada edad habidas en determinada
región durante el año en estudio
Población de la mencionada región en el
grupo de edad para el primero de Julio del
año que se estudia
Tasa de Letalidad Defunciones por determinada Causa
X 100
Casos Conocidos de la enfermedad en el
mismo año y en la misma región
Tasa de Mortalidad Infantil Defunciones de niños menores de un año
X 1000
Nacimientos vivos
Tasa de Mortalidad Materna Defunciones de maternas durante el
embarazo, parto y puerperio X 1000

Dra. Rosa Saeteros Hernández. M.Sc. 71


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

Nacimientos vivos

La Constante por la que se multiplican las tasas, no siempre son posibles y en la realidad
depende del tamaño de la población sobre la cual se analiza el riesgo, lo importante es
multiplicar por 10n .

Medidas de Resumen para Variables Cuantitativas.

“Las cifras descriptivas que se obtienen como función de una muestra, es decir, como función
de un conjunto de datos que representan una parte de un todo mayor , se llama estadígrafos o
estadísticos”9

Las variables cuantitativas se pueden resumir mediante dos tipos de medidas:

▪ Medidas de Tendencia Central.


▪ Medidas de Dispersión o Variación.

Medidas de Tendencia Central.

Son las que se definen o dan idea del comportamiento de un grupo mediante un número
central, alrededor del cuál se mueven todas las demás observaciones. Las medidas
fundamentales son:

“Entre los estadígrafos más importantes de tendencia Central, que deben su nombre al hecho
de que sus valores tienden a ocupar posiciones centrales o intermedias entre los valores menos
y mayor del conjunto de datos a partir del cuña se calculan” 9

▪ Media o Promedio Aritmético,


▪ Mediana y
▪ Modo o Moda.

Media Aritmética en Datos no Agrupados. (X) Llamada también promedio aritmético, es


la cifra que se obtiene al dividir la suma de todos los valores observados por el número de
observaciones. La fórmula quedaría de la siguiente forma:

X =  X 1 + X 2 + Xn En donde la media, es la suma de las observaciones (X1+ X2 +Xn )y,


n n es el número total de observaciones.

Un ejemplo Tenemos:

Si se tienen 5 adultos a los que se tomaron los latidos del corazón por minuto, cuyos
resultados fueron:

130,132,127,129,132 latidos por minuto.

El promedio en este caso se obtendrá de la siguiente forma:

Dra. Rosa Saeteros Hernández. M.Sc. 72


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

130 + 132 +127 +129 +132.


X= = 130 Latidos por minuto.
5
Es decir, los adultos tienen en promedio 130 latidos por minuto y si no existiera variación,
todos tendrían 130 latidos por minuto.

Una desventaja de utilizar la media aritmética es que está afectada por los valores extremos, y
los valores que se alejan mucho afectan el resultado, ya que estos valores extremos pueden
aumentar o disminuir el valor.

Un ejemplo para explicar con más detalle tenemos:

Si las notas de los estudiantes son: 10 , 10, 10, 10.5, y 20

10 + 10 + 10 + 10.5 + 20
X = = 12.1
5

Al obtener el promedio del valor de este producto vemos que el valor 12.1 se aleja, del valor
real ya que la mayoría de valores están alrededor del 10 y por la existencia de este valor
mayor 20, la media se aleja. Cuando esto ocurre es preferible utilizar la Mediana.
En conclusión tenemos que utilizar el promedio aritmético cuando la serie de datos es
simétrica, de lo contrario si esta serie es asimétrica se corre el riesgo que los extremos alejen
los datos de la medida central que se busca.

Media o Promedio Aritmético en Datos Agrupados.

Se aplica cuando hemos realizado una tabla de intervalos o clases, en este caso no se conoce
el valor real de cada observación, por lo tanto se utiliza como referencia el punto medio o
marca de clase de cada intervalo, es decir calculando un promedio con cada límite inferior y
superior de cada intervalo. Una vez que obtenemos la marca de clase se multiplican por las
frecuencias simples de cada intervalo. La suma total de estos valores se dividen para el
número total de frecuencias obteniendo el valor promedio.

La fórmula es:
En dónde:
f = Frecuencias simples absolutas.
fxmc
X = mc = Marca de Clase.
n n = Total de frecuencias.

Ejemplo:

TABLA No. 27
Peso en kilogramos

Dra. Rosa Saeteros Hernández. M.Sc. 73


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

Peso en Kilos f mc  f x mc
20 -24 4 22 88
25 - 29 8 27 216
30 - 34 9 32 288
35 - 39 10 37 370
40 - 44 7 42 294
45 - 49 6 47 282
50 - 54 6 52 312
TOTAL 50 1850

1850
X = = 37 Kilos.
50

El promedio de peso en este estudio de 37 Kilos.

“La media Aritmética es una de las medidas descriptivas más utilizadas, entre cuyas
propiedades más importantes sobresalen las siguientes:

1. Es fácil de comprender su significado, intuitivamente se interpreta como un promedio


2. Siempre existe y puede ser calculado para cualquier tipo de datos numéricos
3. Es siempre única, en otros términos, cada conjunto de datos tiene una y sólo una
media y
4. Cuando los datos son simétricos es una medida suficiente”9.

Mediana en Datos no Agrupados. (Me)

La mediana se define como el valor que divide al grupo de datos en dos partes iguales,
quiere decir que a partir de ese valor esta el 50% de los valores y antes esta el otro 50 % de
los valores. El valor encontrado representa el comportamiento de los valores, esta
comprobado que mientras más simétricos son los datos u observaciones, más se parecen la
media y la mediana. Estas dos medidas tienen la misma aplicación, sin embargo se utiliza la
mediana cuando los datos son asimétricos, es decir cuando la serie de datos se encuentren
afectados por los valores extremos como se explicó anteriormente.

Para calcular se siguen los siguientes pasos:

1. Ordenar los datos de forma ascendente o descendente.


2. Hallamos la posición de la mediana, esto en dependencia si los datos son pares o impares.

▪ Si el total de datos es impar la posición de la mediana es (n + 1) /2.

Así, si tenemos una distribución impar de 5 datos correspondientes a las edades de e


individuos: 16 10 15 19 21 .

En primer lugar ordenamos los datos en forma ascendente:

10 15 16 19 21

Dra. Rosa Saeteros Hernández. M.Sc. 74


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

Aplicamos la formula para hallar la posición de la mediana:

(n + 1) / 2 y obtenemos: (5 + 1) / 2 = 3 (Tercera Posición).

1 2 Posición 4 5

15 21 16
3 10 19

En este caso la mediana es 16, es decir que se puede analizar el comportamiento de estas
edades con este valor central, sin que los datos se vean afectados por los extremos.

▪ Si la serie es par, en la siguiente distribución correspondiente a las horas de


duración de internación en un hospital de 6 pacientes, como los datos ya están
ordenados:

8 11 13 15 17 25

Primera posición: n /2 y la segunda posición: (n + 2) / 2


En este caso: 6/2 (6 + 2) / 2
Primera posición: 3 y la segunda posición: 4

La posición de la mediana en este caso es la semisuma de las posiciones y divido para dos:

3 4
POSICIONES

8 11 13 15 17 25

(13 + 15)/ 2 = 14
Me =
14.
Mediana en Datos Agrupados.

Cuando los datos se encuentran agrupados en intervalos, la mediana no se puede localizar con
precisión, pero si el intervalo comparte en partes iguales a las frecuencias que en cada uno se
encuentran, es posible realizar un cálculo que permita una aproximación a la mediana.

El procedimiento a seguir es el siguiente:

1. La mediana en este caso está ubicada en la posición n/2, es decir el total de observaciones
dividido para 2. En el caso anterior de tabla tenemos:

Dra. Rosa Saeteros Hernández. M.Sc. 75


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

TABLA No. 27
Peso en Kilogramos
Peso en Kilos Frecuencia Frecuencia Acumulada
20 -24 4 4
25 - 29 8 12
30 - 34 9 21 25
35 - 39 10 31
40 - 44 7 38
45 - 49 6 44
50 - 54 6 50
TOTAL 50

n/2 = 50 / 2 = 25, es decir en el intervalo de 35 a 39 Kilos.

La fórmula que se puede utilizar es: Donde,


Li = Límite Inferior del intervalo que contiene la mediana.
n = Número total de observaciones.
Li + (n/2 - sfc) Ac Sfc= Suma de frecuencias acumuladas hasta el intervalo
Me = anterior que contiene la mediana.
f Me Ac = Amplitud del intervalo que contiene la mediana.
fMe = Frecuencia simple en el intervalo que contiene la
mediana.

En el ejemplo anterior Tenemos:

35 (50/2 - 21) 5
Me = = 37
10

En este caso el valor de la mediana es 37 Kilos, ubicando este valor en el intervalo de 35 a 39


Kilos.

Podemos decir que el promedio y la mediana tiene la misma aplicación, solamente que la
mediana se utiliza cuando existen valores extremos ya que su fórmula toma en cuenta a todos
los valores, pero no permite que los valores extremos se alejen de su valor real.

Moda en Datos no Agrupados. (Mo)

El valor modal es el que más se repite, este valor puede o no existir, o puede haber varias o
una, si hay dos valores que se repiten en iguales cantidades, entonces los 2 valores son las
clases modales.

En la siguiente serie de datos la moda sería:

Dra. Rosa Saeteros Hernández. M.Sc. 76


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

2 2 5 7 9 9 9 10 10 11 Mo = 9
3 5 8 10 12 16 No hay Moda.
2 3 4 4 4 5 5 7 7 7 8 Mo = 4 y 7

Moda en Datos Agrupados.

Para obtener el valor modal en tablas de intervalos o clases, debemos observar el intervalo
con mayor frecuencia, y de este el punto medio o marca de clase, al mismo número que se
puede considerar como la moda o valor modal.

En este ejemplo el valor modal sería:


TABLA No. 27
Peso en Kilogramos
Peso en Kg. Frecuencia Marca de clase
20 -24 4
25 - 29 8
30 - 34 9
35 - 39 10 (mayor) 37
40 - 44 7
45 - 49 6
50 - 54 6
TOTAL 50
En este caso la moda es 37.

Nota. Entre la Media, la Mediana y la Moda, la medida que más se utiliza es la media cuando
los datos son simétricos y no están afectados por valores extremos, de lo contrario es
preferible utilizar la mediana.

Medidas de Dispersión o Variación.

Estas medidas se utilizan ya que las medidas de tendencia central no son suficientes para
caracterizar y analizar un conjunto de datos, por ejemplo:

Si tenemos dos series de datos que a pesar de tener el mismo promedio, las dos varían en
forma diferente:

1 Serie: 42 44 46 48 50 Promedio X = 46
2 Serie: 6 26 46 66 86 Promedio X = 46

Por lo tanto es necesario tener una medida que indique cuanto se aleja un valor en relación al
valor central o como se distribuyen esos valores en relación a ese valor central, en este caso
el promedio o la mediana. En el segundo grupo de datos hay más dispersión que el primer
grupo, pues los datos están más alejados de su media aritmética.

“Las medidas de dispersión nos van a dar la idea sobre la representatividad de las medidas
centrales, a mayor dispersión menor representatividad” 10

Con tal fin las medidas más utilizadas son:

▪ La Desviación Estándar..

Dra. Rosa Saeteros Hernández. M.Sc. 77


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

▪ Varianza.
▪ Coeficiente de Variación.

La Desviación Estándar (S o ) para datos no agrupados.

Seguimos el siguiente procedimiento:

1. Averiguar el (X) Promedio Aritmético, por medio del procedimiento indicado, tomando
en cuenta si los datos son agrupados o sin agrupar.
2. Buscar la diferencia entre cada observación y el promedio aritmético. Es necesario poner
el signo + o - para distinguir entre quienes están por debajo o por encima del promedio, la
suma de esta columna es igual a 0.
3. Para evitar que la suma de esta columna sea 0, se eleva al cuadrado cada desviación y
estos cuadrados se totalizan.
4. Este total se divide por el número de observaciones. El resultado quiere decir que en
promedio este valor cuadrado difiere en unidades cuadradas del promedio general del
grupo.
5. Como a cada desviación la habíamos elevado al cuadrado y no tiene ningún significado
hablar en unidades cuadradas, con el fin de volver a las unidades primitivas, se extraerá la
raíz cuadrada, y este valor es la desviación estándar.

S = 2 ( X − X ) (n − 1)
2

En relación al denominador, cuando se trabaja con un número pequeño de individuos (menor


a 30) se divide para (n-1), caso contrario, ( mayor de 30 datos) se divide para n.

Ejemplo:

A continuación se presenta los datos sobre: días de Hospitalización en 7 pacientes con


Bronquitis crónica:
TABLA No. 28
Días de Hospitalización de pacientes
Días de No.
Hospitalización Pacientes (X – X) (X – X)2
1 1 1-7 =-6 36
2 1 2–7 =-5 25
3 1 3–7 =-4 16
7 1 7–7 = 0 0
11 1 11 – 7 = + 4 16
12 1 12 – 7 = + 5 25
13 1 13 – 7 = + 6 36
Total 7 154

S = 154 / 7 S = 4,7 días

X = (1+2+3+7+11+12+13) / 7 = 7

X = 7  5 días

Dra. Rosa Saeteros Hernández. M.Sc. 78


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

Quiere decir que en promedio cada paciente difiere en 5 días del promedio general del grupo
en este caso 7 días.

La Desviación Estándar para datos agrupados. (S o )

Cuando los datos están agrupados la fórmula es la siguiente:

 (mc )
. f −  (mc . f ) n
2 2

S=
n −1

En relación al denominador, cuando se trabaja con un número pequeño de individuos (menor


a 30) se divide para (n-1), caso contrario, ( mayor de 30 datos) se divide para n.

TABLA No. 29
Estatura de Estudiantes

ESTATURA (cm) f mc mc2 (mc2 . f ) (mc . f)


148 – 152 5 150 22500 112500 750
153 – 157 3 155 24025 72075 465
158 - 162 7 160 25600 179200 1120
163 - 167 5 165 27225 136125 825
168 - 172 5 170 28900 144500 850
173 - 177 1 175 30625 30625 175
TOTAL (n) 26 675025 4185

Aplicando la formula:

675025 − (4185 )
2

s= 26
26 − 1

S =  7,5

Varianza. (S2)

La varianza se expresa en unidades cuadradas de los datos originales, por o tanto se puede
utilizar la misma fórmula de la desviación estándar elevada al cuadrado.

 (mc . f ) −  (mc. f )
2 2

S2 = n
n −1

En relación al denominador, cuando se trabaja con un número pequeño de individuos (menor


a 30) se divide para (n-1), caso contrario, ( mayor de 30 datos) se divide para n.

Dra. Rosa Saeteros Hernández. M.Sc. 79


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

En el ejemplo anterior la Varianza sería:

675025 − (4185 )
2

S2 = 26
26 − 1

S2 = 56

Coeficiente de Variación.

La desviación estándar es útil como medida de dispersión o variación dentro de un conjunto


dado de datos. Sin embargo cuando se desea comparar la dispersión en dos conjuntos de
datos, comparar las desviaciones estándar puede conducir a resultados ilógicos. Pueden ser
que las dos variables que intervienen se midan en unidades diferente. Por ejemplo, es posible
que se desee saber , para cierta población, si los niveles de colesterol en sangre de cierta
población, si los niveles de colesterol en sangre medidos en mg por 1oo ml, son más variables
que el peso del cuerpo, medido en Kilogramos.

Es más aunque se use la misma unidad de medición, las dos medidas pueden ser bastante
diferentes. Si se compara la desviación estándar de los pesos de los jóvenes de primer año de
secundaria, es posible que se encuentre que la desviación estándar de estos últimos es
numéricamente mayor que la de los primeros, porque los propios pesos son mayores, no
porque la dispersión sea mayor. Lo que se necesita en situaciones como esta es una medida de
variación relativa, en lugar de una de variación absoluta. Esa medida se encuentra en el
coeficiente de variación, el cuál expresa a la desviación estándar como un porciento de la
media. La fórmula esta dada por:

S
C.V . = .100
X

Se ve como la media y la desviación estándar se expresan en la misma unidad de medición,


esta unidad se cancela al calcular el coeficiente de variación. Entonces, lo que se tiene es una
mediad que es independiente de la unidad de medición.

Supóngase que dos grupos de personas del sexo masculino proporcionan los resultados
siguientes:

Grupo 1 Grupo2
Edad 25 años 11 años
Peso Medio 72,5 Kg 40 Kg
Desviación Estándar 5 Kg 5 Kg

Una comparación de las desviaciones estándar podría conducir a la conclusión de que los dos
grupos poseen igual variabilidad. Sin embargo, si se calculan los coeficientes de variación,
para los de veinticinco años de edad se tiene:

C.V. = (5/72,5) * 100 = 6,9

Y para los de 11 años de edad

Dra. Rosa Saeteros Hernández. M.Sc. 80


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

C.V. = (5/40) * 100 = 12,5

Es decir que en el grupo de once años hay más variabilidad.

EJERCICIO INTEGRADOR VII.

Medidas de resumen para variables cualitativas

1. Con los datos del último censo de población y de vivienda calcular y analizar:

▪ 10 Índices
▪ 10 razones
▪ 10 Proporciones

2. Obtenga los datos que le permitan obtener las diferentes tipos de tasas, en el Ecuador y la
provincia de Chimborazo.

Medidas de resumen para variables cuantitativas

3. Se quieren compara la variación de los datos de dos variables peso y talla que se estudiaron
en el mismo grupo de individuos. Diga en que variable existe mayor variación.

Edad Talla
Peso Medio 52.1 Kg 152.3 cm
Desviación Estándar 3.5 Kg 3.5 cm
4. En un grupo homogéneos de 1000 pacientes se miden factores biológicos que tienen como
media 10 mm y en el otro la media es 1000 leucocitos y las varianzas de esos factores son: 4
mm2 y 4000 leucocotos2 ¿Cuál de las dos distribuciones estaría más concentrada?

5. Se tienen dos grupos de pacientes a los cuales se les ha medido su capacidad pulmonar vital
en litros de aire.

Grupo 1 = 3,5,4,3,4,5, Grupo 2 = 4,4,3,3,3,5,5


a) Calcular media, varianza, desviación estándar y coeficiente de variación en cada
grupo.
b) Qué puede decir respecto al promedio y la variabilidad en ambos grupos.

6. Los siguientes datos agrupados en intervalos corresponden a un estudio de los


conocimientos, opiniones u prácticas de sexo seguro, realizado en jóvenes universitarios.

TABLA No. 30
DISTRIBUCIÓN DE LA MUESTRA, SEGÚN EDAD Y SEXO. ESPOCH. 2002
SEXO
MASCULINO FEMENINO TOTAL*
EDAD
No. % No. % No. %
17 – 21 89 46.84 101 53.16 190 52.3
22 – 26 93 60.39 61 39.61 154 44.4

Dra. Rosa Saeteros Hernández. M.Sc. 81


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

27 – 31 11 68.75 5 31.25 16 4.4


32 –36 3 100.00 0 0.00 3 0.8
TOTAL* 196 54.0 167 46.0 363 100
FUENTE: Encuesta de comportamientos, conocimientos, opiniones y predisposiciones en sexualidad . ESPOCH 2002
*Los porcentajes totales están calculas en relación al total general.

a) Media en Hombres, mujeres y el total de la población


b) Mediana en Hombres mujeres y el total de la población
c) Moda en Hombres, mujeres y el total de la población
d) Desviación Estándar en Hombres, mujeres y el total de la población
e) Varianza en Hombres, mujeres y el total de la población
f) Coeficiente de Variación en Hombres y Mujeres y en el total de la población. Diga en
cuál existe mayor variabilidad de la edad.

“Aunque los hombres carecemos de misión trascendental sobre la tierra, en cuya


superficie vivimos tan naturalmente como la rosa y el gusano, nuestra vida no es
digna de ser vivida, sino cuando la ennoblece algún ideal: los mas altos placeres sin
inherentes a proponerse una perfección y perseguirla”
José Ingenieros

CAPITULO VIII
CALCULO DE PROBABILIDADES

OBJETIVO

• Calcular e interpretar las áreas por debajo de la curva normal

CONTENIDOS

▪ Probabilidad
• Utilización de la desviación estándar (Distribución Normal)
• Cálculo de las áreas por debajo de la curva normal
• Calculo de la distribución normal o típica

Probabilidad

“El término probabilidad se emplea muy a menudo en conversaciones corrientes. Al describir


un suceso como probable, damos a entender que es posible, o que es de esperarse o que es
seguro. Sin embargo, hay una diferencia entre las afirmaciones: Probablemente lloverá

Dra. Rosa Saeteros Hernández. M.Sc. 82


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

mañana y la probabilidad de que llueva mañana es 0.50. En estadística se intenta expresar la


probabilidad en términos cuantitativos precisos, la base para esta expresión cuantitativa
puede ser una parte inherente de la situación, como ocurre con una moneda. En ese caso , se
denomina probabilidad a priori: es decir, establecida antes de que el hecho ocurra. También
podemos formular un enunciado cuantitativo completamente basado en la experiencia pasada;
en este caso tratamos de una probabilidad empírica. Un enunciado probabilístico puede
predecir todos los casos desde la certeza de que el suceso ocurrirá hasta la certeza de que no
ocurrirá. Si es seguro que ocurra equivale a 1, si no existe la posibilidad alguna de que ocurra,
la probabilidad es 0, por lo tanto, abarcan de 0 a 1 y se expresan como fracciones o
decimales”5.

Utilización de la desviación estándar (Distribución Normal)

Se ha dicho que la desviación estándar indica en que forma se distribuyen las desviaciones
alrededor del valor central en este caso el promedio aritmético. Su utilidad se debe a que la
desviación estándar junto con el promedio ayudan a determinar los límites dentro de los
cuáles se encuentran las observaciones que se estudian. La interpretación se basa
principalmente en las propiedades de la llamada CURVA NORMAL O CAMPANA DE
GAUSS. Esta es una curva en forma de campana, perfectamente simétrica, de tal manera que
una perpendicular que pase por el vértice lo divide en 2 mitades exactamente iguales, la
misma que representa el promedio aritmético.

Así cuando trabajamos con variables cuantitativas, como regla general decimos que los
resultados dados por el azar siguen una curva normal. Se ha visto además que todas las
constantes fisiológicas de los individuos (peso, estatura, presión arterial, etc) y en general
características de la población, se distribuyen formando una curva normal.

Distribución Normal

 - -3 -2 -1  +1 +2 +3 + 


68

95

99

Características de la curva normal:

Dra. Rosa Saeteros Hernández. M.Sc. 83


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

1. Es simétrica con respecto a la media, una perpendicular divide a la misma en dos


partes completamente iguales y por allí pasa la media, la mediana y la moda cuando
son iguales.
2. Es asintótica, su cola se extiende del más infinito al menos infinito.
3. El gráfico de una variable continua asemeja a una campana.
4. La distribución queda determinada por la media en el eje horizontal y las desviaciones
estándar por la dispersión de los datos con respecto a la media.
5. El área por debajo de la curva es igual a 1 ya que representa el 100% de los datos,
tiene un valor de 0,5 a cada lado.
6. En los puntos de inflexión se pueden trazar perpendiculares estas representan a las
desviaciones estándar, matemáticamente se ha demostrado lo siguiente:

▪ Entre el promedio y + - una desviación estándar se encuentra el 68% del área


de la curva.
▪ Entre el promedio y + - dos desviaciones estándar se encuentra el 95% del
área de la curva.
▪ Entre el promedio y + - tres desviaciones estándar se encuentra el 99,7% del
área de la curva.

7. Las diferencias que se encuentran en cada área se conoce con el nombre de margen de
error aceptable o zona de rechazo de las hipótesis.

▪ 68% probabilidad 0.32


▪ 95% probabilidad 0.05
▪ 99 % probabilidad 0.01

Cálculo de las áreas por debajo de la curva normal

Para el cálculo de las áreas por debajo de la curva norma, utilizamos la tabla de valores z o de
la distribución normal (Anexo No. 1), en la misma se encuentran determinados todas las
áreas posibles por debajo de la curva norma. Con esta tabla podemos determinar la
probabilidad de que una variable tome diferentes valores .

Por ejemplo:
Dada la distribución normal , encontrar los siguientes valores por debajo de la curva normal:

1. El área bajo la curva entre z = 0 y z = 1.43

Observamos el valor de 1.43 en la tabla de


valores z y encontramos que la
probabilidad o el área debajo de la curva es
igual a 0.4236 que equivale al 42%

0 1.43

Dra. Rosa Saeteros Hernández. M.Sc. 84


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

2. La probabilidad de que una z elegida al azar tenga un valor menor entre z = 2.87

0.50 0,50 + 0.4987 = 0,99 0 99%

2.87

En la tabla z, es igual 0.4987


.

Calculo de la distribución normal o típica (Función de densidad)

La probabilidad de los valores que se representan en el eje x en una gráfica en la distribución


normal se conocen como valores z, y estos valores están dados por el área debajo de la curva,
la misma que se calcula mediante la función de densidad:

X−X
Z=
S

Ejemplo. Un fisioterapeuta nota que las calificaciones que se obtienen de cierta prueba
habitual manual, están distribuidas de forma normal, con una media de 10 y una desviación
estándar de 2.5, si un individuo elegido al azar realiza la prueba ¿Cuál es la probabilidad de
que obtenga una calificación de mas de 15?

X = > 15
X = 10
S = 2.5

15 − 10
Z= Z = 2, esto quiere decir valores de z > 2.
2.5

Observando este valor en la tabla de valores Z (Anexo No. 2) equivale a una probabilidad de
0.4772.
0.50 0.5 – 0.4772 = 0,0228.

La probabilidad de que un individuo al


azar que lleve a cabo una prueba obtenga
una calificación de 15 o más es de 0.0228 o
el 2.28%.

Z = >2

En este sentido se puede obtener cualquier valor por debajo de la curva normal

Dra. Rosa Saeteros Hernández. M.Sc. 85


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

EJERCICIO INTEGRADOR VIII

1. Hallar las siguientes áreas por debajo de la curva normal.

1. La probabilidad de que z  0.55


2. La probabilidad de que z  - 0.55
3. La probabilidad de que z < -2.33
4. La probabilidad de que z > 2.33
5. La probabilidad de que z1 > 1,96 y z2 < 1.96
6. La probabilidad de que z1 > 1,96 y z2 < 1.96
7. La probabilidad de que z1 < -0.77 y z2 > 0.23

2. Supóngase que las edades en las que se adquiere cierta enfermedad están distribuidas en
forma aproximadamente normal con una media de 11.5 años y una desviación estándar de 3.
un niño acaba de contraer esta enfermedad ¿Cuál es la probabilidad de que el niño tenga entre
8.5 y 14.4 años?

3. La estatura de un ecuatoriano adulto es una variable que se distribuye en forma normal con
una media de 1.70 centímetros y varianza 0.09, que probabilidad hay de que un ecuatoriano
elegido al azar mida:
a. más de 1.73
b. entre 1.70 y 1.79
c. menos de 1.64
d. menos de 1.10

“Nunca se le esclaviza al hombre moralmente superior”


José Ingenieros
CAPITULO IX
INFERENCIA ESTADÍSTICA
ESTIMACIÓN DE PARÁMETROS
OBJETIVOS

• Identificar los principios de la inferencia estadística


• Calcular e interpretar los intervalos de confianza
• Determinar los tipos de hipótesis estadística

CONTENIDOS

• Parámetros
• Limites de Confianza para el promedio y porcentaje
• Valores Críticos de z (mayores de 30 datos) y t (menores a 30 datos)

“El objetivo de la mayoría de las investigaciones científicas es hacer afirmaciones generales


basadas en observaciones relativamente limitadas y específicas. Esencialmente , los métodos
de la inferencia estadística capacitan al experimentador para hacer afirmaciones limitadas
respecto a cierta característica de una población, basándose en datos obtenidos de sólo una

Dra. Rosa Saeteros Hernández. M.Sc. 86


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

parte de esa población. Desde un punto de vista práctico una población es generalmente un
grupo tan grande que impide hacer observaciones directas. En su lugar, las observaciones se
hacen en un segmento pequeño de la población. Este pequeño segmento se denomina muestra
y las conclusiones o estimaciones respecto a la población se derivan de las observaciones de
la muestra” 5.

La inferencia estadística consiste en aquellos métodos en donde se hace inferencias o


generalizaciones acerca de una población, a partir de los datos de una muestra. La inferencia
puede dividirse en la estimación de parámetros y las pruebas de hipótesis.

Para entender la primer área que trataremos en este capítulo pongamos un ejemplo:

Estimación de Parámetros

Parámetros

Son todas aquellas medidas que describen numéricamente la característica de una población,
se denominan también valores verdaderos, o límites de confianza.

Supongamos que se realiza una investigación en una muestra de estudiantes para determinar
la estatura promedio de 20.000 estudiantes que representan determinado universo, al realizar
el estudio se toma la estatura de 400 estudiantes que representan la muestra de estudio, los
resultados que se obtengan de estos datos únicamente sirven para caracterizar a la muestra
de 400 estudiantes, al obtener los límites de confianza se puede utilizar este rango para inferir
los resultados al universo de estudio..

Límites de Confianza para el promedio y porcentaje

Se utilizan para cuando en una investigación se ha trabajado utilizando una muestra y


mediante los límites de confianza determinar los límites verdaderos en los cuáles se
encuentra el promedio o porcentaje de un universo.

Para esto es necesario calcular el error estándar en dependencia de la medida que se


esté utilizando, así tenemos:

Error estándar del promedio:


S = desviación estándar
SX = S / n = SX = S / n n = total de individuos

Y, el error estándar del porcentaje

S% = p*q/ n

En donde:

p = proporción de individuos con la característica ( características conocida)


q = proporción de individuos sin la característica

Dra. Rosa Saeteros Hernández. M.Sc. 87


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

q=1 -p

Luego de hallar el error estándar es necesario encontrar los valores críticos o niveles de
significancia que se utilizarán para determinar los límites de confianza, los valores de
confiabilidad más utilizados son los que se obtienen con un nivel del 95% y 99% de
confiabilidad , debiendo para esto obtener los valores críticos que ya están determinados , en
este sentido existen tablas de resumen de los valores críticos, sin embargo es importante
determinarlos de la siguiente forma tomando en cuanta estas situaciones:

Cuando se conoce la S Cuando no se conoce la S


Tamaño de la muestra n>30 datosDistribución Normal tabla z
z
Tamaño de la muestra n  30 y Distribución Normal tabla t
suponiendo que la población se z
distribuye de forma normal.

Cuando la muestra es grande, es decir si n es mayor que 30 datos, se utilizan los valores
críticos de la tabla z, y entonces el estadígrafo para los límites de confianza quedan
determinados de la siguiente forma:

X  Z ( / 2)Sx

%  Z ( / 2)S %

Valores Críticos de Z n > 30 datos

ERROR EN 1 Y 2 COLAS CONFIABILIDAD VALOR CRITICO


/2 95 % (0.05) 1.96
/2 99 % (0.01) 2.57
 /1 95 % (0.05) 1.64
 /1 99 % (0.01) 2.33

Y, cuando la muestra es pequeña, es decir n es menor a 30 datos, los valores críticos que se
utilizan son los de la tabla t y entonces el estadígrafo para los límites de confianza quedan
determinados de la siguiente forma:

X  t ( / 2)Sx
%  t ( / 2)S %
Valores Críticos de t (n  30)

ERROR EN 1 Y 2 COLAS CONFIABILIDAD VALOR CRITICO


/2 95 % (0.05) t
975 gl
/2 99 % (0.01) t
995 gl
 /1 95 % (0.05) t
95 gl
 /1 99 % (0.01) t
99 gl

Dra. Rosa Saeteros Hernández. M.Sc. 88


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

gl = grados de libertad (n – 1)

Grados de Libertad

“La distribución t de student esta relacionada con el concepto de grados de libertad. Para
expresarlo en forma significada, los grados de libertad asociados a una distribución están
determinados por el número de variables o datos que pueden estar contenidas en una
distribución, es decir que esta asociado al tamaño de la muestra ; es decir mientras más grande
sea la muestra, más grados de libertad habrá” 5

Ejemplo 1. Límites de confianza para el promedio


A nueve paciente que sufren de la misma incapacidad física se les pidió que llevaran a cabo
cierta tarea como parte de un experimento. El tiempo promedio requerido para realizar la tarea
fue de 7 minutos con una desviación estándar de 2 minutos. Construir los intervalos de
confianza al 95% de confiabilidad para el tiempo medio verdadero requerido para realizar la
tarea en este tipo de pacientes
Datos SX = S / n
n=9 SX = 2 / 7
X = 7 minutos SX = 0,66
S = 2 minutos
Valor de t 95%  / 2 gl (n- 1) = 8 = 2,306
X  t ( / 2)Sx
7  2,306 * 0,66
7 + 1,24 = 8,24
7 – 1,24 = 5,76
Con un 95% de confiabilidad el tiempo medio requerido para realizar la tarea esta entre el
intervalo 5,46 y 8,54 minutos.
Ejemplo 2: Límites de confianza para los porcentajes

Con el objetivo de estimar el porciento de la población inmunizada contra la polio se


seleccionó una muestra representativa de 120 personas y se encuentra que 75 habían sido
vacunados ¿Halle la estimación por intervalo al 95% de confiabilidad?

Datos
n = 120
75 vacunados ( 62%)
p = 0,62
q = 1 – 0,62
q = 0,38

%  z( / 2)S % S% = p*q/ n S % = 0.62 * 0.38 / 120 S% = 0,044


62 1,96.0,044

53 % y 71%

Con el 95% de confiabilidad la población vacunada esta entre 71% y 53%.

EJERCICIO INTEGRADOR IX

Dra. Rosa Saeteros Hernández. M.Sc. 89


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

1. En una muestra de 25 niños de 10 años tuvieron un peso medio y una desviación estándar
de 36,5 Kg y 5 Kg respectivamente. ¿Encontrar los intervalos de confianza al 90, 95 y 99% de
la población?

2. En un pezquisaje de estomatitis subprotesis en un grupo de portadores de prótesis


estomatológicas se seleccionó una muestra de 50 portadores y se encontró que 25 tenía la
enfermedad. Estime el intervalo de confianza al 99%, para la proporción de enfermos entre
los portadores de prótesis.

"El hombre que hace que las cosas difíciles parezcan fáciles, es el educador".
Emerson, Ralph Waldo

CAPITULO X
PRUEBAS DE HIPÓTESIS
OBJETIVOS
• Calcular e interpretar la prueba de hipótesis

CONTENIDOS

• Hipótesis
• Prueba z
• Comparación de una media de la muestra con una media de la población

“Otro tipo de inferencia estadística son las pruebas de hipótesis. El propósito de las pruebas
de hipótesis es ayudar a tomar una decisión en torno a una población, examinando una
muestra de ella. Una hipótesis se define como una afirmación acerca de una o más
poblaciones. 2”

Una Hipótesis es una proposición la cuál requiere una toma de decisión para aceptar o
rechazar la proporción sobre un parámetro (valor numérico de una población). La proposición
se llama hipótesis y la toma de decisión se conoce con el nombre de prueba de hipótesis.

Ejemplo de Prueba de Hipótesis

Dra. Rosa Saeteros Hernández. M.Sc. 90


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

Un profesional en Promoción de Salud, está interesado en probar una técnica de relajación


que sea efectivo para controlar el estrés en trabajadores de una industria, utiliza dos técnicas
A y B; si se plantea la hipótesis de que la técnica A es mejor y más efectiva que la técnica B,
entonces mediante la aplicación de una prueba de hipótesis estadística se quiere comprobar y
tomar una decisión correcta acerca de la hipótesis planteada. De la misma manera las pruebas
de hipótesis requieren trabajar con distribuciones muéstrales.

Hipótesis Estadística es un supuesto o conjetura que concierne a una o más poblaciones.


Existen dos tipos de Hipótesis: Hipótesis Nula e Hipótesis Alternativa.

Hipótesis Nula (Ho). Platea la igualdad. Las dos técnicas no son diferentes. Es decir que el
puntaje del promedio de la técnica A es igual al puntaje del promedio de la técnica B.

En el ejemplo anterior la Ho: platearía que la técnica de control del estrés A es igual a la
técnica de control del estrés B. No hay diferencias estadísticamente significativas

O simplemente: Ho: A = B

Hipótesis Alternativa. (H1) . Plantea la diferencia y establece que las dos técnicas son
diferentes. Es decir que el puntaje del promedio de la técnica A es diferente al puntaje del
promedio de la técnica B.

En el ejemplo anterior la H1: podría plantear lo siguiente:

1. En primer lugar plantearía que si existen diferencias entre la técnica A y B,


planteándose una hipótesis bilateral o de dos colas.
2. A parte que podría probarse que la técnica A es mejor que la B. Definiendo una
hipótesis bilateral de una sola cola a la derecha
3. La técnica B es mejor que la A. Definiendo una hipótesis bilateral de una sola cola a la
izquierda.

O simplemente:

H1: A  B (Error repartido en las dos colas)


H1: A > B (Error repartido en una cola a la derecha)
H1: B > A (Error repartido en una cola a la izquierda)

Una hipótesis nula se plantea con la posibilidad de rechazarla.

Al aprobar cualquier hipótesis estadística hay cuatro situaciones que determinan si la decisión
final es correcta o incorrecta. Lo podemos resumir en la siguiente tabla:

DECISIÓN Ho: es Verdadera Ho: es Falsa


Aceptar Ho: No hay error Error Tipo II
Rechazar Ho: Error Tipo I No hay error

Pasos a Tomar en cuenta para el planteamiento de una hipótesis

Dra. Rosa Saeteros Hernández. M.Sc. 91


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

1. Plantear las hipótesis y decidir si es de dos colas o de una cola tomando en cuanta para
esto a la H1.
2. Selección de un nivel de significancia, los más utilizados al 95 o 99% de confiabilidad
es decir con un error de 0,05 o 0,01, respectivamente.
3. Se decide que distribución es la apropiada si t o z, y se escoge el estadígrafo de
acuerdo a la siguiente tabla:

Cuando se conoce la S Cuando no se conoce la S


Tamaño de la muestra n>30 datos Distribución Normal tabla z
z
Tamaño de la muestra n  30 y Distribución Normal tabla t
suponiendo que la población se z
distribuye de forma normal.

4. Aplicación del estadístico y comparación de los valores calculados con los valores
críticos observados en la tabla de valores z o t respectivamente. También se puede
realizar una gráfica y observar las zonas de rechazo o aceptación y en base a esto
tomar una decisión de que hipótesis es la que se va a aceptar. Y aplico la siguiente
regla de decisión:

Si los valores del estadígrafo calculado (Zc o tc) son mayores al valor del estadígrafo de la
tabla (Zt o Tt) Entonces rechazo la Ho y acepto la hipótesis alternativa.

PRUEBA Z (distribución Normal) n > 30 datos no se conoce la S

Estadígrafo:

Promedios Proporciones
P+q=1
X−X X − n* p q = 1 -p
Zc = Zc =
S n* p*q

Veamos un ejemplo:

Un profesional de la salud, sostiene que su programa de control del parto sin dolor tiene un
80% de efectividad, en una muestra de 300 mujeres parturientas, el programa controló el
dolora 220 personas ¿Determinar si la afirmación del educador es cierta al 95% de
confiabilidad?

1. Planteo las Hipótesis:

Ho: p = 0,80 La efectividad de la medicina es igual a 80%


H1: p < 0,80 La efectividad de la medicina es menor al 80%

2. Obtengo el valor de Z calculada

Dra. Rosa Saeteros Hernández. M.Sc. 92


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

Datos:
n = 300
p = 0,80 (80%)
q=1–p
q = 0,20

220 − (300 * 0.80 )


Zc =
300 * 0,80 * 0,20

Zc = -2,88

3. Obtengo el valor de Z tabulada al 95% de confiabilidad y el error repartido en una cola a la


izquierda.

El valor crítico de Z al 95% de confiabilidad es igual a 1,64

Zc = 2,88 > Zt = 1,64 ( en la comparación no se toma en cuenta el signo)

Rechazo la Ho y acepto la hipótesis alternativa

Con un 95% de confiabilidad se puede decir que la afirmación del Educador para la Salud no
es verdadera.

Si obtenemos los límites de confianza o los valores verdaderos tenemos:


X  z( / 2)Sx SX = 6.93 / 300 SX = 0,40

240  1.96 * 0.40

239. 3 y 240.78

Con un 95% de confiabilidad podemos decir los verdaderos valores se encuentran entre 239.3
y 240.78

Comparación de una media de la muestra con la media de la población

Consideremos el siguiente problema: Al investigar el número de pulsaciones por minuto en


un grupo de hombres, presumiblemente sanos, se llegó a la conclusión de que se podría
considerar la distribución de esta variable como normal. Los resultados de esta prueba fueron:
el promedio observado en 16 individuos de la muestra 74 puls/min y una desviación estándar
del número de pulsaciones es de 9, si se desea saber con un nivel de significancia del 95 % si
el valor de 70 puls/min se considera normal

1. Las hipótesis quedaría planteadas de la siguiente forma:

Dra. Rosa Saeteros Hernández. M.Sc. 93


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

Ho:  = X
Ho. La media de pulsaciones en la muestra, es igual al promedio considerado normal en la
población.

H1:   X
H1:  > X
H1:  < X

En este ejemplo:
H1: La media de pulsaciones por minuto en la muestra son mayores a la media considerada
normal en la población

Para comprobar la hipótesis debemos hacerlo utilizando la prueba de valores Z para compara
la media de la muestra con la media de la población:

X − S
Zc = SX =
SX n

Datos:
n= 16
= 70 puls/min
X = 74 puls/min
S= 9

S X −
SX = Zc =
n SX

9 74 − 70
SX = = 2,25 Zc = = 1,77
16 2.25

Luego Obtenemos el valor de Zt al 95 % de confiabilidad, es igual a 1,96

Aplicamos la regla de decisión:

Zc = 1,77 < Zt = 1,96

Acepto la Ho de que la media de la muestra es igual a la media de la población.

Si vemos los intervalos de confianza

X = 74 puls/min
9
X  t ( / 2)Sx SX = = 2,25
16
74  2,131* 2,25 El valor de t  / 2 al 95 % de confiabilidad gl = 15; 2,131

Con un 95% de confiabilidad los valores verdaderos del promedio se encuentran entre 69,5 y
78,5

Dra. Rosa Saeteros Hernández. M.Sc. 94


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

De acuerdo con la regla de decisión planteada en el epígrafe anterior, como  = 70 puls/min y


esta pertenece al intervalo o se encuentra dentro de el; entonces existe diferencias
significativas y por lo tanto aceptamos como válida a Ho y planteamos que dicho grupo de
pacientes puede considerarse como que proviene de una población de pacientes
presumiblemente sanos con 70 puls/min como promedio.

EJERCICIO INTEGRADO IX

1. Después de un programa de enseñanza sobre métodos de planificación familiar con


duración de una semana en un Centro de Salud . 16 pacientes obtuvieron una
calificación media de 74 en una prueba llevada a cabo como parte de la evaluación
del programa, La desviación estándar muestral fue de 12. ¿Puede concluirse a partir de
estos datos que la media de la población es mayor que 70 al 95% de confiabilidad?

2. Una muestra de 1500 residentes de un barrio interior de la ciudad, quienes participaron


en un programa de salud, 125 pruebas proporcionaron resultados positivos en cuanto a
la anemia. ¿Proporcionan estos datos evidencia suficiente que indique que la
proporción de individuos con dicha enfermedad en la población muestreada es mayor
que 0.60 con unn95% de confiabilidad.

3. Un profesional de promoción de salud, afirma que su programa Educativo para


mejorar las prácticas de Higiene Personal tiene una efectividad del 60%, en una
muestra de 80 individuos que recibieron el programa mejorarón 65 personas.
¿Determinar si la afirmación es cierta al 99% de confiabilidad?

“No hay daño tan grande como el del tiempo perdido”


Miguel Ángel Boonarroti

CAPITULO XI
PRUEBAS PARAMÉTRICAS
OBEJTIVOS
• Calcular e interpretar pruebas estadísticas para muestras pequeñas
• Calcular e interpretar pruebas de hipótesis para comparar dos muestras.

CONTENIDOS

• Prueba “t” de student.


• Prueba “t” de student para muestras pequeñas (< 30 datos)
• Prueba “t” de student para dos muestras independientes con varianzas no
homogéneas.
• Prueba “t” de student para datos relacionados (muestras dependientes)
• Prueba “t” de student para datos pareados

Prueba “t” de student

Probablemente el primer análisis estadístico que uno realiza es la comparación de dos medias.
Esta situación se plantea cuando se están comparando dos grupos (normalmente dos

Dra. Rosa Saeteros Hernández. M.Sc. 95


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

tratamientos o intervenciones) con relación a una variable de eficacia cuantitativa. La prueba


de elección es la t de Student. Su cálculo no tiene mayor dificultad.

La prueba t de Student como todos los estadísticos de contraste se basa en el cálculo de


estadísticos descriptivos previos: el número de observaciones, la media y la desviación típica
en cada grupo. A través de estos estadísticos previos se calcula el estadístico de contraste
experimental. Con la ayuda de unas tablas se obtiene a partir de dicho estadístico el p-valor.

Si p<0,05 se concluye que hay diferencia entre los dos tratamientos.

Las hipótesis o asunciones para poder aplicar la t de Student son que en cada grupo la
variable estudiada siga una distribución Normal y que la dispersión en ambos grupos
sea homogénea. Si no se verifica que se cumplen estas asunciones los resultados de la prueba
t de Student no tienen ninguna validez.

Por otra parte no es obligatorio que los tamaños de los grupos sean iguales, ni tampoco es
necesario conocer la dispersión de los dos grupos.

Prueba t de student para muestras


pequeñas (< de 30 datos)

RESUMEN DE FÓRMULAS

Estadístico para probar hipótesis acerca de la media de una población, con muestras pequeñas.

t calculada

Ecuación ejercicio No.1

t tabulada:

n – 1 grados de libertad y observamos los valores críticos en la tabla t (Anexo No. 2)

90% confiabilidad t 0,95

95% de confiabilidad t 975

99% de confiabilidad t 995

En los dos casos se plantean dos hipótesis:

Ho = 1 = 2

H1 = 1  2 (t dos colas) bilateral

1 < 2 (t una cola) unilateral

Dra. Rosa Saeteros Hernández. M.Sc. 96


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

1 > 2 (t 1 cola) unilateral

Regla de decisión:

tc > tt Rechazo la Ho y acepto la H1

Estadístico para probar hipótesis acerca de las medias de dos poblaciones, con muestras
pequeñas y con varianzas desconocidas:

Ecuación Ejercicio No. 2

Ecuación Ejercicio No. .2

t tabulada:

(n1 + n2 – 2 grados de libertad) y observamos los valores críticos en la tabla t (Anexo No. 3)

90% confiabilidad t 0,95

95% de confiabilidad t 975

99% de confiabilidad t 995

En los dos casos se plantean dos hipótesis:

Ho = 1 = 2

H1 = 1  2 (t dos colas) bilateral

1 < 2 (t una cola) unilateral

1 > 2 (t 1 cola) unilateral

Regla de decisión:

tc > tt Rechazo la Ho y acepto la H1

Ejemplo:

Dra. Rosa Saeteros Hernández. M.Sc. 97


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

Una prueba fue diseñada para estimar la efectividad de un programa dirigido a preparar a
futuras madres en el cuidado de sus bebes, se encontró que en el grupo 1 (atendidas) habían
asistido a las sesiones sobre cuidados prenatales impartidas en el departamento de Educación
para la Salud. El grupo 2 (no atendidas), no asistió a las mencionadas sesiones. Los datos son
los siguientes:

GRUPO 1 (Atendidas) GRUPO 2 (No Atendidas)


n1 = 32 n2 = 40
1 = 4.75 2 = 3.0
1 = 1.0 1 = 1.5

¿Proporcionan estos datos evidencias suficientes que indiquen que quienes fueron atendidas
en promedio obtuvieron mayores calificaciones que quienes no fueron atendidas?

Planteamos las Hipótesis:


Ho = Los promedios son iguales en los dos grupos
H1 = El promedio en los dos grupos es diferente (bilateral), el promedio en el grupo de
mujeres atendidas es mayor al promedio de las mujeres no atendidas.

(31) (1.0)2 + (39) (1.5)2


2
sp =
32 + 40 – 2

sp2 = 1.302

4.75 − 3.0
t= tc = 5.66
1 1
1.30 +
32 40

tt = (n1 + n2 – 2 grados de libertad) 32 + 40 –2 = 70

Observamos en la tabla (ANEXO No. 3) gados de libertad 70 y no se encuentra pero


podemos ver el valor de 60 gl al 95% de confiabilidad y es igual a 1.671, mediante una regla
de tres podemos calcular el valor de 70 gl.
60 1.67 1
70 X = tt = 1.9495

Aplicamos la regla de decisión:

Dra. Rosa Saeteros Hernández. M.Sc. 98


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

tc = 5.66 > tt = 1.9495 Rechazo la Ho y acepto la H1.

Con un 95% de confiabilidad que quienes fueron atendidas obtuvieron mayores


calificaciones que las que no fueron atendidas.

Prueba T de Student-Welch para dos muestras independientes con varianzas no


homogéneas

Esta prueba estadística es de utilidad para contrastar hipótesis en función de la media


aritmética, pero dada la heterogeneidad de las varianzas, no es aplicable la prueba t de
Student.

En este modelo estadístico, el agregado de Welch consiste en una ecuación para calcular los
grados de libertad, de manera que disminuye el error por la no homogeneidad de las
varianzas. Por otra parte, existe una modificación de la ecuación original de la
correspondiente t de Student, que es la siguiente:

Donde:
t = estadístico equivalente a t de Student.
1 = media aritmética del grupo 1.
2 = media aritmética del grupo 2.
σ21 = varianza del grupo 1.
σ 22 = varianza del grupo 2.
n1 = tamaño de la muestra del grupo 1.
n2 = tamaño de la muestra del grupo 2.

El cálculo de los grados de libertad se realiza con la fórmula siguiente:

Donde:
σ 21 = varianza del grupo 1.
σ 22 = varianza del grupo 2.
n1 = tamaño de la muestra del grupo 1.
n2 = tamaño de la muestra del grupo 2.

Pasos:

1. Determinar el promedio, la varianza y el tamaño de la muestra de cada población en el


estudio.
2. Aplicar la ecuación t.
3. Calcular los grados de libertad (gl) de acuerdo con la ecuación dada.
4. Comparar el valor de t calculado respecto a los grados de libertad con los valores de t
críticos.
5. Decidir si se acepta o rechaza la hipótesis.

Ejemplo:

Dra. Rosa Saeteros Hernández. M.Sc. 99


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

Un investigador realiza un estudio para mostrar que los niveles de ansiedad de las personas
obsesas que asisten de manera constante a tratamiento para control de peso corporal es mayor
que el de los obesos que no asisten a tratamiento.

Especificaciones: Participaron 28 personas obesas (hombres y mujeres). 14 personas obesas


que no asistían a tratamiento y 14 que asistían de manera regular a algún tipo de tratamiento.
A los 28 participantes se les solicitó que dieran respuesta a la escala de estado de ansiedad
(IDARE), la cual está diseñada para evaluar el grado de ansiedad ante situaciones cotidianas.
Los puntajes de la escala varían en un rango de 20 a 80 puntos, siendo los puntajes más altos
los indicativos de un mayor nivel de ansiedad.

Elección de la prueba estadística.


El modelo experimental tiene dos muestras independientes.

Planteamiento de Hipótesis.

• Hipótesis nula (Ho). No existe una diferencia significativa en el nivel de ansiedad de


personas obesas que asisten a tratamiento constante y personas obesas que no asisten a
tratamiento, todo se debe al azar, por lo tanto, ambos grupos son iguales y no difieren
significativamente.
• Hipótesis alterna (H1). Existe una diferencia significativa en el nivel de ansiedad de
personas obesas que asisten a tratamiento constante y personas obesas que no asisten a
tratamiento.

Nivel de significación.
Para todo valor de probabilidad igual o menor que 0.05, se acepta H1 se rechaza Ho.

Zona de rechazo.
Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza H1.

Dra. Rosa Saeteros Hernández. M.Sc. 100


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

Aplicación de la prueba estadística.

Primeramente obtenemos las medias y varianzas de cada grupo.


1 = 68.93
2 = 52.5
σ 21 = 558.9286 / (14 - 1) = 42.99
σ 21 = 837.5 / (14 - 1) = 64.42

Aplicamos la ecuación t.

Obtenemos los grados de libertad.

El valor t calculado (5.93), con 21 grados de libertad, se comparan con la tabla, y se observa
que al valor crítico (tt) de 2.080 corresponde a una probabilidad de 0.05. De esta manera, el
estadístico t 5.93 tiene una probabilidad menor que 0.05.

Decisión.
Como la probabilidad no se ubica en la zona de rechazo, se rechaza Ho y se acepta H1.

Interpretación.
Las personas obesas que asisten a un tratamiento constante para bajar de peso, tienen un nivel
de ansiedad mayor que las personas obesas que no asisten a tratamiento.

Prueba T de Student para datos relacionados (muestras dependientes)

PRUEBA “t” DE STUDENT PARA DATOS PAREADOS

En los datos pareados para cada una de las observaciones de la primera muestra hay una
observación en la segunda muestra para el mismo sujeto.

Ejemplo: estudios donde se analiza la misma medida en el mismo individuo en dos instantes
diferentes.

Los datos pareados se utilizan para intentar controlar fuentes de variación: si al mismo
individuo se le administran dos tratamientos distintos, entonces cierta cantidad de la
variabilidad biológica que existe entre individuos es eliminada, y por lo tanto se utilizan para
realizar comparaciones más precisas.

La prueba estadística t de Student para muestras dependientes es una extensión de la utilizada


para muestras independientes. De esta manera, los requisitos que deben satisfacerse son los
mismos, excepto la independencia de las muestras; es decir, en esta prueba estadística se

Dra. Rosa Saeteros Hernández. M.Sc. 101


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

exige dependencia entre ambas, en las que hay dos momentos uno antes y otro después. Con
ello se da a entender que en el primer período, las observaciones servirán de control o testigo,
para conocer los cambios que se susciten después de aplicar una variable experimental.

Con la prueba t se comparan las medias y las desviaciones estándar de grupo de datos y se
determina si entre esos parámetros las diferencias son estadísticamente significativas o si sólo
son diferencias aleatorias.

Consideraciones para su uso

• El nivel de medición, en su uso debe ser de intervalo o posterior.


• El diseño debe ser relacionado.
• Se deben cumplir las premisas paramétricas.

En cuanto a la homogeneidad de varianzas, es un requisito que también debe satisfacerse

Este procedimiento se define por medio de la siguiente fórmula:


Donde:
t = valor estadístico del procedimiento.
= Valor promedio o media aritmética de las diferencias entre los momentos
antes y después.
σd = desviación estándar de las diferencias entre los momentos antes y después.
N = tamaño de la muestra.

La media aritmética de las diferencias se obtiene de la manera siguiente:

La desviación estándar de las diferencias se logra como sigue:

Pasos:

1. Ordenar los datos en función de los momentos antes y después, y obtener las
diferencias entre ambos.
2. Calcular la media aritmética de las diferencias ( ).
3. Calcular la desviación estándar de las diferencias (σd).
4. Calcular el valor de t por medio de la ecuación.
5. Calcular los grados de libertad (gl) gl = N - 1.
6. Comparar el valor de t calculado con respecto a grados de libertad en la tabla
respectiva, a fin de obtener la probabilidad.
7. Decidir si se acepta o rechaza la hipótesis.

Ejemplo:

Comparar los niveles de ansiedad de jóvenes no asertivos antes y después de participar en un


entrenamiento de habilidades sociales.

Dra. Rosa Saeteros Hernández. M.Sc. 102


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

Especificaciones. 10 jóvenes no asertivos que asisten a la Clínica Universitaria de Salud


Integral. Se evaluó el número de comportamientos ansiosos que reportaban los jóvenes antes
y después del entrenamiento.

Elección y justificación de la prueba estadística T de Student para grupos relacionados.

a. Las mediciones son cuantitativas con variables continuas y una escala de intervalo.
b. Número de observaciones n = 10.
c. Una Variable Dependiente numérica: puntajes de 10 jóvenes no asertivos que asisten a
la Clínica Universitaria
d. Una Variable Independiente con 2 niveles: Antes y después del entrenamiento.
e. Dos muestras relacionadas: los mismos sujetos evaluados en dos momentos diferentes.

Planteamiento de la hipótesis.

• Hipótesis alterna (H1). El nivel de ansiedad de jóvenes no asertivos disminuye


después de participar en un entrenamiento en habilidades sociales, existiendo
diferencias significativas entre antes y después. Ha: X1 < X2.
• Hipótesis nula (Ho). Los cambios observados antes y después del entrenamiento en
habilidades sociales se deben al azar, y no hay diferencias entre ambos períodos. Ho:
X1 = X2.

Nivel de significación.
Para todo valor de probabilidad igual o menor que 0.05, se acepta H1 y se rechaza Ho. = 0.05
Zona de rechazo.
Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza H1.

a. Si la tc > tt se rechaza Ho.

Puntaje obtenido de 10 jóvenes no asertivos que asisten a la Centro Universitario

Cálculo de la prueba estadística.

Dra. Rosa Saeteros Hernández. M.Sc. 103


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

Confiabilidad = 0.05
gl = 9
tc = 5.79
tt = 2.262

El valor calculado o obtenido de t (5.79) se compara con los valores críticos de la distribución
t (tabla), y se observa que a una probabilidad de 0.05 le corresponde 2.262 de t. Por tanto, el
calculo tiene un probabilidad menor que 0.05.

Decisión.
Como tc es de 5.79, con 9 grados de libertad, tiene un valor de probabilidad menor que 0.05,
entonces se acepta H1 y se rechaza Ho.
tc > tt se rechaza Ho. Hay una reducción en los niveles de ansiedad en 10 jóvenes no asertivos
que asisten a la Centro Universitario después de un entrenamiento.
P(0.05) < = 0.05 se rechaza Ho.

Interpretación.
El nivel de ansiedad de jóvenes no asertivos disminuye después de participar en un
entrenamiento en habilidades sociales, existiendo diferencias significativas entre antes y
después.

EJERCICIO INTEGRADOR XI

1. La experiencia en la investigación de demandas por accidentes en una institución


aseguradora revela que en promedio cuesta $60 la realización de los trámites. Este costo se
consideró exorbitante en comparación al de otras compañías aseguradoras y se instauraron
medidas para reducir costos. A fin de evaluar el impacto de las medidas, se seleccionó una
muestra de 16 demandas recientes. Se encontró un costo promedio de $57 y una desviación
estándar de $10. Elabore una prueba de hipótesis que permita comprobar si los costos han
disminuido, con un 99% de confianza.

2. La longitud promedio de un elemento de equilibrio es de 43 milímetros. Se cree que con los


ajustes realizados esta longitud pudo haber cambiado. Una muestra de 12 elementos reveló
una media de 41,5 milímetros con una desviación de 1,78 milímetros. Con un nivel de
significación de 0,02, ¿puede decirse que la longitud promedio ha cambiado?

3. Una muestra de las calificaciones que presentaron hombres y mujeres en un


examen de Estadística se sintetiza a continuación:
Hombres Mujeres

Dra. Rosa Saeteros Hernández. M.Sc. 104


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

Media muestral 11,33 10,50


Desviación estándar 3,45 2,35
Tamaño de la muestra 6 8
¿Son las calificaciones promedios iguales, o por el contrario, existe alguna diferencia entre
ellas? Responda a esta pregunta con una prueba estadística de hipótesis que tenga un nivel de
confianza del 99%.

4. En una universidad, la encargada de bienestar social piensa que la responsabilidad por los
estudios de los estudiantes de primer año hace que disminuyan la actividad física. Como esta
está muy correlacionada con un correcto peso corporal, tomó una muestra de los pesos de 12
estudiantes, al comenzar el primer año y al finalizar. Los pesos fueron (en kilogramos):
Antes 85 70 54 56 72 103 88 77 76 69 45 91
Después 87 73 51 56 73 125 87 85 75 60 46 107
Dentro de un nivel de confianza del 99%, ¿puede afirmarse que ha aumentado el peso
corporal de los estudiantes durante el primer año?

“La medida social del hombre está en la duración de sus obras: la inmortalidad es el
privilegio de quienes las hacen sobrevivientes a los siglos, y por ellas se mide”
José Ingenieros

CAPITULO XII
PRUEBAS NO PARAMETRICAS PRUEBA “JI”
CUADRADO (X2)
OBJETIVO

• Calcular e interpretar las medidas de análisis en dependencia de la asociación de


variables cualitativas.

CONTENIDOS

• Prueba de Hipótesis “Ji” Cuadrado

En la investigación biomédica nos encontramos con frecuencia con datos o variables de tipo
cualitativo, mediante las cuales un grupo de individuos se clasifican en dos o más categorías

Dra. Rosa Saeteros Hernández. M.Sc. 105


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

mutuamente excluyentes. Las proporciones son una forma habitual de expresar frecuencias
cuando la variable objeto de estudio tiene dos posibles respuestas, como presentar o no un
evento de interés (enfermedad, muerte, curación, etc.). Cuando lo que se pretende es comparar
dos o más grupos de sujetos con respecto a una variable categórica, los resultados se suelen
presentar a modo de tablas de doble entrada que reciben el nombre de tablas de contingencia.
Así, la situación más simple de comparación entre dos variables cualitativas es aquella en la
que ambas tienen sólo dos posibles opciones de respuesta (es decir, variables dicotómicas). En
esta situación la tabla de contingencia se reduce a una tabla dos por dos como la que se muestra
en la Tabla siguiente:

Tabla de contingencia general para la comparación de dos variables


dicotómicas.

Característica B Característica A
Presente Ausente Total
Presente a b a+b
Ausente c d c+d
Total a+c b+d n

Supongamos que se quiere estudiar la posible asociación entre el hecho de que una gestante
fume durante el embarazo y que el niño presente bajo peso al nacer. Por lo tanto, se trata de
ver si la probabilidad de tener bajo peso es diferente en gestantes que fumen o en gestantes
que no fumen durante la gestación. Para responder a esta pregunta se realiza un estudio de
seguimiento sobre una cohorte de 2000 gestantes, a las que se interroga sobre su hábito
tabáquico durante la gestación y se determina además el peso del recién nacido. Los
resultados de este estudio se muestran en la siguiente tabla

Tabla 2. Tabla de contingencia para estudiar la


asociación entre fumar durante la gestación y el bajo
peso del niño al nacer. Estudio de seguimiento de 2000
gestantes.
Recién nacido de bajo peso
Gestante Sí No Total
Fumadora 43 (a) 207 (b) 250
No fumadora 105 (c) 1645 (d) 1750
Total 148 1852 2000

En la Tabla , a, b, c y d son las frecuencias observadas del suceso en la realidad de nuestro


ejemplo de estudio (43, 207, 105 y 1647), siendo n (2000) el número total de casos
estudiados, y a+b, c+d, a+c y b+d los totales marginales. En el ejemplo, a+b=250 sería el
número total de mujeres fumadoras durante el embarazo, c+d=1750 el número total de
mujeres no fumadoras, a+c=148 el número de niños con bajo peso al nacer y b+d=1852 el
número de niños con peso normal al nacimiento.

Dra. Rosa Saeteros Hernández. M.Sc. 106


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

Ante una tabla de contingencia como la anterior pueden planteársenos distintas cuestiones.
En primer lugar, se querrá determinar si existe una relación estadísticamente significativa
entre las variables estudiadas. En segundo lugar, nos interesará cuantificar dicha relación y
estudiar su relevancia clínica. Esta última cuestión podrá resolverse mediante las
denominadas medidas de asociación o de efecto (riesgo relativo (RR), odds ratio (OR),
reducción absoluta del riesgo (RAR).

Por otro lado, para responder a la primera pregunta, la metodología de análisis de las tablas
de contingencia dependerá de varios aspectos como son: el número de categorías de las
variables a comparar, del hecho de que las categorías estén ordenadas o no, del número de
grupos independientes de sujetos que se estén considerando o de la pregunta a la que se desea
responder

En estadística, la distribución chi-cuadrado, también denominada chi-cuadrado de Parsons

Para realizar este contraste se disponen los datos en una tabla de frecuencias. Para cada valor
o intervalo de valores se indica la frecuencia absoluta observada o empírica (Oi). A
continuación, y suponiendo que la hipótesis nula es cierta, se calculan para cada valor o
intervalo de valores la frecuencia absoluta que cabría esperar o frecuencia esperada (Ei=n·pi ,
donde n es el tamaño de la muestra y pi la probabilidad del i-ésimo valor o intervalo de
valores según la hipótesis nula). El estadístico de prueba se basa en las diferencias entre la Oi
y Ei y se define como:

E = Valores Esperados

O = Valores Observados E = (total columna x total de la fila)/total general


Cada valor observado tiene su valor esperado
E = Valores Esperados

Este estadístico tiene una distribución Chi-cuadrado con k-1 grados de libertad si n es
suficientemente grande, es decir, si todas las frecuencias esperadas son mayores que 5. En la
práctica se tolera un máximo del 20% de frecuencias inferiores a 5.
Si existe concordancia perfecta entre las frecuencias observadas y las esperadas el estadístico
tomará un valor igual a 0; por el contrario, si existe una gran discrepancias entre estas
frecuencias el estadístico tomará un valor grande y, en consecuencia, se rechazará la hipótesis
nula. Así pues, la región crítica estará situada en el extremo superior de la distribución Chi-
cuadrado con k-1 grados de libertad.

Criterios de decisión :

Se acepta la Hp, si X2 calc < X2 tab

Se rechaza la Hp si X2 calc > X2 tab

Para obtener X2 t Los grados de libertad vienen dados por :

Dra. Rosa Saeteros Hernández. M.Sc. 107


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

gl= (r-1)(k-1). Donde r es el número de filas y k el de columnas. (Ver ANEXO No.4. valores
críticos de chi cuadrado)

Criterio de decisión:

Se acepta H0 cuando . En caso contrario se rechaza.


Donde t representa el valor proporcionado por las tablas, según el nivel de significación
elegido.
Cuanto más se aproxima a cero el valor de chi-cuadrado, más ajustadas están ambas
distribuciones.

Ejemplo:

Se realizó una prueba para probar la efectividad de un alimento fortificado con Fe, los datos
se presentan en la siguiente tabla de contingencia:

Suministro de Mejora TOTAL


Alimento SI NO
SI 15 (9.58)* 35 (40.41)* 50
NO 8 (13.41)* 62 (56.58)* 70
TOTAL 23 97 120
* Valores esperados

Planteamiento de las Hipótesis

Ho: El alimento fortificado no fue efectivo


H1: El alimento fue efectivo, pues es mayor el número de niños que mejoraron su nivel
de Hb en sangre.

X 2
=
(15 − 9.58)2 + (8 − 13.41) 2 + (3.5 − 40.41) 2 + (62 − 56.58) 2
c
9.58 13.41 40.41 56.58
X2 c = 6.43

gl= (r-1)(k-1). Donde r es el número de filas y k el de columnas


gl= (2-1)(2-1) = 1

X2 t = gl = 1 al 95% de confiabilidad (Este valor observamos en la tabla de valores de X2


en el ANEXO No. 4)
X2 t = 3.84

Regla de decisión:

X2 c = 6.43 > X2 t = 3.84


Por lo tanto rechazo la Ho y acepto la H1

Dra. Rosa Saeteros Hernández. M.Sc. 108


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

Interpretación:

Con un 95% de confiabilidad se puede afirmar que el alimento fortificado con Fe fue efectivo
para mejorar el nivel de Hb en sangre de los menores de cinco años.

EJERCICIO INTEGRADOR XII

1. Se desea conocer la posible relación entre obesidad e hipertensión, para ello se estudiaron
200 individuos de una comunidad y se clasificaron de acuerdo a la presencia o no de estas
alteraciones, los resultados son: (6 Puntos)
▪ Obesidad si Hipertensión si 32
▪ Obesidad si Hipertensión no 18
▪ Obesidad no Hipertensión si 28
▪ Obesidad no Hipertensión no 122
a) Esquematice el tipo de estudio, e identifique las variables de estudio.
b) Realice una tabla de dos por dos para los datos y mida la asociación de variables,
plantee hipótesis y diga las conclusiones.

2. Se realizó un estudio de casos y controles, para determinar la relación entre uso de


preservativo y presencia de ITS, los resultados obtenidos son los siguientes:
Personas que usan preservativo: 35 personas, con ITS 11
Persona personas que no usan preservativo 192: 25 con ITS.
Con estos datos obtenga y diga el significado de:
c) Esquematice el tipo de estudio, e identifique las variables de estudio.
d) Realice una tabla de dos por dos para los datos y mida la asociación de variables,
plantee hipótesis y diga las conclusiones.

“Aunque tuviera la ciencia de todas las cosas y plenitud de fe, de nada sirve si no tengo
caridad y la practico”
San Pablo
CAPITULO XIII
CORRELACIÓN Y REGRESIÓN LINEAL SIMPLE
OBJETIVOS
• Determinar las medidas de análisis en dependencia de la asociación de variables
cuantitativas

CONTENIDOS
• Correlación Simple
• Regresión Simple

Correlación

“En ciertas situaciones en biología encontramos a menudo variaciones que están


aparentemente asociadas o que son interdependientes. Por ejemplo , podemos tener una
situación en la cual un aumento de la variable X está acompañado de un aumento
correspondiente de la variable y, o una disminución de X parece estar relacionada con una
disminución de Y. Cuando se puede demostrar que la variación de una variable está de algún

Dra. Rosa Saeteros Hernández. M.Sc. 109


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

modo asociada con la variación de otra, entonces se puede decir que las dos variables están
correlacionadas”5

La correlación da la idea general de dos variables relacionadas en alguna forma definida. No


ha habido en la misma mucho de matemáticas o estadística. La simple observación de que dos
variables parecen estar relacionadas no revela gran cosa. Necesitamos respuestas a dos
importantes preguntas:

¿Qué tan estrechamente relacionadas se encuentran las variables? y ¿es real la relación, o
podría haber ocurrido por un accidente debido a la casualidad? Para responder a la primera
pregunta, necesitamos una medida definida de la estrechez de la relación entre dos variables.
Esta medida recibe el nombre de coeficiente de correlación, representado por la letra r.
Después de definir algunos otros términos estaremos listos para mostrar cómo se calcula este
valor, y cómo se interpreta, podemos obtener la respuesta a la segunda si consultamos las
tablas de probabilidad apropiadas.

Regresión

La correlación se refiere al hecho de que dos variables se encuentran relacionadas, y a la


estrechez de dicha relación. La regresión a su vez, se refiere a la naturaleza de la relación.
“El análisis de regresión consiste en la medición del grado de dependencia de una variable
dependiente (Y) sobre una variable independiente (X)” 5.

Los grados de correlación:

El término correlación puede reconocerse también como “relación” entre dos o mas variables;
entonces empezaremos por clasificar a la correlación como:

Simple: cuando se la estima (r) entre una variable independiente Xi y una dependiente Yi

Múltiple: cuado (R) se la estima entre algunas variables independientes Xi (X1, X2, …,Xn) y
una dependiente Yi.

Una tabla referencial de los grados de correlación (r ó R) puede ser la siguiente:

La Hipótesis de la correlación poblacional será:


Ho: ? = 0 “La correlación entre las variables no es significativa”
H1: ? ? 0 “La correlación entre las variables es significativa”
Análisis de la correlación:

Dra. Rosa Saeteros Hernández. M.Sc. 110


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

Coeficiente de correlación (r)

FACTORES DE CORRECCION DE LAS SUMAS DE CUADRADOS (x, y, xy):


FCx = (Sx)2/n FCy = (SY)2/n FCxy =(Sx)*(SY)/n
CALCULO DE LAS SUMAS DE CUADRADOS:
SCx = Sx2 – FCx
SCy = Sy2 – FCy
SCxy = Sxy – FCxy

EJEMPLO:
“Calcular el grado de asociación o relación entre las variables EDAD y PESO de estudiantes
de la ESPOCH, como se muestra en el siguiente cuadro de resultados” 11:

FACTORES DE CORRECCION:

Dra. Rosa Saeteros Hernández. M.Sc. 111


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

FCx = (474.30)2/25 = 8998.4196


FCy = (1323.00)2/25 = 70013.16
FCxy = (474.30)*(1323.00)/25 = 25099.256
SUMAS DE CUADRADOS:
SCx = 9120.45 – 8998.4196 = 122.03
SCy = 70656.26 -70013.16 = 643.10
SCxy = 25335.85 – 25099.256 = 235.89

· El Grado de asociación es alto y positivo


· Conforme aumenta la edad del estudiante, el peso tiende a incrementarse en forma
directamente proporcional.
COEFICIENTE DE DETERMINACION (r2)
Este estadístico mide el porcentaje de dependencia de Y por efecto de X y se lo
obtiene así:
r2 = (r)2 x 100
r2 = (0.842016)2 x 100
r2 = (0.709066953) x 100 = 70.91 %

Los pesos de los estudiantes entonces dependen en un 70.91 % de su edad. La


diferencia de 100 % obedece a otros aspectos no considerados en el cálculo.

DOCIMASIA DE LA HIPOTESIS DE CORRELACION

Sr = 0.20098561
tCAL = 0.84206113 / 0.20098561
tCAL = 4.18965872
tCAL = 4.1897> t.01 con 23 g.l.=2.807 ; por tanto hay asociación significativa, más allá del
99
% de certeza y menos del 1 % de error

Análisis de regresión
COEFICIENTE DE REGRESION (byx)
Mide la cantidad de cambio de Y por cada unidad de cambio de X; en nuestro ejemplo:
PLANTEAMIENTO DE HIPOTESIS:

Ho: La regresión no es significativa Ho: ß = 0


H1: La regresión es significativa H1: ß ? 0
byx = SCxy / SCx

Dra. Rosa Saeteros Hernández. M.Sc. 112


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

byx = 253.89 / 122.03


byx = 1.933 kg

Ecuación de regresión:

a = 52.92 – 1.933 (18.972)


a = 16.245688
PES
Ù
O, kg = 16.245688 + 1.933X
LINEA TEORICA DE REGRESION
X mínimo = 16.10 años Y mínimo = 47.368 kg
X máximo = 24.8 años Y máximo = 55.923 kg

Línea teórica de regresión

COMPROBACION DE LA HIPOTESIS DE LA REGRESION (HO: 0 = b )

ANALISIS DE VARIANZA PARA LA REGRESION (Peso, kg)

Dra. Rosa Saeteros Hernández. M.Sc. 113


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

Conclusión:

Por cuanto fisher calculado = 55.79 > fisher .01 = 7.881, se deduce que la regresión es
significativa por tanto rechazo Ho y acepto H1 con el 99 % de certeza y 1 % de error. los
cambios que se producen en el peso de los estudiantes están significativamente influenciados
por la edad.

EJERCICIO INTEGRADOR XIII

1. Se tienen a continuación datos sobre la estatura y edad de estudiantes:

X (edad) Variable Independiente


Y (estatura) Variable Dependiente.

x y
24 1,62
25 1,68
26 1,48
27 1,50
28 1,60
29 1,70
30 1,73
31 1,50

¿ Medir la correlación y la regresión?

“Ningún Hombre es tan perfecto que no necesite mejorarse”


Epíteto

Dra. Rosa Saeteros Hernández. M.Sc. 114


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

BIBLIOGRAFIA:

1. CITAS BIBLIOGRÁFICAS

1. Bioestadística y Computación. (Colectivo de Autores).Instituto superior de Ciencias


Médicas de la Habana. Centro de Cibernética aplicada a la Medicina. Ministerio de
Salud Pública. Editorial Pueblo y Educación, 1987. Pág. 2 , 4.

2. WAYNE W, Daniel Bioestadística. Base para el análisis de la ciencias de la salud.


Editorial Limusa. Tercera Edición. México. 1987. Pág. 18, 20.

3. ESCOBAR, Luis Fernando. Investigación Científica para Médicos. Manual de


Instrucción con la aplicación del aprendizaje basado en problemas. Tercera
Edición..Pontificia Universidad Católica del Ecuador. Quito. 1999 Pág. 22

4. CAMEL, Fayad. Estadísticas Médicas y de Salud Pública. Edición Revolucionaria.


Ministerio de Enseñanza Superior. La Habana – Cuba. 1987. Pág. 38

5. SCHEFLER, William, Bioestadística. State University College at Buffalo. Nueva


York. Versión en español de: Carlos Prado. Departamento de Estadística. Pontificia
Universidad Católica de Chile. Fondo Educativo Interamericano. 1981.. Pág. 32, 164

6. SAETEROS, Rosa; Ochoa Diana, Diseño de un Programa para promover el Sexo


Seguro en la ESPOCH. (tesis de grado). 2002. Pág. 27

7. GONZÁLEZ, Edilberto. OCHOA, Rosaida. PEREZ, Luisa. Las Mediciones en


Epidemiología. Instituto Pedro Kouri. La Habana –Cuba. 1996. Pág. 10

8. RUIZ, Alvaro, MORILLO, Luis. Epidemiología Clínica Aplicada. . Editorial Médica


Internacional. Bogotá 2004. Pág. 488,489,490

9. GARCIA, Héctor. Manual de Investigación aplicada en servicios sociales y de salud.


Ediciones científicas La Prensa Médica Mexicana, S.A. Pág. 107, 108

Dra. Rosa Saeteros Hernández. M.Sc. 115


ESPOCH
FACULTAD DE SALUD PÚBLICA
ESCUELA DE PROMOCIÓN Y CUIDADOS DE LA SALUD
BIOESTADÍSTICA

10. ALMEIDA, Manuel. Curso de Estadística Experimental y Procesamiento


Computarizado de Datos. Estadística Descriptiva. ESPOCH. 2004. Pág. 28

11. PAZMIÑO, José. Curso de Estadística Experimental y Procesamiento Computarizado


de Datos. 2005. Pág. 7- 11

2. BIBLIOGRAFÍA CONSULTADA

1. MEDICINA GENERAL INTEGRAL. TOMO II. Cuarta reimpresión, 1994.


Ministerio de Salud Pública de Cuba, 1985. Editorial Pueblo y Educación, 1987.
2. CATASUS, Sonia. Introducción al análisis demográfico. Centro de estudios
demográficos. Facultad de economía. Universidad de La Habana – Cuba.

3. HERRERA, Lorenzo. BARROSO, Isabel. Breve Introducción al Análisis


Demográfico. Ministerio de Salud Pública. Escuela de Salud Pública “Carlos J.
Finlay”. La Habana – Cuba. 1997.

4. OLIVA, Leonardo. O´FARRIL, Esperanza. Bioestadística y Computación. Guía de


estudio. Ministerio de Salud Pública, 1988. Editorial Pueblo y Educación.

5. RESTREPO, Jorge Humberto. MAYA, José María. Epidemiología Básica y


principios de Investigación. Tomo III. Primera Edición. Corporación para
investigaciones Biológicas. Medellín, Colombia.

6. SCHAUM. Teoría y Problemas de Estadística. Libros McGraw-Hill. U.S.A

7. Bioestadística Cuaderno de Ejercicios (Colectivo de Autores).Instituto Superior de


Ciencias Médicas de la Habana. Centro de Cibernética aplicada a la Medicina.
Ministerio de Salud Pública. Editorial Pueblo y Educación, 1988.

8. GONZALEZ, Oliva. O´FARRILL, Esperanza. Bioestadística y Computación. Guía de


Estudio. Instituto superior de Ciencias Médicas de la Habana. Centro de Cibernética
aplicada a la Medicina. Ministerio de Salud Pública. Editorial Pueblo y Educación,
1988.

Dra. Rosa Saeteros Hernández. M.Sc. 116

También podría gustarte