100% encontró este documento útil (1 voto)
169 vistas103 páginas

Bioestadística en Enfermería: Fundamentos y Práctica

Este documento presenta la cátedra de Bioestadística para estudiantes de la Licenciatura en Enfermería. El propósito es desarrollar habilidades estadísticas que permitan a los estudiantes integrar y analizar datos para la toma de decisiones en el sistema de salud. El programa incluye unidades sobre conceptos básicos, estadística descriptiva, demográfica, inferencial y pruebas estadísticas. Se utilizarán clases teóricas, prácticas y trabajos grupales para lograr los objetivos de recon

Cargado por

Lucio Solotzzo
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
100% encontró este documento útil (1 voto)
169 vistas103 páginas

Bioestadística en Enfermería: Fundamentos y Práctica

Este documento presenta la cátedra de Bioestadística para estudiantes de la Licenciatura en Enfermería. El propósito es desarrollar habilidades estadísticas que permitan a los estudiantes integrar y analizar datos para la toma de decisiones en el sistema de salud. El programa incluye unidades sobre conceptos básicos, estadística descriptiva, demográfica, inferencial y pruebas estadísticas. Se utilizarán clases teóricas, prácticas y trabajos grupales para lograr los objetivos de recon

Cargado por

Lucio Solotzzo
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

,

BIOESTADISTICA
\

LICENCIATURA EN ENFERMERÍA
UNIDAD ACADÉMICA: FACULTAD DE MEDICINA-UBA

PROYECTO DE CÁTEDRA

.,._ Carrera: CICLO DE COMPLEMENTACIÓN CURRICULAR DE LICENCIATURA EN ENFERMERÍA


._. CUDAP: EXP-UBA: 0036335/2016.
,.._ Resolución nº: 1629.
-.l Espacio Curricular: 658-BIOESTADÍSTICA
.,._ Área: Formación específica.
{. Destinatarios: Estudiantes del ciclo complementario de Licenciatura en Enfermería.
*- Turno: Mañana
"*- Régimen: Cuatrimestral.
~ Asignación Horaria: 03 horas cátedras semanales. (Hora cátedra: 40 minutos).+ Horas de producción prácticas .
.._ Régimen cronológico: DÍAS CONSIGNADOS.
-i- Modalidad: Presencial.
.,._ Categoría: Curso del plan de estudio.

Pág. 1
FUNDAMENTACIÓN DE LA CÁTEDRA

La presente asignatura desarrolla contenidos que vincula al estudiante de la carrera de Licenciatura


en Enfermería en el sistema de salud con b ase a la integraci~~ de datos e información sistematizada para
la toma de decisiones y la operatividad en los procesos técnicos, administrativos, gerenciales y
comunicacionales, desde una fase de formación académica que implica la conexión con la realidad
sanitaria, focalizando el valor agregado de los datos en salud convirtiéndolos en evidencia científica.
La prestación de servicios profesionales en el ámbito sanitario implica ejercer el proceso de
atención y cuidado, también desde las herramientas de bioestadística.
Se espera que mediante la fase formativa se posibiliten procesos de integración teórico-práctica,
articulando marcos conceptuales abordados en otras asignaturas, en función de los problemas de la propia
práctica y de las realidades de trabajo específicas que ponen a los estudiantes en contacto con diferentes
situaciones y problemáticas propias del desempeño profesional.
Para lograr la adquisición de esta perspectiva los estudiantes desarrollarán actividades áulicas y de
integración práctica vivencia! y simulada a los efectos de integrar los conocimientos y lineamientos
generales necesarios para el afrontamiento de situaciones de trabajo con la idoneidad elemental para la
buena práctica y acompañado de modo pedagógico-didáctico por el docente de la cátedra durante el
período lectivo designado.
La evolución de la ciencia y la tecnología produjo profundos cambios en la sociedad, derivados de
la gestión propia del desempeño en el campo sanitario se generan volúmenes considerables de datos, los
cuales resulta imprescindible su manejo, procesamiento y gestión de conocimiento sobre una base
científica y metodológica.
Enfermería no es ajena a esta realidad por lo tanto debe adaptarse a los cambios y saber utilizar los
avances tecnológicos para el crecimiento de la profesión y fundamentalmente para brindar cuidados de
calidad apoyado en las herramientas bioestadísticas.

Pág. 2
OBJETIVOS

Que durante el desarrollo y al finalizar la cursada los estudiantes logren:


• Reconocer y aplicar los conceptos básicos de la bioestadística.
• Dominar los conocimientos de los paquetes estadísticos para optimizar la práctica profesional y
académica.
• Aplicar los conocimientos sobre estadística descriptiva al diseño de tablas y gráficos.
• Diferenciar los conceptos y métodos de estadística demográfica y su transferencia a la práctica
profesional.
• Asociar la caracterización y análisis de variables con métodos de estadística inferencial.
• Emplear test de comparación y correlación de variables en estudios científicos.

PROGRAMA ANALÍTICO:
UNIDAD 1
Introducción a la Bioestadística. Conceptos de: estadística y bioestadística, dato, variable, errores,
sesgos, población y muestra. Cálculo de tamaño muestra!. Criterios de selectividad. Recolección de datos:
fuentes primarias y secundarias. Tipos de datos y variables. Métodos de recolección de datos: físico y
electrónicos.
UNIDAD 2
Estadística descriptiva. Medidas de tendencia central: media, moda, mediana, frecuencia (absoluta,
relativa, acumulada y porcentual). Medidas de dispersión: varianza y desviación estándar. Intervalo de
confianza. Intervalos y clases, rangos, cuartiles y percentiles.
UN1DAD3
Estadística demográfica. Tasas, Índices, Razones y Proporciones.
UNIDAD4
Tablas y Gráficos. Diseño y selección de resultados. Presentación (estándares para informes de
investigación, artículos y proyectos). Gráficos: barra, circular, poligonal, histograma, caj a, incidencia y
prevalencia.
UNIDAD 5
Estadística inferencial. Variables: distribución y caractenzación. Estudios de comparación entre
variables medidas en distintas escalas. Criterios de normalidad y anormalidad.

Pág. 3
UNIDAD 6
Test de correlación y comparación. Chi cuadrado, Odd Ratio, T de Student, .[Link], Me Nemar,
Mann Whitley. Significación estadistica.

ESTRATEGIAS METODOLÓGICAS

0 Clases teóricas a cargo del docente con utilización de ejemplos, presentación de análisis
información y trabajos grupales (basados en el aprendizaje cooperativo).
0 Clases con referato bibliográfico y experiencias prácticas en base a actividades de aplicación.

RECURSO MATERIAL

./ Guía de lectura: Módulo compilador por unidad temática .


./ Videos .
./ Análisis de datos e información.
./ Gráficas y tablas de datos con análisis e interpretación.
./ Presentación de diapositivas en formato: Power Point y Adobe Reader (PDF) .
./ Guía práctica sobre la temática expuesta.
./ Referencias bibliográficas y sitios Web referentes a las temáticas basadas en las evidencias.

BIBLIOGRAFÍA

W Dawson, B., Trapp, R.G. (2005). Bioestadística Médica. 4a ed. México DF: Manual Moderno.

m Fletcher, R.H., Fletcher, S.W. (2007). Epidemiología Clínica. 4a ed. Philadephia: Wolters Kluwer.

W Hemández Martín, Z. (2012). Métodos de análisis de datos: apuntes. Logroño: Universidad de La Rioja.

W Vasallo, J. M. (2014). Estadística aplicada a las ciencias de la salud. Barcelona: Elsevier.

W Cobo, E., Muñoz, P., & González, J. A. (2007). Bioestadística para no estadísticos. Barcelona:Elsevier.

mJ Montanero Fernández, J., & Minuesa Abril, C. (2018). Estadística básica para Ciencias de la Salud.
Cáceres: Universidad de Extremadura.

Pág. 4
l!JJ Sitios Web:
,/ http:// [Link] (Telesalud)
,/ [Link]
,/ http:// [Link]
,/ [Link]
,/ [Link]
,/ [Link]
,/ [Link]
,/ [Link] [Link]

PRESUPUESTO DEL TIEMPO: CRONOGRAMA

Encuentro
FECHA DÍA UNIDAD
Académico
l. 22/ 10/2019 MARTES Orientación para la Producción Práctica. Unidad 1.
2. 29/ 10/2019 MARTES Unidad 2. Teoría y Práctica
3. 05/ 11/2019 MARTES Unidad 3. Teoría y Práctica
4. 12/ 11/2019 MARTES Unidad 4. Teoría y Práctica
5. 19/11/2019 MARTES Unidad 5. Teoría y Práctica
6. 26/ 11/2019 MARTES Unidad 6. Teoría y Práctica
7. /fl3712/2019 MARTES-
___, Examen Parcial: Taller de casos estadísticos
'--
8. (¡...--r{)/12/2019 MARTE~ Examen Parcial: Práctica simulada de bioestadística
9. ( i....--1711212019 MARTES Examen Final (Integración)

Pág. 5
Encuentro
FECHA DÍA UNIDAD
Académico
l. 26/10/2019 SÁBADO Orientación para la Producción Práctica. Unidad 1.
2. 02/11/2019 SÁBADO Unidad 2. Teoría y Práctica
3. 09/11/2019 SÁBADO Unidad 3. Teoría y Práctica
4. 16/11/2019 SABADO Unidad 4. Teoría y Práctica
5. 23/11/2019 SABADO Unidad 5. Teoría y Práctica
6. 30/11/2019 SABADO Unidad 6. Teoría y Práctica
7. 07/12/2019 SABADO Examen Parcial: Taller de casos estadísticos
8. 14/12/2019 SABADO Examen Parcial: Práctica simulada de bioestadística
9. 21/12/2019 SABADO Examen Final (Integración)

EVALUACIÓN
Para aprobar la materia el estudiante deberá:
./ Rendir un parcial escrito en carácter de trabajo práctico áulico o su respectiva instancia
recuperatoria, con puntaje mínimo de aprobación equivalente a 4 (cuatro) .
./ Mantener la condición de regularidad con asistencia del 100% de los encuentros teórico-prácticos.
./ Rendir examen final en las fechas estipuladas por la institución educativa.
./ Características de la promoción/acreditación: La acreditación de la asignatura implica mantener la
condición de alumna/o regular, la aprobación de la evaluación parcial (con calificación mínima 4
[cuatro]), asistencia del 100% y final con un mínimo de 4 [cuatro] puntos.

Pág. 6
Material de Estudio

Bioestadística

Licenciatura en Enfermería

Prof. Lic. Carlos Le pez


UNIDAD 1
Introducción a la Bioestadística. Conceptos de: estadística y bioestadística, dato,
variable, errores, sesgos, población y muestra. Cálculo de tamaño muestra!.
Criterios de selectividad. Recolección de datos: fuentes primarias y secundarias.
Tipos de datos y variables. Métodos de recolección de datos: físico y electrónicos.

Estadística. Concepto y definición


La estadística puede definirse como la disciplina científica dedicada al tratamiento
de la información que contiene series de datos que proceden de la observación de
fenómenos colectivos (demográficos, económicos, sanitarios, etc.), en los que
intervienen factores de variación que hacen necesario formular modelos
probabilísticos para poder llegar a conclusiones o predicciones bajo un determinado
nivel de probabilidad. En general, los procedimientos estadísticos se aplican a la
recopilación, organización, presentación, análisis e interpretación de datos
numéricos con el fin de realizar una toma de decisión más efectiva.
Según esto, el objetivo de la estadística es reunir una información cuantitativa
concerniente a individuos, grupos, series de hechos, etc., y deducir, gracias al
análisis de estos datos, unos significados precisos o unas previsiones para el futuro .
En definitiva, la estadística es un método de análisis cuantitativo de los colectivos
que permite interpretar información cuya propiedad fundamental es la variabilidad
de los datos. Así, la estadfstica facilita el estudio de una característica del colectivo
que puede expresarse numéricamente, bien porque es medible por naturaleza, bien
porque de alguna manera puede expresarse numéricamente. Para su aplicación, la
estadística se basa en la teoría de probabilidades y en el cálculo infinitesimal.
El profesor y economista alemán Godofredo Achenwall (1719-1772), docente de la
Universidad de Gottingen, introdujo en 1749 el término estadística (statistik) para
denominar a lo que hasta entonces se conocía como aritmética política. La palabra
deriva de staat, que significa "estado" o "gobierno", y Achenwall la aplicó al
"conocimiento profundo de la situación respectiva y comparativa de cada estado",
de modo que estructuró los métodos estad ísticos orientados a investigar, medir y
comparar las riquezas de las naciones. Achenwall es autor de obras sobre la historia
de los estados europeos, basadas en derecho y economía política, tales como
Elementos de estadística de los principales estados de Europa y Principios de
economía política .
Gracias a las investigaciones realizadas en Alemania , John Sinclair (1754-1835) fue
el primero en introducir el término estadística en Inglaterra, con su trabajo Statistical
Account of Scotland. Sin embargo, mientras en Alemania la estadística se venía
utilizando básicamente como instrumento para medir la fortaleza del Estado, Sinclair
proponía su utilización como generadora de información interna para encontrar
carencias y proponer mejoras para el país.
A comienzos del siglo XIX, el término estadística adoptó un significado más general,
orientado a la obtención, clasificación y tratamiento de cualquier conjunto de datos
colectivos cuantitativos.

Concepto de bioestadística
Se denomina bioestadística la aplicación particular de la estadística a las ciencias
biológicas y de la salud. Es decir, la obtención y el análisis de datos biológicos o de
salud mediante la utilización de métodos estadísticos. Por ejemplo, la bioestadística
se puede usar para ayudar a comprender las posibles causas de un cáncer o con
qué frecuencia se presenta una enfermedad en un determinado grupo de personas.
En algunos ámbitos también se denomina biometría.

Áreas de la estadística
La estadística ofrece métodos para analizar series de datos de modo descriptivo o
inferencia!. Según esto, podemos distinguir entre estadística descriptiva y
estadística inferencia/.

Estadística descriptiva (deducción)


La estadística descriptiva pretende describir, analizar y representar las
características que existen en un conjunto de datos, obten idos a partir de una
población o de una muestra. Comprende la tabulación , la presentación y la
descripción de los datos empíricos, a fin de hacerlos más manejables y
comprenderlos e interpretarlos mejor.
Cuando un valor se ha obtenido a partir de una muestra, hablamos de estadístico,
mientras que un parámetro es un valor obtenido a partir de una población. Así, la
media de estancias hospitalarias en todos los hospitales de Argentina es un
parámetro, mientras que la media de estancias hospitalarias en una muestra de
hospitales argentinos es un estadístico.

Estadística inferencia! o analítica (inducción)


La estadística inferencia! o analítica es la que, apoyándose en el cálculo de

.
probabilidades y a partir de los datos obtenidos de una muestra, trata de sacar
conclusiones acerca de las características de una población.

Conceptos preliminares
La estadística obtiene y estudia datos sobre diferentes individuos, que no tienen que
ser necesariamente personas, hombres o mujeres. El conjunto de todos los
individuos posibles constituye el universo.
En general, no interesan los datos de todos los individuos, de todo un universo, sino
que se estudian poblaciones. Aún así, obtener y analizar los datos de toda una
población suele ser imposible, por lo que, en la práctica, suele seleccionarse una
muestra de individuos de la población; únicamente en estos individuos
estudiaremos los datos que nos interesan.

Individuo
Es cada elemento que lleva asociada una medida, un número de orden o una
característica predeterminada.

Universo
Es el conjunto, finito o infinito, de todos los posibles individuos que cumplen ciertas
propiedades.
Población
Es el conjunto de todos los individuos que cumplen ciertas propiedades y de quienes
deseamos estudiar ciertos datos. Podemos entender que una población abarca todo
el conjunto de elementos de los cuales podemos obtener información, entend iendo
que todos ellos han de poder ser identificados. La población deberá ser definida
sobre la base de las características que la delimitan , que la identifican y que
permiten la posterior selección de unos elementos que se puedan e ntender como
representativos (muestra).
Hay que distinguir entre población diana o población objetivo (aq uella población a
la que se desea extrapolar los resultados del estudio) y población accesible (aquella
población cuyos individuos son directamente accesibles al investigador para
seleccionar la muestra).
Asimismo, una población puede ser finita (por ejemplo, todos los enfermos de los
hospitales de Cataluña o los estudiantes de enfermería de España) o infinita (los
posibles resultados de sucesivas tiradas de una moneda o el conjunto de los
números pares).

Muestra
Una muestra es una porción de algo. Si deseamos preguntar a un conjunto de cinco
mil personas su opinión sobre un determinado fe nómeno, tenemos dos opciones:
efectuar las preguntas persona por persona o efectuar las preguntas solamente a
una muestra de estas personas, es decir, a un grupo de elementos representativos
de ese conjunto.
Evidentemente, si se exam ina toda la población, mediante un censo, podemos
conocer exactamente cuál es la distribución de la variable o las variables de interés
en esta población. Sin embargo, en la mayoría de las ocasiones los censos resultan
inviables, caros y lentos, además de innecesarios. La alternativa al censo es estimar
la distribución de la variable en una parte representativa de la población, es decir,
en una muestra, lo que tiene la ventaja de ser más rápido y más barato, y si la
muestra se ha elegido correctamente, perm ite obtener una información que aporta
una estimación razonable de la situación de la variable en la población.
Así, la muestra es una parte o un subconjunto de la población en el que se obser.:a
el fenómeno a estudiar y de donde sacaremos unas conclusiones generalizables a
toda la población. En general, se considera que una muestra es grande cuando el
número de individuos seleccionados es igual o superior a 30, y una muestra es
pequeña cuando los individuos son menos de 30.
Para que una muestra sea representativa de la población , deberá cumplir unas
cond iciones básicas:
• Han de delimitarse y definirse claramente las características que conforman
la totalidad de la población .
• Ha de haber garantías de que cada elemento de la población tiene las
mismas posibilidades de figurar en la muestra. En consecuencia , deberá
utilizarse el procedimiento de muestreo adecuado.
• La muestra deberá tener el tamaño adecuado para poder extrapolar los
resu ltados obtenidos al conjunto de la población con garantías de fiabilidad .

Muestreo
El muestreo es el método o procedimiento destinado a obtener una muestra
adecuada que reproduzca las características básicas de la población . Existen
diferentes criterios de clasificación de los procedimientos de muestreo, aunque, en
general, pueden dividirse en dos grandes grupos: métodos aleatorios o
probabilísticos y métodos no aleatorios o no probabilísticos.

Tipos de muestreo
Aleatorio (probabilístico o al azar) No aleatorio (no probabilístico o no al azar)
Simple Accidental
Sistemático )Atencionadv
Estratificado Proporcional Por cuotas

No proporcional
Por conglomerados
Muestreo aleatorio
El muestreo aleatorio, probabilístico o muestreo al azar, parte de una igualdad
absoluta de todos los elementos de la p;¡;jact&.n para ser seleccionados, de manera
1

que conocemos la probabilidad que tiene uñeÍemento de ser in cluido en la muestra.


Así, los resultados obtenidos en esta muestra serán...[Link]+sticamente inferibles de
toda la población, siempre que el tamaño sea el adecuado y en función del nivel de
confianza que hayamos establecido previamente.

Muestreo aleatorio simple


Es el método conceptualmente más sencillo. Básicamente, consiste en elegir al azar
de una lista todos los individuos que formarán parte de la muestra . Para llevar a
cabo un muestreo aleatorio simple se siguen los sigu ientes pasos:
1. Se confecciona la lista de todos los elementos de la población , asignándoles
números consecutivos de 1 a N, siendo N el total de elementos de la
población. Esto supone que están claramente definidas cuáles son las
unidades de base de la muestra, es decir, si se trata de individuos, grupos,
familias, etc. Esta unidad de base ha de ser la misma en toda la muestra; no
se puede seleccionar un individuo, luego una familia, etc.
2. Se decide el tamaño deseado de la muestra. Llamaremos n al número de
elementos de la muestra. Para conocer el tamaño de la muestra existen
tablas ya elaboradas y pruebas estadísticas que la determinan en función del
tamaño de la población, del tipo de variables a estudiar y del nivel de
confianza deseado.
3. Se extraen al azar los n elementos que sean necesarios para completar el
tamaño de muestra requerido . Para esta extracción se pueden utilizar
distintos métodos, como tablas de números aleatorios, sistemas de lotería o
cualquier otro sistema que se ajuste a las leyes del azar.
En la práctica, a menos que se trate de poblaciones pequeñas o de estructura muy
simple, es difícil aplicar este tipo de muestreo de forma eficaz.
Muestreo aleatorio sistemático
Es una variable sencilla del muestreo aleatorio simple, que parte también de la lista
total de la población, pero, en lugar de extraer n números aleatorios, sólo se extrae
uno y, a partir de ahí, se va n seleccionando los demás elementos a intervalos fijos
(5, 1O, 15 ... ), siendo el tamaño de este intervalo el resultado de dividir el tamaño de
la población entre el tamaño de la muestra.

Muestreo aleatorio estratificado


En ocasiones, especialmente cuando las poblaciones son muy grandes, interesa
dividir éstas en subpoblaciones o estratos en virtud de determinadas características
(edad, sexo, estado civil. .. ), de manera que al dividir a esta población no
homogénea en dos o más estratos, consegu imos que se convierta e n homogénea
en cada estrato o subgrupo. A continuación se eligen en cada estrato las personas
que formarán la muestra por el método aleatorio simple. Este sistema tiene la
ventaja de que permite mayor profundización y mayor precisión en e l análisis de
cada estrato. Además, permite que en cada estrato se puedan utilizar diferentes
sistemas para la selección de los sujetos.
El muestreo estratificado puede ser proporcional o no proporcional. En el muestreo
proporcional, el tamaño de la muestra en cada estrato es proporcional al número de
individuos que existen en los estratos con relación al total de la población. En e l
muestreo estratificado no proporcional, a cada estrato le corresponde igual número
de elementos muestrales.

Muestreo aleatorio por conglomerados


En los métodos anteriores, se seleccionan directamente los elementos de la
población, es decir, la_s unidades muestrales son los elementos de la población
(individuos). En el muestreo por conglomerados, la unidad muestra! es un grupo de
ele mentos de la población que forman una unidad, a la que llamamos conglomerado
(bloques de viviendas, municipios, hospitales ... ). Este procedimiento consiste en
seleccionar aleatoriamente los conglomerados necesarios para alcanzar el tamaño
(}

de la muestra, que quedará compuesta por todos los elementos pertenecientes a


los conglomerados elegidos.

Muestreo no aleatorio
En el muestreo no aleatorio o no probabilístico los sujetos se seleccionan siguiendo
determinados criterios, de manera que no todos los elementos de la población
tienen la misma probabilidad de figurar en la muestra. Este tipo de muestreo sólo
es justificable en determinados casos, por ejemplo, en estudios exploratorios, donde
un muestreo aleatorio puede resultar difícil o excesivamente costoso.

Muestreo no aleatorio accidental o incidental


Se basa en el empleo para la muestra de aquellos sujetos a los que se tiene fácil
acceso, con los que puede contarse más fácilmente o con mayor comodidad. Un
caso particular que puede incluirse en esta categoría es el de los sujetos voluntarios.

,<, Muestreo no aleatorio intencionado

-
Se caracteriza por la inclusión deliberada en la muestra de aquellos elementos
cuyas características son similares a las de la población elegida, en un esfuerzo por
obtener muestras supuestamente representativas. Es decir, el investigador
selecciona los elementos que a su juicio son representativos, lo que exige un
conocimiento previo de la población que se investiga. Este tipo de muestreo es
frecuentemente utilizado en estudios cualitativos.

Muestreo no aleatorio por cuotas


Es un tipo de muestreo semejante al muestreo aleatorio estratificado, pero sin tener
su característica de a leatoriedad. También aquí se divide a la población en estratos
o sub- poblaciones homogéneas y dentro de cada estrato se fija una "cuota" o
número de individuos, que son seleccionados de forma accidental.
u~ ""~
}:riables
Una variable es una característica, una propiedad o un atributo de una persona o
un objeto, susceptible de asumir diferentes valores (que pueden medirse) en los
diferentes sujetos. El concepto de variable se opone al de constante, que sería aquel
atributo que únicamente puede tomar un valor para todos los sujetos.
V- In ",.,
'(~ ~ificación de las variables
Clasificación de las variables
•:• Con arreglo a las relaciones establecidas en el estudio:
_ • Variable dependiente: Es la de interés principal. Representa al desenlace o
resultado que se pretende explicar o estimar en el estudio.
• Variable independiente: Define la condición bajo la cual se examina a la
varia ble dependiente. Puede, en detenninado estudio, no existir variable
independiente.
• Variable de confusión : Actúan como cofactores que modifican a la variable
independiente. De no considerarse adecuadamente pueden sesgar los
resultados. Estadísticamente suelen tratarse a través del ajuste de datos y de
métodos multivariantes.

Ejemplo: Un investigador quiere conocer si existe relación entre el sexo y la


severidad del daño renal en los pacientes diabéticos. Para ello toma dos grupos,
uno de hombres y otro de mujeres diabéticas, y evalúa en cada grupo la función
renal.
En este caso la función renal es el desenlace que se pretende medir, por tanto es
la variable dependiente, mientras que el sexo define las condiciones bajo las cuales
se examina, o sea, la variable independiente.

Sin embargo, como se sabe, el tipo de diabetes y el tiempo de evolución de la


enfennedad tienen importante influencia sobre el desarrollo del daño renal,
(variables de confusión), por lo que estos factores deben ser tomados en
consideración al conformar los grupos y al realizar el análisis estadístico, de lo
contrario se podrían sesgar los resultados.

•:• Con arreglo al tipo de datos que constituyen la medición de la variable:


• Variable Cuantitativa: Es la variable que representa a una característica. o
propiedad del objeto de estudio que se refiere a cantidades , por lo que puede
ser medida directamente en la práctica.
• Variable cuantitativa continua: Al tomar valores, estos pueden ser
representados con números enteros o fraccionarios, ya que entre dos va lores
cualquiera pueden existir un número infinitos de valores intermedios. Los datos
que constituyen la cuantificación de este tipo de variable se generan al efectuar
operaciones de medición. Los mismos se miden en escalas constituidas por
un intervalo constante o uniforme entre mediciones consecutivas,
denominadas: Escala de Razón y Escala de Intervalo.

Son ejemplos de este tipo de variable: la glicemia y el colesterol sérico.


• Variable cuantitativa discreta: Son las que al tomar valores, estos solamente
pueden ser representados con números enteros ya que los datos se generan al
efectuar operaciones de conteo . Al igual que en las variables continuas, aquí
los datos se miden en Escala de Razón o de Intervalo. Ejemplos: el número de
hijos, edad cuando se expresa en años cumplidos.
• Variable Cualitativa: Es la variable que representa a una propiedad que hace
referencia a cualidades del objeto de estudio, que no pueden ser cuantificadas
directamente en la práctica, como es el caso del sexo y la ocupación .
0 riable Cualitativa Ordinal Politómica: La variable puede tomar tres o más
valores posibles, los cuales pueden ser ordenados siguiendo un criterio
establecido por una Escala Ordinal, la cual se caracteriza porque no es preciso
que el intervalo entre mediciones consecutivas sea uniforme.

Un ejemplo característico de este tipo de variable es el Estadio de la Enfermedad,


en el cual se clasifica a una entidad nosológica determinada en estadios que
O];:;,

generalmente van del I al IV, donde cada uno representa un grado más avanzado
de la enfermedad que el estadio precedente, pero no podemos afirmar que la
diferencia entre el Estadio II y el 111 sea igual que la que existe entre el III y el IV. El
Nivel de Conocimientos, también constituye una variable ordinal politómica.
'J Variable Cualitativa Ordinal Dicotómica: La variable solo puede tomar dos
valores posibles, pero entre estos se puede establecer un criterio de orden
porque uno representa ventaja o superioridad sobre el otro. Ejemplo: Vivo-
Fallecido; Eutrófico-Distrófico.
Variable Cualitativa Nominal: Este tipo de variable se caracteriza porque los
valores que toma no pueden ser sometidos a un criterio de orden. Ejemplos
la raza y el sexo. Puede ser clasificada igualmente en politómica y
dicotómica.

Los cuatro tipos de variables antes descritas: continuas, discretas, ordinales y


nominales, contienen una cantidad relativa de información que va decreciendo en
el mismo orden en que han sido mencionadas.
Un tipo de variable puede ser transformada en otra de menos nivel de información,
es decir, las mediciones de una variable determinada pueden ser clasificadas
I
posteriormente en 'Una escala de nivel inferior. Desde luego que esto provoca
pérdida de información y reducción de la potencia estadística.
Ejemplo: El hábito de fumar puede ser medido inicialmente como una variable
discreta sobre la base del número específico de cigarrillos que el individuo fuma
diariamente, pero ello puede ser transformado en u ariable ordinafp"olitóm" a
si se consideran a los fumadores como: Ligeros.- los que fuman menos de 1O
cigarrillos al día; Moderados.- los que fuman entre 1 O y 20 cigarrillos diarios, e
Intensos.- aquellos que fuman más de 20 cigarrillos al día.
Puede también transformarse en una variable ordinal dicotómica si se limita a
considerar a los individuos en Fumadores y No fumadores .
Lo que nunca podrá hacerse es transformar un tipo de variable en otro tipo que
contiene un nivel de información superior al nivel en que fue medida inicialmente.
Es importante destacar en este momento que cua lquiera que sea la escala de
clasificación esta debe cumplir dos requ isitos esenciales:
1. Exhaustiva: Debe permitir la clasificación de cualquier individuo que se estudie.
2. Excluyente: Debe constar de clases o subdivisiones mutuamente excluyentes,
en las que solo se cuente a cada individuo una vez.
Todo individuo que se presente en el estud io pertenecerá a una clase y solo a una,
dicho de otro modo, tiene que pertenecer a una clase en concreto y a ninguna otra.
Si por ejemplo se establece la sigu iente escala de clasificación para la edad: 20- 40;
40-60; 60-80. Si un individuo tiene cuarenta años de edad podría ser incluido tanto
en la clase de 20-40 como en el de 40-60 por lo que esta esca la no tiene carácter
excluyente además a los mayores de 80 años no sería posible clasificarlos. Pa ra
satisfacer estos requerimientos la esca la debió diseñarse como sigue: 20-39; 40-
59; 60-79; 80 y más.
Resumiendo lo referente a la clasificación de las va riables se presenta la siguiente
tabla:
Entre dos valores enteros
consecutivos, existen infinitos
valores intermedios .
Cuantitativas . Ej: Glicemia y Colesterol séric . efU-o } .... V·~ ~ h
1--~......,_---- -- - -- - -- ------,~ '-'- c:r- ~ <-, 2,l ~
Se Tornan valores enteros.
Ej: número de hijos y edad en años
t-? ,
umplidos.
Llevan implícito diferencias de
mag nitud e intensidad entre sus
Variables Ordinales categorías.
Cualitativas Ej: Estadio de una enfermedad, Nivel
, /\J O rv,J,-..cr,'o,.
No pueden ser de [Link] ... { ~ s. J....~~
~
cuantificadas Los valores no pueden ser sometidos --- - ·-~
,;.~":> s;

Nn f"-:v- ~ a un criterio de orden


~ ·~) 1 rv-,....-
Nominales Ej : Raza y Estado Civil (Politómicas);
"'t-z.J.... ~ .... <.....
Sexo (d icotómica). ::.~
Métodos e instrumentos de recolección de datos
La recogida de la información constituye un paso importante, pues solamente si los
datos recopilados están exentos de errores, las conclusiones que de ellos se deriven
tendrán validez científica.
La recolección se inicia desde el momento mismo en que se planifica la
investigación y se le concede especial importancia a:
• el enfoque que se hace del problema.
• el tipo de estudio.
• los objetivos trazados.
• las variables estudiadas.

El investigador utiliza diferentes mecanismos para recolectar y registrar la


información, los cuales se conocen como instrumentos para la recogida de los
datos. Debe hacerse referencia a ellos en el método e incluirse en los anexos.
Para decidir sobre los instrumentos a utilizar a la hora de acotar la información , es
muy importante identificar prirnero el origen de las fuentes, a través de las cuales el
investigador obtendrá los datos necesarios sobre el sujeto u objeto de estudio en
cuestión .
Es importante señalar que en el caso de utilizar instrumentos primarios que
requieran validación (encuestas, formularios de preguntas u otros instrumentos), se
debe recoger como se realizó la misma o si el instrumento estaba previamente
validado.

Fuente primaria:
Aquella de la que el investigador obtiene directamente la información utilizando
diversas técnicas y métodos. Ej. Observación, entrevista y cuestionario, entre otros.
Fuente secundaria:
Aquella que existe independientemente del estudio y el investigador solo la utiliza.
Ej. Registro de nacimiento, historias clínicas, entre otros.
UNIDAD 2
Estadística descriptiva. Medidas de tendencia central : media, moda, mediana,
frecuencia (absoluta, relativa, acumulada y porcentual ). Medidas de dispersión:
varianza y desviación estándar. Intervalo de confianza. Intervalos y clases, rangos,
cuartiles y percentiles.

Medidas de una variable cuantitativa


Como se ha comentado , para hacer manejable la masa de datos procedentes de la
observación estadística, es necesario reducir el volumen de los datos; hemos visto
que esto se puede conseguir construyendo la tabla de distribución de frecuencias.
En el caso de las variables cuantitativas , es posible reducir aún más estas
distribuciones, valiéndonos de unos pocos números que describan o caractericen a
las distribuciones de frecuencias. Estos números, que reciben el nombre de
características, nos indican los rasgos más importantes de las distribuciones
de frecuencia s y se suelen clasificar en los siguientes grupos:
l. Medidas de posición. Estos a su vez se dividen en:
Centrales: media aritmética, mediana y moda.
No centrales: cuantiles.
2. Medidas de dispersión.
3. Medidas de asimetría.
4. Medidas de apuntamiento.

Medidas de posición
Las medidas de posición, son unos valores alrededor de los cuales se agrupan los
valores de la variable, y que nos resumen la posición de la distribución sobre el eje
horizontal.
Existen dos tipos de medidas de posición: las centrales y las no centrales.
De las medidas de posición central o promedios, las más utilizadas son: la media
aritmética, la mediana y la moda.
Las medidas de posición no central son los cuantiles.
La media aritmética
La media aritmética: se define como la suma de todos los valores observados de la
distribución, dividida por el número total de observaciones.
Si agrupamos los valores que se repiten, la expresión de la media es:

Este es el promedio más utilizado en la práctica y esto es así por las ventajas que
tiene y que son fundamentalmente :
• Tiene en cuenta todos los valores observados.
• Es fácil de calcular y ·tiene un claro significado estadístico. Es única.
Por otra parte tiene el inconveniente de la influencia que ejercen los valores
extremos de la distribución sobre ella.

La moda
En una distribución, la moda (Mo) se define como aquel valor de la variable cuya
frecuencia no es superada por la frecuencia de ningún otro valor. Esta definición
corresponde a la denominada moda absoluta. La moda relativa se define como el
valor de la variable cuya frecuencia no es superada por la de sus valores contiguos.
Puede darse el caso de que la máxima frecuencia corresponda a dos o más valores
de la variable , en ese caso las distribuciones reciben el nombre de bimodales o
multimodales.

/ ~ .<"Í·, ./f\
,r, __....,. 1 \
/ ¡ / j ' ••/ 1 \

/ 1 \ / 1 1 \

M oda absoL'ta !\~cdri }..IJua,, ~ i:h~,


rtib:1\,i, ~ i U:.á bi,ll'.X!.i:.

En una distribución no agrupada en intervalos, la determinación de la moda absoluta


y las modas relativas es inmediata.
En una distribución agrupada en intervalos la determinación con exactitud de la
moda es imposible, por lo que se suelen hacer algunas suposiciones para poder
calcular este valor.
Un criterio válido es tomar como moda la marca de clase del intervalo modal,
entonces, para calcular la moda hay que hacer lo siguiente:
1. Determinar cuál es el intervalo modal. El intervalo modal es aquel que tiene
mayor densidad de frecuencia (en el caso de que todos los intervalos tengan
la misma amplitud coincide con el intervalo en el que hay mayor frecuencia
absoluta).
2. La moda será, entonces, la marca de clase de este intervalo.

La mediana
Para una distribución discreta no agrupada en intervalos, se define la mediana
(Me), como el valor de la variable que ocupa el lugar central, supuestos ordenados
los valores de menor a mayor. También se puede definir como el va lor de la variable
que divide a la distribución en dos partes con el mismo número de observaciones.
Si el número de observaciones es impar, entonces el valor de la mediana es
inmediato (el valor que ocupe el lugar (N + 1)/2).
Si el número de datos es par, suele tomarse como valor de la mediana, la
media aritmética de los dos valores centrales, es decir, de los que ocupan los
lugares N/2 y (N/2 + 1).
Naturalmente cuando estos dos valores son iguales, la mediana coincide con el
valor común .
En el supuesto de una distribución agrupada en intervalos, la mediana será
alguno de los valores contenidos en el intervalo al que corresponda una frecuencia
acumulada inmediatamente superior a N/2 ; el cual se denomina intervalo
mediano.
No podemos determinar exactamente cuál de los va lores del intervalo es la
mediana, y se pueden seguir varios criterios para elegir uno de ellos. Por simplificar
nosotros tomaremos como mediana, la marca de clase del intervalo mediano.

Propiedad:
La mediana no depende de los valores extremos y por tanto, puede calcularse
aún cuando estos se desconozcan; basta con conocer su frecuencia.
Medidas de dispersión
Las medidas de tendencia central ofrecen una idea aproximada del
comportamiento de una serie estadística . No obstante, no resultan suficientes para
expresar sus características: una misma media puede provenir de valores
cercanos a la misma o resultar de la confl uencia de datos estadísticos
enormemente dispares. Para conocer en que grado las medidas de tendencia
central son representativas de la serie, se han de complementar con medidas de
dispersión como la va rianza o la desviación típica.

Concentración y dispersión
Las medidas de centralización ayudan a determinar el «centro de gravedad)) de una
distribución estadística. Para describir el comportamiento general de la serie se
necesita, sin embargo, una información complementaria para saber si los datos
están dispersos o agrupados.
Así, las medidas de dispersión pueden definirse como los valores numéricos cuyo
objeto es analizar el grado de separación de los valores de una serie estadística con
respecto a las medidas de tendencia central consideradas.
Las medidas de dispersión son de dos tipos :
• Medidas de dispersión absoluta: como recorrido, desviación media,
varianza y desviación típica, que se usan en los análisis estad ísticos generales.
• Medidas de dispersión relativa: que determinan la dispersión de la
distribución estadística independientemente de las unidades en que se exprese la
variable. Se trata de parámetros más técnicos y utilizados en estudios específicos,
y entre ellas se encuentran los coeficientes de apertura, el recorrido relativo , el
coeficiente de variación (índ ice de dispersión de Pearson) y el índice de dispersión
mediana.
X - 2cr X + cr X X + cr X + 2CJ
La distribución normal, o campana de Gauss, es una función simétrica (con la media
aritmética en el centro de la serie) con un grado de dispersión bajo (la mayoría de
los valores están comprendidos dentro del valor de la desviación típica).

Recorrido
La medida de dispersión más inmed iata es el recorrido de la distribución
estadística, también llamado rango o amplitud. Dada una serie de valores x1, x2,
... , Xn, su recorrido es la diferencia aritmética entre el máximo y el mínimo de estos

valores:

Re = Xi (max) - X¡ (min). siendo i = 1. 2..... li .

Desviación media
Como medida de dispersión más frecuentemente utilizada , la desviación media
se define como la media aritmética de los valores absolutos de la desviación de
cada valor de la variable con respecto a la media. Su formu lación matemática es la
siguiente:

f1 iX ¡ - X! + f 2 ¡ X2 - Xi + .. + [ 1 X 11 - X1
DM=--- - - - - - - - -- - - - -- 11

f1 + f2 + .. . + fn
~ f; lx1- xi
- - - - - co n i = l ~2. 3, ~~ -, 1J.
:::= ri

Varianza y desviación típica


La desviación media no siempre suministra una idea clara del grado de separación
entre los valores de una variable estadística. Para estudios científicos , se prefiere
utilizar una pareja de parámetros relacionados que se conocen como varianza y
desviación típica.
La varianza se define como el cociente entre la suma de los cuadrados de las
desviaciones de los valores de la variable y el número de datos del estudio.
Matemáticamente, se expresa como:

'.\ ' -- f1 (X¡ - X)"+ f 2{X2 -x)2 + .. , + Í11 (X11 - XJ 2


f1 + fz + ... + f11
'' f (
,_ 1 , X 1 -
-XI z .- 1 ? 3
- - - - - con J - . - · . .... Jl.
:_: f1

Por su parte, la desviación típica , simbolizada por s, se define sencillamente como


la raíz cuadrada de la varianza:
(1 = \ 1\ .'
Por lo tanto, se tiene que:
-
~f;(X¡ - X) 2
G =
\ ~f¡

La varianza y la desviación típica, cada una con su respectivo valor, se usan


indistintamente en los estudios estadísticos.

~ Distintos Tipos de Frecuencia:


¡- :Una de los primeros pasos que se realizan en cualquier estudio estad1st1co es la
tabulación de resultados, es decir, recoger la información de la muestra resumida
en una tabla en la que a cada valor de la variable se le asocian determinados
números que representan el número de veces que ha aparecido, su proporción con
respecto a otros valores de la variable, etc. Estos números se denominan
frecuencias : Así tenemos los siguientes tipos de frecuencia:

~ Frecuencia absoluta:
La frecuencia absoluta de una variable estadística es el número de veces que
aparece en la muestra dicho va lor de la variable, la representaremos por n ;
¡<J Frecuencia relativa:
La frecuencia absoluta, es una medida que está influida por el tamaño de la muestra,
al aumentar el tamaño de la muestra aumentará también el tamaño de la frecuencia
absoluta. Esto hace que no sea una medida útil para poder comparar. Para esto es
necesario introducir el concepto de frecuencia relativa , que es el cociente entre la
frecuencia absoluta y el tamaño de la muestra. La denotaremos por f ¡

Donde N = Tamaño de la muestra

'(. Frecuencia Absoluta Acumulada:


Para poder calcular este tipo de frecuencias hay que tener en cuenta que la variable
estadística ha de ser cuantitativa o cualitativa ordenable. En otro caso no tiene
mucho sentido el cálculo de esta frecuencia. La frecuencia absoluta acumulada d.e
un valor de la variable, es el número de veces que ha aparecido en la muestra un
valor menor o igual que el de la variable y lo representaremos por N ¡.

~ Frecuencia Relativa Acumulada:

Al igual que en el caso anterior la frecuencia relativa acumulada es la frecuencia


absoluta acumulada dividido por el tamaño de la muestra, y la denotaremos por F ¡

~ Porcentaje Acumulado:
Análogamente se define el Porcentaje Acumulado y lo vamos a denotar por P ¡ como
la frecuencia relativa acumulada multiplicada por 1OO.

Ejemplo :
Cuando se manejan conjuntos extensos de datos, el proced imiento preliminar más
adecuado consiste en distribuirlos en clases o categorías de acuerdo con el
número de casos que pertenecen a cada una de dichas clases.
Por ejemplo, se quiere estudiar el puntaje que alcanzan los alumnos universitarios
en la asignatura de Educación Física. La escala de notas va del 0% al 100%,
obteniéndose la sigu iente colección de valores:
75- 82 - 68 - 90 · 62 - 88 - 88 - 73
60- 93 - 71 - 59 - 75 - 87 - 74 - 62
95- 78 - 82 - 75 - 94 - 77 - 69 - 74
89- 83 - 75 - 95 - 60 - 79 - 97 - 97
78- 85 - 76 - 65 - 73 - 67 - 88 - 78
62- 76 - 73 - 81 - 72 - 63 - 76 - 75
Para facilitar el análisis de los datos, éstos se ordenan en forma creciente , es decir,
de menor a mayor (también puede ordenarse en forma decreciente).
El modo más sencillo de agrupar los datos, es mediante una tabla de datos, que
indique, para cada uno de los valores de la colección , el número de veces que
aparece, es decir, su frecuencia de aparición.

Distribuciones de frecuencia
Frecuencia absoluta (n 1) : corresponde al número de veces que se observa dicho
va lor, o en otras palabras al número de veces que se presenta un cierto dato.
Para agrupar los datos por su frecuencia, se deben seguir los siguientes pasos:
1) Se ordenan los datos en orden creciente o decreciente.
2) Se cuenta la frecuencia absoluta de cada valor (cuántas veces se repite cada
magnitud)
De acuerdo a los datos anteriores, se observa que el número menor es 59 y el
número mayor es 97.
Puntaje Frecuencia absoluta (n 1)
59 1
60 2
61 o
62 3
63 1
64 o
65 1
66 o
67 1
68 1
69 1
70 o
71 1
72 1
73 3
74 2
75 5
76 3
77 1
78 3
79 1
80 o
81 1
82 2
83 1
84 o
85 1
86 o
87 1
88 3
89 1
90 1
91 o
92 o
93 1
94 1
95 2
96 o
97 2
Frecuencia total (N) 48

La Tabla de distribución de frecuencias hecha anteriormente sirve para facilitar


el estudio de los valores estadísticos. El puntaje corresponde a la va riable
estadística (primera columna) y las veces que se repite la variable (seg unda
columna), a la frecuencia absoluta.

Frecuencia total (F): corresponde la suma de las frecuencias absolutas de cada


uno de los valores de la variable.
Una vez que se ha construido la Tabla de distribución de frecuencias, ésta debe
ampliarse con otras tres columnas más, que corresponderán a la frecuencia
absoluta acumulada, frecuencia relativa y frecuencia porcentual.

Frecuencia absoluta Acumulada ( N ;) : es la suma de las frecuencias absolutas


de cada intervalo. La frecuencia acumulada hasta el último intervalo es igual a la
frecuencia total de toda la distribución.
Si se amplía la Tabla de distribución del ejemplo, la frecuencia absoluta acumulada
se obtiene sumando el número que está escrito en una línea con el número de la
línea siguiente.

Frecuencia absoluta '


Puntaje Frecuencia absoluta ( n ;)
acumulada ( N ;)
1
59 1 1
60 2 3
61 o 3
62 3 6
63 1 7
64 o 7
65 1 8
66 o 8
67 1 9
68 1 10
69 1 11
70 o 11
71 1 12
72 1 13
73 3 16
74 2 18
75 5 23
76 3 26
77 1 27
78 3 30
79 1 31
80 o 31
81 1 32
82 2 34
83 1 35
84 o 35
85 1 36
86 o 36
87 1 37
88 3 40
89 1 41
90 1 42
91 o 42
92 o 42
93 1 43
94 1 44

95 2 46

96 o 46
97 2 48
Frecuencia
(N) 48
total

La frecuencia absoluta acumulada sirve para responder, por ejemplo, la siguiente


pregunta: ¿Cuántos alumnos obtuvieron nota inferior a 80?; la respuesta es 31
alumnos.

Frecuencia relativa ( f ;) : >corresponde a la razón (división) entre la frecuencia


absoluta (n ¡) y el número total (N) de individu os de la población.

Frecuencia
Frecuencia absoluta Frecuencia relativa
Puntaje absoluta
( n ;) ( f ;)
acumulada ( N;)
59 1 1 0,02083 (1 : 48 )
60 2 3 0,0416 (2 : 48)
61 o 3 o
62 3 6 0,0625
63 1 7 0,02083
64 o 7 o
65 1 8 0,02083
66 o 8 o
67 1 9 0,02083
68 1 10 0,02083
69 1 11 0,02083
70 o 11 o
71 1 12 0,02083
72 1 13 0,02083
73 3 16 0,0625
74 2 18 0,0416
75 5 23 o,10416
76 3 26 0,0625
77 1 27 0,02083
78 3 30 0,0625
79 1 31 0,02083
80 o 31 o
81 1 32 0,02083
82 2 34 0,0416
83 1 35 0,02083
84 o 35 o
85 1 36 0,02083
86 o 36 o
87 1 37 0,02083
88 3 40 0,0625
89 1 41 0,02083
90 1 42 0,02083
91 o 42 o
92 o 42 o
93 1 43 0,02083
94 1 44 0,02083
95 2 46 0,0416
96 o 46 o
97 2 48 0,0416
)

Frecuencia 1
(N) 48 1
total

La suma de las frecuencias relativas es 1

Frecuencia relativa porcentual: es la frecuencia relativa expresada en porcentajes


(%)
f;
P ;= - • 100
N

Puntaje (ni) (Ni) (fi) % (pi %)


59 1 1 I0,02083 (1 : 48) 2 ,083
60 2 3 0,0416 (2 : 4 8) 4 ,16
61 o 3 o o
62 3 6 0 ,0625 6 ,25
63 1 7 0,02083 2 ,083
64 o 7 o o
65 1 8 0,02083 2 ,083
66 o 8 o o
67 1 9 0 ,02083 2 ,083
68 1 10 0,02083 2 ,083
69 1 11 0,02083 2 ,083
70 o 11 o o
71 1 12 0 ,02083 2 ,083
72 1 13 0,02083 2 ,083
73 3 16 0,0625 6 ,25
74 2 18 0 ,0416 4,16
75 5 23 O, 1041 6 10,416
76 3 26 0 ,0625 6,25
77 1 27 0, 02083 2 ,083
78 3 30 0 ,0625 6,25
79 1 31 0,02083 2 ,083
80 o 31 o o
81 1 32 0,02083 2,083
82 2 34 0,0416 4 , 16
83 1 35 0 ,02083 2,083
84 o 35 o o
85 1 36 0,02083 2,083
86 o 36 o o
87 1 37 0,02083 2 ,083
88 3 40 0,0625 6,25
89 1 41 0,02083 2 ,083
90 1 42 0,02083 2 ,083
91 o 42 o o
92 o 42 o o
93 1 43 0,0208 3 2 ,083
94 1 44 0,02083 2 ,083
95 2 46 0, 0416 4 , 16

96 o 46 o o
97 2 48 0,0416 4,1 6
Frecuencia total (N) 48 1 100 %

Rango:
El rango, también conocido como recorrido es la diferencia entre el valor más alto y
el más bajo de un conjunto de datos. En cierto modo, se puede considerar que es
el mismo concepto que el dominio de una función continua.
Corresponde a la diferencia (resta ) entre el mayor y el menor de los datos

En el ejemplo anterior el rango de los datos es:


Rango: 97- 59 = 38
Cuantiles
Los cuantiles son medidas de posición q ue se determinan mediante un método que
determina la ubicación de los valores q ue dividen un conjunto de observaciones en
partes ig uales.
Los cuantiles son los valores de la distribución q ue la dividen en partes iguales, es
decir, en intervalos que comprenden el mismo número de valores. Cuando la
distribución contiene un número alto de intervalos o de marcas y se requiere obtener
un promedio de una parte de ella, se puede dividir la distribución en cuatro, en diez
o en cien partes.
Los más usados son los cuartiles , cuando dividen la distribución en cuatro partes;
los deciles, cuando dividen la distribución en diez partes y los centiles o percentiles,
cuando dividen la distribución en cien partes. Los cuartiles, como los deciles y los
percentiles, son en cierta forma una extensión de la mediana.

Para algunos valores u, se dan nombres particulares a los cuantiles, Q (u):

u Q(u)
0.5 Mediana
0.25, 0.75 Cuartiles
0.1, ... , 0.99 Deciles
0.01, ... , 0.99 Gentiles

CUARTILES
Los cua rtiles son los tres valores que dividen al conjunto de datos ordenados en
cuatro partes porcentualmente iguales.
Hay tres cuarti les denotados usualmente 01, 02, Q3. El segundo cuartil es
precisamente la mediana. El primer cuartil , es el valor en el cual o por debajo del
cual queda un cuarto (25%) de todos los valores de la sucesión (ordenada ); el tercer
cuartil, es el valor en el cual o por debajo del cual quedan las tres cuartas partes
(75%) de los datos.
Datos Agrupados

Qk = Lk +
k( )-F
11

4 k *e
fk
Como los cuartiles adquieren su mayor importancia cuando contamos un número
grande de datos y tenemos en cuenta que en estos casos genera lmente los datos
son resumidos en una tabla de frecuencia. La fórmula para el cá lculo de los cuartiles
cuando se trata de datos agrupados es la siguiente:

Ir- 1,2,3

Donde:
Lk =Límite real inferior de la clase del cuartil k
n = Número de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del cuartil k.
fk = Frecuencia de la clase del cuartil k

e= Longitud del inteNa lo de la clase del cuartil k

Si se desea calcular cada cuartil individualmente, mediante otra fórmula se tiene lo


siguiente:
• El primer cuartil Q1, es el menor valor que es mayor que una cuarta parte de los
datos; es decir, aquel va lor de la variable que supera 25% de las obseNaciones y
es superado por el 75% de las observaciones.

Fórmula de Q1, para series de Datos agrupados:


P- r n
=l. + Ja -l*J P= -
º 1 z Ji e 4

Donde:
L1 = limite inferior de la clase que lo contiene
P = valor que representa la posición de la medida
f1 = la frecuencia de la clase que contiene la medida solicitada.
Fa-1 = frecuencia acum ulada anterior a la que contiene la medida solicitada.
le = intervalo de clase

• El segundo cuartil 02, (coincide, es idéntico o similar a la mediana, Q2 = Md), es


el menor valor que es mayor que la mitad de los datos, es decir el 50 % de las
observaciones son mayores que la mediana y el 50% son menores.

Fórmula de Q2, para series de Datos agrupados:

Q = l. + P-fa- 1 * ¡ P= 2n
4
1 1 Íi e

Donde:
L 1 = limite inferior de la clase que lo contiene
P = valor que representa la posición de la medida
f1 = la frecuencia de la clase que contiene la medida solicitada.
Fa-1 = frecuencia acum ulada anterior a la que contiene la medida solicitada.
le = intervalo de clase

• El tercer cuartil Q3, es el menor valor que es mayor que tres cuartas partes de
los datos, es decir aquel valor de la variable que supera al 75% y es superado por
el 25% de las observaciones.

Fórmula de Q3, para series de Datos agrupados:

Q =l. +
P- f a- 1 *J
P = 3n
1 1 Íi e
4

Donde:
L1 = limite inferior de la clase que lo contiene
P= valor que representa la posición de la medida
f1 = la frecuencia de la clase que contiene la medida solicitada.
Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada.
le= intervalo de clase .

Otra manera de verlo es partir de que todas las medidas no son sino casos
particulares del percentil, ya que el primer cuartil es el 25% percentil y el tercer cuartil
75% percentil.

Para Datos No Agrupados


Si se tienen una serie de va lores X 1, X2, X3 ... X n, se loca liza mediante las
siguientes fórmula s:
- El primer cuartil:
Cuando n es par:
1* n
4

Cuando n es impar:
l (n + 1)
4

- Para el tercer cuartil


Cuando n es par:
3*n
4

Cuando n es impar:
3(n + 1)
4
DECILES
Los deciles son ciertos números que dividen la sucesión de datos ordenados en
diez partes porcentualmente iguales. Son los nueve valores que dividen al conjunto
de datos ordenados en diez partes iguales, son también un caso particular de los
percenti les. Los deciles se denotan 01, 02, ..., 09, que se leen primer decil, segundo
decil, etc.
Los deciles, al igual que los cuartiles, son ampliamente utilizados para fijar el
aprovecham iento académico.

Datos Agrupados
Para datos agrupados los deciles se calculan mediante la fórmula.

k= 1,2,3, ... 9

Donde:
Lk = Límite real inferior de la clase del decil k
n = Número de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k.
fk = Frecuencia de la clase del decil k
e = Longitud del intervalo de la clase del decil k

Otra fórmula para calcular los deciles:


• El cuarto decil, es aquel valor de la variable que supera al 40% , de las
observaciones y es superado por el 60% de las observaciones .

D =l . +
P - J,a-i * I P= 4n
4 , Ji e JO

• El quinto decil corresponde a la mediana.


P = 5n
D =l. + P - Ía-1 * I
5 1 J; e 10

• El noveno decil supera al 90% y es superado por el 10% restante .

P = 9n
10

D = l. + p - Ía-1* I
9 i J; e

Donde (para todos):


L1 = limite inferior de la clase que lo contiene
P = valor que representa la posición de la m ed ida
f1 =la frecuencia de la clase que contiene la medida solicitada .
Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada.
le= intervalo de clase.

Fórmulas Datos No Agrupados


Si se tienen una serie de valores X 1, X2, X3 ... Xn, se localiza mediante las
siguientes fórmulas:
A*n
10
Cuando n es par:

A(n + l)
10
Cuando n es impar:

Siendo A el número del decil.


CENTILES O PERCENTILES
Los percentiles son, tal vez, las medidas más utilizadas para propósitos de ubicación
o clasificación de las personas cuando atienden características tales como peso,
estatura, etc.
Los percentiles son ciertos números que dividen la sucesión de datos ordenados en
cien partes porcentualmente iguales. Estos son los 99 valores que dividen en cien
partes iguales el conjunto de datos ordenados. Los percentiles (P1 , P2, ... P99),
leídos primer percentil,... , percentil 99.

Datos Agrupados
Cuando los datos están agrupados en una tabla de frecuencias , se calculan
mediante la fórmula:

k= 1,2,3,... 99

Donde:
Lk = Límite real inferior de la clase del decil k
n = Número de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k.
fk = Frecuencia de la clase del decil k
e = Longitud del intervalo de la clase del decil k

Otra forma para calcular los percentiles es:


- Primer percentil, que supera al uno por ciento de los va lores y es superado por
el noventa y nueve por ciento restante.

P=~
100
P. = l. + P - Í a-1 *¡
l , J; e

- El 60 percentil, es aquel valor de la variable que supera al 60% de las


observaciones y es superado por el 40% de las observaciones.

P. = l. + P - Jra-1 * ¡ P = 60n
60 1 J; e 100

P- r p = 99n
p = l. +
99 , J;J a-1 * I e 100

- El percenti l 99 supera 99% de los datos y es superado a su vez por el 1%


restante.

Fórmulas Datos No Agrupados


Si se tienen una serie de valores X 1, X2 , X3 ... Xn, se loca liza mediante las
siguientes fórmulas:
Para los percentiles, cuando n es par:
A*n
10

A(n + 1)
100
Cuando n es impar:

Siendo A, el número del percentil.

Es fácil ver que el primer cuartil coincide con el percentil 25; el segundo cuartil con
el percentil 50 y el tercer cuartil con el percentil 75.
EJEMPLO
Determinación del primer cuartil, el séptimo decil y el 30 percentil, de la siguiente
tabla:

Salarios No. De fa
( l. De Empleados
Clases) (f1)
200-299 85 85
300-299 90 175
400-499 120 295
500-599 70 365
600-699 62 427
700-800 36 463

Como son datos agrupados, se utiliza la fórmula

P- r
p =l. + J a- 1 * I
1 J; e

Siendo,
n
P=-
4
La posición del primer cuartil.

P= 7n
10

La posición del 7 decil.

P= 30n
100

La posición del percentil 30.


Entonces,
463 = 115 .5
4
El primer cuartil:
115.5-85 = 30.75

Li =300, le = 100 , fi = 90

30 75
Q1 = 300 + · * 100 = 334
90

El 7 decil:

7(463) = 3241 = 324.1


10 10
Posición:
324.1 - 295 = 29.1

Li= 500, fi = 70

29
D7 =500+ .1*100=541.57
70

El percentil 30
Posición:

30(463) = 13890 = 138.9


100 100

138.9 - 85 = 53.9
fi = 90

53 9
p30 = 300 + · *100 = 359.88
90

Estos resultados nos indican que el 25% de los empleados ganan salarios por
debajo de $ 334; que bajo 541.57 gana el 57%de los empleados y sobre $359.88,
gana el 70% de los empleados.
UNIDAD 3
Estadística demográfica. Tasas, Índices, Razones y Proporciones.

En la medición de sucesos de interés sanitarios la medida más básica para expresar


la frecuencia de una enfermedad es el número de personas que la padecen . Sin
embargo, dicha medida por sí sola carece de utilidad para determinar la importancia
de un problema de salud determinado, pues debe referirse siempre al tamaño de la
población de donde provienen los casos y al periodo de tiempo en el cual estos
fueron identificados. Para este propósito, suele trabajarse con diferentes tipos de
fracciones que permiten medir la frecuencia de una enfermedad y que
posterionnente nos permiten comparar los resultados de dos o más grupos de
individuos.

Para explicar estos conceptos de forma práctica se utilizarán datos sobre


tuberculosis (TBC) en el Principado de Asturias obtenidos del Informe
Epidemiológico del Principado de Asturias, 2005.
l1IC oor aruoo de edad y seHo. Asturias 2005 TBC. Casos y defunc ion es oor Qrupo de ed ad. Asturi.; s 2005
Grupo de edad Varón Mujer Grupo de edad Cas os Defunciones
0-4 o o 0-4 o o
5-14 3 o 5 -14 3 o
15-24 6 6 15-24 12 o
25·34 16 9 2 5 -34 25 o
35.44 25 8 35-44 33 o
45-54 13 7 45-54 20 o
55-64 12 6 55-64 18 2
65-74 29 6 65-74 35 1
75+ 31 11 75+ 42 5
Total 135 53 Total 188 8

RAZON
Es un cociente en el que el numerador no está incluido en el denominador. A
menudo las cantidades se miden en las mismas unidades, pero no es esencial. El
rango oscila entre O e infinito.
Ejemplos
Cociente entre el número de casos de TBC en varones y mujeres en 2005:
Razón= 135/53= 2,55
Cociente entre los casos de TBC ocurridos en individuos con edades superiores a
55 y el grupo de individuos con edades inferiores a 55 :
Razón=95/93=1 ,02

PROPORCION
Es un cociente en el que el numerador está incluido en el denominador. Una
proporción no es más que la expresión de la probabilidad de que un suceso ocurra.
El rango esta comprendido entre O y 1 o bien en términos porcentuales de 0% a
100%, y no tiene dimensión.
Ejemplos
Cociente entre el número de casos ocurridos en varones y el total de casos en el
año 2005.
135/188=0,72 El 72% de los casos han ocurrido en varones.
Cociente entre el número de casos ocurrido en individuos con más de 65 años y el
total de casos en el año 2005.
77/188=0,41 El 41 % de los casos se han detectado en personas mayores de 65
años.

TASA
Una tasa es un cuociente formado por tres elementos:
• El número de veces que ocurre un determinado fenómeno en un lugar y tiempo
determinado (numerador).
• Número de personas (población) expuesta al riesgo de que le suceda el
fenómeno del numerador.
• Una constante que multiplica al cuociente, que ayuda a la interpretación de la
tasa .
El numerador y el denominador deben coincidir en tres aspectos:
• Naturaleza del hecho: el conjunto de elementos del numerador forma parte de la
población que va en el denominador y por lo tanto se dice que son de la misma
naturaleza.
• Zona geográfica.
, Tiempo en que ocurre el hecho: las tasas generalmente se calculan para períodos
de un año. Como la población es variable durante el año, se considera como
población representativa del período a la población estimada al 30 de junio.

¿Qué mide una tasa?


Una tasa mide el riesgo de que a una determinada población le ocu rra un
determinado hecho.

Tipos de tasas
Se pueden separar en dos grandes grupos: crudas o brutas, y específicas.

Crudas o brutas son aquellas que tienen en el denominador a toda la población.

Específicas son las que en el denominador tienen una población específica , por
ejemplo: los menores de 15 años.
Ejemplos de tasas de mortalidad usadas en salud:

Tasa bruta de mortalidad


El numerador incluye todas las defunciones registradas durante un año ca lendario
en un área determinada. El denominador es la población total de esa área estimada
al 30 de junio del mismo año. Como siempre el denominador es mayor que el
numerador se hace necesario multiplicar el resultado por 1.000, de este modo la
tasa bruta de mortalidad se interpreta como el número de defunciones por cada
1000 habitantes ocurridas durante un año. Esta tasa mide el riesgo de morir de la
población general en un determinado año.

Tasa de mortalidad por causa


Incluirá en el numerador a todas las defunciones ocurridas por una determinada
causa durante el período de estudio y en el denominador a toda la población a mítad
del período. El resultado debe multiplicarse por 100.000. Esta tasa mide el riesgo
que tiene la población de morir por una causa específica.
Tasas específicas de mortalidad
Se pueden calcular tasas de mortalidad específica por sexo, edad y otros atributo
dependiendo de la restricción que se imponga al denominador. De este modo
obtienen indicadores que miden el riesgo de morir que tienen hombres, mujere
niños menores de un año, adu ltos mayores, etc.

Tasa de letalidad
Esta tasa mide el riesgo de morir por una determinada enfermedad que tienen 1
que están enfermos de esa enfermedad. Se construye dividiendo el número
defunciones por causa de una enfermedad por el número de enfermos de e
enfermedad. El resultad o se multiplica por 100. También se considera a la tasa
letalidad como un indicador de la gravedad de una enfermedad.

Tasas de morbilidad
En la medición de la morbilidad nos interesarán dos aspectos de la enfermedad
estudio: la frecuencia y la gravedad.

La frecuencia la med iremos por medio de las tasas de prevalencia e incidenci

Tasa de incidencia
Considera el número de casos nuevos en el período, en el numerador, y la poblaci·
a mitad de período, en el denominador. Todo esto multiplicado por 100.000.

Mide el riesgo de contraer la enfermedad durante el período de estudio. De es


manera evalúa la dinám ica de la enfermedad.

Tasa de prevalencia
Considera, en el numerador, a todos los casos de la enfermedad presentes duran
el período (nuevos + antiguos), y en el denominador a la población a mitad d
período. El resultado se amplifica por 100.000.
UNIDAD 4
Tablas y Gráficos. Diseño y selección de resultados. Presentación (estándares
para informes de investigación , artículos y proyectos). Gráficos: barra, circu lar,
poligonal, histograma, caja, incidencia y prevalencia.

Tablas de frecuencias con datos agrupados


Cuando los valores de la variable son muchos, conviene agrupar los datos en
Intervalos o clases para así realizar un mejor aná lisis e interpretación de ellos.
• Para construir una tabla de frecuencias con datos agrupados, conociendo los
Intervalos, se debe determinar la frecuencia absoluta (fi) correspondiente a cada
intervalo, contando la cantidad de datos cuyo va lor está entre los extremos del
intervalo. Luego se ca lculan las frecuencias relativas y acumuladas, si es pertinente.
•Sino se conocen los intervalos, se pueden determinar de la siguiente manera:
(recuerda que los interva los de clase se emplean si las variables toman un número
grande de valores o la variable es continua) .
• Se busca el valor máximo de la variable y el valor mínimo. Con estos datos
se determina el rango.
· Se divide el rango en la cantidad de intervalos que se desea tener,(por lo general
se determinan 5 intervalos de lo contrario es ideal que sea un numero impar por
e¡emplo 5, 7, 9) obteniéndose así la amplitud o tamaño de cada intervalo.
-Comenzando por el mínimo valor de la variable, que será el extremo inferior del
primer intervalo, se suma a este valor la amplitud para obtener el extremo superior y
asl sucesivamente.
• Otra forma de calcular la cantidad de intervalos es aplicando los siguientes
metodos:
16todo Sturges: k = 1 + 3,332 log n
donde:
k= número de clases
n= tamaño muestra!
Debemos tener en cuenta 2 cosas. Primero que el número de intervalos me tiene
que dar impar, segundo que el resultado se redondea generalmente a la baja. Si al
redondear a la baja nos da como resultado un número par debemos redondear al
alza. Este es e l método que tiene mayor precisión.

Método Empírico: este método depende del criterio del evaluador de los datos, por
lo tanto es arbitrario. Dice lo siguiente.
5 :2:: k :2:: 20
Una tabla es un cuadro que consiste en la disposición conjunta, ordenada y
normalmente totalizada , de las sumas o frecuencias totales obtenidos en la
tabulación de los datos, referentes a las categorías o dimensiones de una variable
o de varias variables relacionadas entre sí. Las tablas sistematizan los resultados
cuantitativos y ofrecen una visión numérica, sintética y global del fenómeno
observado y de las relaciones entre sus diversas características o variables. En ella,
culmina y se concreta definitivamente la fase clasificatoria de la investigación
cuantitativa.
Teniendo la definición de lo que es una tabla, podemos trabajar entonces cada uno
de los tipos de tablas pedidos:
• Tabla de entrada de datos: Es una tabla en la cual solo aparecen los datos que
se obtuvieron de la investigación científica o del experimento. Es la tabla más
sencilla y se utiliza cuando no se necesita mayor información a cerca de los datos,
estas tablas se construyen por medio de la tabulación de los datos, este
procedim iento es relativamente sencillo, para realizarlo nos ocupamos de un
conjunto de datos estadísticos obtenidos al registrar los resultados de una serie de
n repeticiones de algún experimento u observación aleatoria , suponiendo que las
repeticiones son mutuamente independientes y se realizan en condiciones
uniformes, es importante decir que el resultado de cada observación puede
expresarse de forma numérica, para este tipo de tablas de entrada de datos se
puede trabajar con una ó mas variables, de manera que nuestro material estadístico
consiste en n valores observados de la variable Xj .
Los valores observados se suelen registrar, en primer lugar en una lista, si él numero
de observaciones no excede de 20 ó 30, estos datos se registran en orden creciente
de magnitud .
Con los datos de esta tabla pueden hacerse diversas representaciones gráficas y
calcularse determinadas características numéricas como la media, la [Link].
EJ: Agmpar en una tabla de datos
7,4, 3, 8
10, 1,6,9,2, 5,

¡x 11 12 13 14 1s 16 17 Iª 19 110
• Tablas de frecuencias : Una tabla de frecuencia está formada por las categorías
o valores de una variable y sus frecuencias correspond ientes. Esta tabla es lo
mismo que una distribución de frecuencias. Esta tabla se crea por medio de la
tabulación y agrupación, la cual es un método sencillo como lo habíamos empezado
a ver en la tabla de datos, Se realiza el mismo procedimiento de tabu lación
anteriormente descrito si el número de valores observados para la variable, se
trabaja con una sola variable, descontando los repetidos son pequeños, si existen
repetidos la frecuencia f es el número de repeticiones de un va lor de X dado, Sin
embargo, cuando el conjunto de datos es mayor, resulta laborioso trabajar
directamente con los valores individuales observados y entonces se lleva a cabo,
por lo general, algún tipo de agrupación como paso preliminar, antes de iniciar
cualquier otro tratamiento de los datos. Las reglas para proceder a la agrupación
son diferentes según sea la variable, discreta o continua, para una variable discreta
suele resultar conveniente hacer una tabla e n cuya primera columna figuren todos
los valores de la variable X representados en el material, y en la segunda, la
frecuencia f con que ha aparecido cada va lor de X en las observacio nes.
Para una variable continua, el procedimiento de agrupación es algo más
complicado. Se toma un intervalo adecuado sobre el eje de la variable que contenga
los n valores observados, y divídase el intervalo en cierto número de intervalos de
iase. Todas las observaciones que pertenecen al mismo intervalo de clase se
número que res ulte representa la frecuencia de clase
intervalo, luego se forma una tabla, en cuya primera
columna figuran los límites de cada intervalo de clase, y en la segunda aparecen las
correspondientes frecuencias.
Estas clases de tablas son las más usadas y brindan mayor información de los datos
que las tablas de entradas de datos, efectivamente, una tabla de este tipo dará en
forma abreviada , una información completa acerca de la distribución de los va lores
observados. Con estas se pueden utilizar más a fondo los métodos gráficos al igual
q ue los métodos aritméticos.
Ej : Agrupar e n una tabla 1, 1, 2, 2, 2, 2, 3, 3, 3, 4, 5
X F
1 2
2 4
3 3
4 1
5 1
í:11

Agrupar en una tabla las sig uientes estaturas: 160, 168, 175, 183, 170, 164, 170,
184, 171 ,168,187,161,183,175,185,186,187,164,165,175, 162,188,169,163,
166, 172, 173, 167, 174, 176, 178, 179, 177
X F
160-165 6
265-270 6
170- 175 6
175-180 7
180-185 3
185-190 5
í:33

• Tablas de doble entrada: También llamadas tablas de contingencias, son


aquellas tablas de datos referentes a dos variables, formada , en las cabeceras de
las filas, por las categorías o valores de una variable y en las de las columnas por
los de la otra, y en las casillas de la tabla , por las frecuencias o número de elementos
que reúnen a la vez las dos categorías o valores de las dos variables que se cruzan
en cada casilla. Para la tabulación de un material agrupado de observaciones
simultaneas de dos variables aleatorias necesitaremos una tabla descrita como
anteriormente lo describimos, las reglas para agrupar son las mismas que en el caso
de una sola variable.
Este tipo de tablas brindan información estadística de dos eventos relacionados
entre si, es útil en casos en los cuales los experimentos son dependientes de otro
más adelante aparecen más aplicaciones del análisis estadístico

T1fT2 SI NO
SI 12 2
NO 10 4

presentación gráfica de datos estadísticos


los análisis estadísticos, es frecuente utilizar representaciones visuales
plementarias de las tablas que resumen los datos de estudio. Con estas
ntaciones, adaptadas en cada caso a la finalidad informativa que se
igue, se transmiten los resultados de los análisis de forma rápida, directa y
prensible para un conjunto amplio de personas.

de representaciones gráficas
se muestran los datos estadísticos a través de representaciones gráficas,
ha de adaptar el contenido a la infonnación visual que se pretende transmitir.
ello, se barajan múltiples formas de representación:
Diagramas de barras : muestran los valores de la s frecuencias absolutas sobre
sistema de ejes cartesianos, cuando la variable es discreta o cualitativa.
Histogramas: formas especiales de diagramas de barras para distribuciones
• Polígonos de frecuencias: formados por lín eas poligonales abiertas sobre un
sistema de ejes cartesianos.
• Gráficos de sectores: circulares o de tarta, dividen un círculo en porciones
proporcionales según el va lor de las frecuencias relativas.
• Pictogramas : o representaciones visuales figurativas. En realidad son
diagramas de barras en los que las barras se sustituyen con dibujos alusivos a la
variable.
• Cartogramas: expresiones gráficas a modo de mapa.
• Pirámides de población : para clasificaciones de grupos de población por sexo
y edad.
Diagramas de barras e histogramas
Los diagramas de barras se usan para representar gráficamente series
estadísticas de valores en un sistema de ejes cartesianos, de manera que en las
abscisas se indica el valor de la va riable estadística y en las ordenadas se señala
su frecuencia absoluta.
Estos gráficos se usan en representación de caracteres cualitativos y cuantitativos
discretos. En va riables cuantitativas continuas , se emplea una variante de los
mismos llamada histograma.

CJ 1993 D 1994
10.000 l--- - -- l - + - - - - - - - - - - - - - -

E.000 > - - -- ---< f--hl-- - - - - -- - - - , - - ~ ~- -

6.000 ¡._..,c 1-- =--1

4 000

2.000

0
Enero Feb. Mar Abril Mayo Jun io Julio Agos Sep. Oct lfov. D1c.

Diagrama de barras.
68.209
Progresión anual
de objetores
42.454

28.051
27.3gg

1985 1986 1987 1988 1989 1990 1991 1992 1993

Histograma.

Polígonos de frecuencias

Para construir polígonos de frecuencias, se trazan las frecuencias absolutas o


relativas de los valores de la variable en un sistema de ejes ca rtesianos y se unen
los puntos resultantes mediante trazos rectos. Con ello se obtiene una forma de
linea poligonal abierta.
Los polígonos de frecuencias se utilizan preferentemente en la presentación de
caracteres cuantitativos, y tienen especial interés cuando se indican frecuencias
acumulativas. Se usan en la expresión de fenómenos que varían con el tiempo,
como la densidad de población, el precio o la temperatura.
Gráficos de sectores
En los diagramas de sectores, también llamados circulares o de tarta, se muestra el
valor de la frecuencia de la variable señalada como un sector circular dentro de un
círculo completo. Por e llo, resultan útiles particularmente para mostrar
comparaciones entre datos, sobre todo en forma de frecuencias relativas de las
variables expresadas en forma de porcentaje.

Pictogramas y cartogramas

Para aligerar la presentación de datos estadísticos, con frecuencia se recurre a


imágenes pictóricas representativas del valor de las variables. Dos formas comunes
de expresión gráfica de los datos son:
• Los pictogramas , que muestran diagramas figurativos con figuras o motivos que
aluden a la distribución estadística analizada (por ejemplo, una imagen
antropomórfica para indicar tamaños , alturas u otros).
• Los cartogramas , basados en mapas geográficos que utilizan distintas tramas,
colores o intensidades para remarcar las diferencias entre los datos.
Pirámide de población
Otra forma corriente de presentación visual de datos estadísticos es la llamada
pirámide de población.
Las pirámides de población se utilizan en la expresión de informaciones
demográficas, económicas o sociales, y en ellas se clasifican comúnmente los datos
de la población del grupo de muestra considerado en diferentes escalas de edad y
diferenciada por sexo.

:oo- Homb re O.O'>, 0 .0% Mujer


9;..99 00% 0.1%
90-s.\ o.n.[ o.J'li>
S~-e9
eo.r,,:
75-79
70-7'+
65-69
60-&4
55.59
50-54
,5--49
, 0. 44
35-?9
30~
25-29
20-24
15-19
10- 14
:,.9
0 -L 4. l.%
10·~ 8'. 8% 10!,

Argentina - 2017
Populat1onPyram1d net Pob lación : 44,272,125

Ejemplo de una pirámide de población.

Polígono de frecuencias . Polígono de frecuencias acumulativas. Gráfico de


sectores. Representación de datos estadísticos en un pictograma.
UNIDAD 5
Estadística inferencia!. Variables: distribución y caracterización. Estud ios de
comparación entre variables medi das en distintas esca las. Criterios de normalidad
y anormalidad.

Conceptos de probabi lidad


Muchos fenómenos de la naturaleza, como la caída libre de un cuerpo en la
superficie terrestre , pueden predecirse m ediante leyes deterministas. Otros, en
cambio, se rigen por el azar, aun cuando se produzcan siempre en unas mismas
condiciones. Por ejemplo, ¿qué número saldrá al lanzar un dado? Los sucesos que
obedecen al azar se denominan aleatorios o estocásticos, y su comportamiento se
estudia a través del cálculo de probabilidades.
Sucesos estocásticos
Por definición, se llama experimento aleatorio, estocástico o estadístico al que
puede producir resultados diferentes en unas mismas condiciones. Lanzar una
moneda al aire o tirar un dado son ejemplos com unes de experimentos aleatorios.
Cada uno de los resultados de un experimento aleatorio se llama suceso
elemental, y el conjunto de todos los sucesos elementales distintos que pueden
producirse en el experimento se denomina espacio muestra!. Por ejemplo, el
espacio muestra! de un experimento aleatorio consistente en tirar un dado es E =
{1, 2, 3, 4, 5, 6}.
Los diversos subconjuntos del espacio muestra! se denominan sucesos
estocásticos. Algunos tipos especiales de sucesos estocásticos son:
• Suceso seguro, que se prod uce siempre. Matemáticamente, corresponde al
espacio muestra! E .
• Suceso imposible, que no ocu rre nunca y que corresponde al subconjunto JE
(espacio vacío) de E .
• Suceso contrario o complementario de uno dado (si se produce el suceso A ,
su complementario :.l\ no ocu rre, y a la inversa) . Matemáticamente: A= E - A .
• Dos sucesos estocásticos con algún suceso elemental común se dicen
compatibles; en caso contrario, se llaman incompatibles .
Operaciones con sucesos
En el espacio muestra! E de sucesos estocásticos pueden definirse varias
operaciones:
• Unión de sucesos A y B, un suceso estocástico que contiene todos los sucesos
elementales de A y de B. Se expresa como A É B . (La unión de dos sucesos
complementa rios es el espacio muestra!: A É A= E).
• Intersección de sucesos A y B, que comprende sólo los sucesos elementales
comunes a A y B. Se expresa como A<; B. (Dos sucesos incompatibles tienen por
intersección el suceso imposible ,LE).
• Diferencia de sucesos A y B, que es un nuevo suceso formado por los sucesos
elementales de A que no lo son de B. Se escribe A - B.
• Implicación de sucesos. Se dice que un suceso estocástico A implica a otro 8
cuando se cumple que A es un subconjunto de B (A i B).
OPERACIONES
Propiedades
Unión lntersec-c ión
[Link] [Link]=BUA AnB = BnA
[Link]:taU\'a (A U B) u C = A u (B U C) (A n B) n e = A n (B n C)
D!strJbuova A u (B n C) = (A u B) n (A u C) A n (B u C) = (A ('\ B) u (A n C)
Compl,wientana AUA = E A(') :4. = 0
Le~·1,5 d., Morga~ (AuE) = A n B (A n B) = A u B

Propiedades de las operaciones con sucesos.


Probabilidad de un suceso
Dado un experimento aleatorio, se denomina probabilidad a una función que
asigna a cada suceso estocástico un número que refleja el tanto por uno de veces
que ocurre el suceso dentro del experimento. Por tanto, el valor de la probabilidad
indica la frecuencia relativa de cada suceso estocástico dentro del experimento
aleatorio.
La función probabilidad expresa como P (A), y se distingue por las siguientes
características:
• La probabilidad del suceso seguro es 1: P (E) = 1.
• La probabilidad del suceso imposible es O: P (,LE) = O.
• La probabilidad de cualquier suceso está comprendida entre O y 1: O [ P (A) [ 1.
Propiedades de la función probabilidad
Otras propiedades interesantes de la función probabilidad son las siguientes:
• Dado un conjunto de sucesos incompatibles dos a dos, la probabilidad de su
unión es igual a la suma de las probabilidades de cada suceso individual:
p i.\ 1U .\.: ~1 ... U An) = p (.A. 1) + p (Az) + .. , + p (An)
• La probabilidad del suceso contrario viene dada por P (A ) = 1 - P (A).
• Para dos sucesos compatibles, se cumple que la probabilidad de la unión es igual
a la suma de las probabilidades de cada suceso menos la probabilidad del suceso
Intersección entre ambos:
P (A EB) = P (A)+ P (B) - P (A<; B)

A,'"·¡ B
Representación gráfica de la unión y la intersección de dos sucesos compatibles.
• Regla de Laplace, según la cual la probabilidad de un suceso estocástico
formado por h sucesos elementales equiprobables en un espacio muestra! de n
elementos se determina como el cociente entre el número de casos favorables (h )
yel número de casos posibles (n).
N " casos Íil\'orables (] 1)
p (A) = - - - - - - - --
N'' caso~ p osib le s (ll)

Probabilidad condicionada y compuesta


Cuando se analizan fenómenos aleatorios complejos como puedan ser el
lanzamiento de varios dados a la vez o la extracción de bolas de una bolsa sin
reintegrarlas a la misma después de sacadas, el cálculo de probabilidades siguen
principios especiales, aunque perfectamente mensurables. En estos casos se habla
de experimentos aleatorios y probabi lidades compuestos o cond icionados.
Probabilidad condicionada
Cuando se producen sucesos estocásticos consecutivamente de un espacio
muestra!, pueden darse dos ti pos genéricos de situa ciones:
• Los sucesos son independientes entre s í, de manera que no influyen uno en el
otro.
• Cada suceso está condicionado por el resu ltado del anterior.
Cuando un suceso A influye en el resultado de un segundo suceso B, se dice que
la probabilidad de éste es una probabilidad condicionada , expresado como P (B
/ A), cuyo valor es:
=> íl) \) _ P (A 1-1 B)
l 1
\ J1.- . - -- - -
p (Aj
El suceso A no puede ser un suceso imposible, pues sería P (A) = O.
Experimentos compuestos
Se llama experimento aleatorio compuesto al que resulta de la realización de
varios experimentos aleatorios simples. En general, a un experimento compuesto
se asocia una probabilidad compuesta , también llamada probabilidad producto
y expresada como P (A e; B) o, simplemente, P (AB). Según la definición de
probabilidad condicionada, el va lor de la probabilidad compuesta por dos
experimentos simples dependientes viene dado por:
p (.\ ,· B) = p (..\ . p (]":,:_.\ )
1• Lanzamiento 2° Lanzam1ento 3" Lanzamiento Resultado

e [Link] : = ~
:: ~
.....::::::::=::
CCC
CCX
CXC
CXX
Moneda< X -[Link] : ......::;;::::::==~ xcc
:xcx
e xxc
IC = Cara. X = Cruz.] X XXX

Diagrama de árbol relativo al experimento compuesto que consiste en lanzar tres


veces una moneda al aire.
En el caso particular de que los sucesos del experimento compuesto sean
independientes, se cumple que P (A e; B) = P (A) x P (B). Cuand o el experimento
compuesto corresponde a tres experimentos simples, la fórmula se transforma en:
Si A , B y C son dependientes:P (A e; B e; C) = p (ABC) = p (A) X p (B/A) X p (C/A
e; B)Si A , B y C son independ ientes: P (A e; B e; C) = P (A) x P (B) x P (C)
Probabilidad total
Cuando los sucesos elementales de un experimento no se refieren a todo el espacio
muestra! sino a algún subconjunto del mismo, el cálculo de probabilidades se hace
más complejo. Un ejemplo típico de este problema es el experimento consistente
en sacar bolas de tres bolsas distintas, de manera que en cada bolsa existe una
distribución de bolas diferente. ¿Cuál sería la probabilidad de que una bola extraída
sea de un determinado color?
En estos casos se recurre al llamado teorema de la probabilidad total , según el
cual si se parte el espacio muestra! E en un conjunto de n sucesos incompatibles
A1, A2, ¿, An, donde E = A1 É A2 É ¿ É An , y se analiza un suceso cualquiera B,
conocidas todas las probabilidades de A1, A.2., ¿, An y las probabilidades
condicionadas de B con respecto a cada uno de estos sucesos incompatibles, se
puede deducir:
P i13', = P íA 1i · P n:://.. 1! + P U\.:!1 · P ,'.13i_·\ ,'.i + ... + P V\,'1· I' íl:.'..\ ,;,
Extr. bolsa Extr. bola Resultado Probabll1 dad
1 2
~ R A, R
A,
-==KN¾o R
A,N

A,R l
3
l
3
5
3
5
3
~ 3 10
1 7
~ N [Link]
3 10
1 4
A!R
A.i ~ R 3 8

% N AJN
l
3
"
8

Ejemplo del diagrama de árbol correspondiente a un experimento que consiste en


sacar una bola roja (R) de una de estas tres bolsas: la primera bolsa tiene 2 bolas
rojas y 3 negras; la segunda bolsa, 3 bolas rojas y 7 negras, y la tercera bolsa, 4
bolas rojas y 4 negras.

Teorema de Bayes
Cuando se calcula la probabilidad de un fenómeno después de que éste se haya
producido, se habla de probabilidad a posteríori. Por ejemplo, supóngase que en
el experimento de la extracción de una bola de entre varias bolsas se sabe que se
ha sacado una bola roja ; ahora bien, ¿de qué bolsa procede? La respuesta se
obtiene de la ley de la probabilidad a posteriori.
Si se divide el espacio muestra! E en un conjunto de n sucesos incompatibles A1,
A2, ... , An, donde E = A1 É A2 E ¿ É An, y se considera un suceso cualquiera B,
conocida la probabilidad de B (que ha de ser distinta de cero), la probabilidad a
posteriori para cada A¡ (con i = 1, 2, ¿, n) se obtiene mediante el llamado teorema
de Bayes:

Distribución probabilística
Cuando se analiza un experimento aleatorio, se descubren factores de
comportamiento de la probabilidad que siguen modelos propios y distintivos. Por
ello, es frecuente asociar a estos experimentos una «función de probabilidad», que
puede adoptar diversas formas y regirse por principios diferentes y cuyo estudio
arroja luz sobre la naturaleza y las características del fenómeno físico o social ligado
al experimento.

Variables aleatorias
En un experimento aleatorio cabe definir una aplicación que asigne a cada suceso
estocástico del espacio muestra! un cierto número. Esta aplicación recibe el
nombre de variable aleatoria , y el conjunto de valores que puede asumir una
variable aleatoria es su recorrido . Según el número de elementos del recorrido, se
distinguen dos tipos de variables aleatorias:
• Variable aleatoria continua , de recorrido infinito, donde el número al que se
hace corresponder la aplicación pertenece al conjunto de los números reales R.
• Variable aleatoria discreta, que produce como resultado un número finito de
valores predeterminados, por lo que su recorrido es finito.
En general, una variable aleatoria discreta se define como una aplicación f (x¡) tal
que:
f (X¡J =p (X = X¡) = p ¡
Esta expresión se conoce comúnmente por los nombres de distribución de
probabilidad , función de probabilidad o función de cuantía.

6/ 36

5/ 36

4/ 36
"O
r.
:§ 3/ 36 ·
~
~ 2/ 3 6
1/ 36

1 I_ -
? 3 4 5 6 - 8 9 10 11 12
Suma de datos

Ejemplo de variable aleatoria discreta: al lanzar dos dados, la suma de los puntos
de ambos puede tomar un conjunto finito de valores.
Función de distribución
Dada una variable aleatoria X , se llama función de distribución a aquella que
proporciona la probabilidad de que la variable aleatoria tome un valor menor o igual
que Xi. Es decir:
r, (X¡l = p (X < X¡)

Si se conoce la función de distribución F (x) de una variable aleatoria X, ya sea ésta


discreta o continua, siempre se cumple que la probabilidad de que la variable
aleatoria tome valores en el intervalo (a, b] es:
P (él < X s- b) = F (bl - F (a)

Esperanza matemática
En un experimento a leatorio, la esperanza matemática se define como la suma del
producto de cada valor de la variable aleatoria considerada por su probabilidad.
Cuando la variable aleatoria X es discreta, el valor de la esperanza matemática
asociada viene dado por:
n
F 1X 1 =p ¡ X¡ + p;;: X z + ... + Pn Xn = S: p, X 1
1- 1

Si se trata de una variable aleatoria continua, el número de valores de la variable es


infinito, por lo que el sumatorio se convierte en una integral.
.·+-
E (X j = l
·- x · f (x) dx

Siendo f (x) la función de densidad de la variable aleatoria continua .


Varianza y desviación típica
La esperanza media constituye un valor de tendencia central , una media del valor
de la variable estadística. Para saber si los valores de una variable estadística
siguen una distribución centrada o dispersa, es preciso completar el valor de la
esperanza media con el de la varianza.
En variab les aleatorias discretas, la varianza se define como:
11
' , ~ -, -
, (XJ - _\"' -2
p1 x¡- - 1-'-· (Xl
. - ,12
1 1

En las variables aleatorias co ntinuas, existe un número infinito de valores, por lo


que el sumatorio de la fórmula anterior se convierte en integral:

V (X) = .e: [x - E (X) ]2 · f (x) dx

Siendo f (x) la función de densidad de la variable aleatoria continua.


La raíz cuad rada de la va rianza recibe el nombre de desviación típica:

Ci (X) = \ÍV (x)

Distribución binomial
Una forma corriente de descripción de los experimentos aleatorios equiprobables
con variable discreta es la distribución binomial. En este tipo de distribución se
estudia la probabilidad de que se produzca un cierto resultado, que se describe por
med io de dos parámetros: el número de repeticiones realizadas del experimento y
la probabilidad individual del suceso aleatorio que se persigue como resultado .
Condiciones para una distribución binomial
Una distribución se denomina binomial cuando se cumplen las condiciones
siguientes:
• El experimento aleatorio de base se repite n veces, y todos los resultados
obtenidos son mutuamente independientes.
• En cada prueba se tiene una misma probabilidad de éxito (suceso A),
expresada por p. Asimismo, existe en cada prueba una misma probabilidad de
fracaso (suceso A ), que es igual a q = 1 - p.
• El objetivo de la distribución binomial es conocer la probabilidad de que se
produzca un cierto número de éxitos. La variable aleatoria X , que indica el número
de veces que aparece el suceso A (éxito), es discreta, y su recorrido es el conjunto
{O, 1, 2, 3, ..., n}.
La distribución binomial se expresa como B (n, p), siendo n el número de veces
que se repite el experimento y p la probabilidad de que se produzca un éxito.

?A y lA 4

Ejemplo de experimento aleatorio descrito por una distribución binomial: al tirar un


dado cuatro veces, ¿cuántas veces saldrá el número 6? Este suceso es el «éxito»
del experimento.

Función de probabilidad
La distribución binomial se caracteriza porque su función de probabilidad viene
dada por la expresión sigu iente:
r) \A= l')
'V '
= nr
i-
=
])
r

donde res el número de éxitos asociado al experimento aleatorio.


En una distribución binomial B (n, p) se verifica que:
• La probabilidad de que aparezca al menos un éxito en las n repeticiones es igual
a:
P{X~ l) =J-P (X = O)

• La probabilidad de que se produzca un éxito como máximo en las n repeticiones


se determina como:

I' (X ~ J) =P (X = O) + P (X = J)
Esperanza, varianza y desviación típica
En una distribución binomial denotada por B (n, p ), donde n es el número de
repeticiones del experimento y p la probabilidad de que se produzca un cierto
suceso (éxito), la esperanza matemática de la variable aleatoria X viene dada por
la expresión siguiente:

E !XI = n · p

Análogamente, la varianza de la variable aleatoria X, al ser ésta de tipo discreto, se


ca lcul a como:
V [X ]= n · p · q

siendo q la probabilidad de no éxito (fracaso). La desviación típica es, como de


costumbre , la raíz cuad rada de la varianza:

CT = Vn · p · q
Ajuste de una distribución binomial
En ocasiones, el cálculo de la probabilidad de una distribución binomial del tipo B
(n, p) resulta muy complicado . Según demostró el matemático francés Abraham de
Moivre (1667-1754), la probabilidad de una distribución binomial B (n, p) puede
aproximarse por medio de una distribución normal de tipo N (np, \ npq ), que
resulta particularmente adecuada cuando:
• El va lor den es muy elevado.
• Tanto np y nq son 3 que 5. (Obsérvese que cuanto mayor es n y más se aproxima
p a 0,5 tanto mejor es la aproximación realizada) .
Para transformar una distribución binomial (de variable discreta) en una normal (de
variable contin ua), és preciso proceder a la siguiente transformación :

Va riable X x·
Distribucíc,n B ín. p1 X (r q:,. , .:~ )

Probabili d<'ld PCX=r) P (r - 0.5 S: X' ::::;; r + 0,5i

Distribución normal
Entre las distribuciones probabilísticas de variable continua, la más ampliamente
utilizada es la llamada distribución normal, cuya representación gráfica tiene una
forma muy conocida en el ámbito de la estadística y las ciencias naturales: la
campa na de Gauss.
Concepto y función de probabilidad
Dado un experimento de variable aleatoria continua X, se llama distribución
normal a aquella que queda perfectamente descrita por su media aritmética xy su
desviación típica s. Las distribuciones normales, también llamadas gaussianas, se
denotan por la expresión N (x , s ).

X
La gráfica de una distribución normal es la conocida campana de Gauss.
La función de densidad de la distribución normal sigue la ecuación que determina la
conocida campana de Gauss, cuya expresión matemática es la siguiente:
(.,; ; } .'./1
(' 20'
X = V[Link] • J; . 1- ::,.1::-.: j~' ir-.1:;rv.,1,..
~
f (xi =
= M,=.j·¡, :::-.-; !e va-iab!,:, a' -~: oria x oV2n:
(> = D;;s-.~3c,Jn n::::io d, ~ [Link].i ::ileatoriri x

Media y desviación típica


Una función de densidad asociada a una distribución normal se caracteriza por dos
parámetros complementarios:
• La media x, que corresponde al punto en el que la función de distribución alcanza
un máximo.
• La desviación típica s, que señala la anchura de la distribución.
La función que describe una distribución normal presenta puntos de inflexión en las
abscisas: x- s y ~+ s , donde se modifica la concavidad de la curva. Finalmente, en
los valores de la variable estadística que tienden a -~ y +~, la función tiende a cero .
Tipificación de la variable
El cálculo de las probabilidades asociadas a una distribución normal por medio de
integrales resulta , en general, complejo. Por ello, suele utilizarse una función de
distribución de apoyo cuya media es O y cuya desviación típica es la [Link]
función se denomina distribución normal tipificada, y se expresada como N (O, 1).
Se llama tipificación a la operación consistente en cambiar de una va riable
aleatoria X a otra variable Z de distribución tipificada, por medio de la expresión
siguiente:

7 = ---
X-x
(j

Tabla de tipificación
La distribución normal tipificada tiene por ecuación de su función de densidad:

Para determinar la probabilidad de que esta función sea menor que un va lor dado
a, se utiliza un método aproximativo y una tabla de tipificación muy conocida.
¡
(1 0,.00 0,01 0,02 i 0,03 O.!» 1
0,05 1
0,0 0,5000
o, 1 0,539B
0,5040 0,5080 0,5 120 v,5160 lo,s199 l
0,5438 0,5478 0,5517 0,5557 0,5595
0,2 0,5793 0,5832 0,5871 0,591 0 0,5948 0,5987 ?
0,3 0,6179 0,6217 0,5255 0,6293 -0,6331 o, 6368
0,4 0,6554 0,6591 0,6628 0,6654 0,6700 0,6735 \
0,5 0,691 5 0,6950 o,6985101019 07054 1o, 7088 /
0,6 , 0,7257 O, 7291 0,7324 0,7357 C,7389 0,7422 \
0,7 0,7560 0,7611 0,7642 0,7673 0,7704 0.7734 (
0,8 0,78S1 0,7910
0,9 0,8159 0,8l86
0,7939 0,7967
0,8212 0,8238
o,7995 8023
0,8264
º·
0,8289 \1
.

í,O 0,8413 0,8438 0,8461 0,8485 0,850810.8531 )


1, 1 O,B643 0,8665 0,8686 0,8708 0,8729 0,8749 J.
1,2 0,6849 0,8869 0,8888 0,8907 C,B925 0,8944 1
1

u 0,9032 0,9049 0,9056 0,9082 0,909910,9115 ~


'l,4 0,9192 0,9207 0,9222 0,923-6 0,92.51 I 0,9265
! 1
1,5 0,9332 0.9345 0,9357 0,9370 0,9382 j0,9394 X)
1,6 0,9452 0,9463 0,9474 0,94B4 0,9495 ! 0,?'505 1
~,7 0,9554 0,9~6~ 0,9573 0,9582 0,9591 10,9599 (
11 8 0,9541 0,96,L 0,9556 0,9664 0,9671 0,9678 )
1.~ 0,9713
.
0,9 179
....------.~~
0,972.ó 0,9732
--------
0,9738 I0,9744 :i

Fragmento de la tabla de tipificación N (O, 1).


La distribución normal como aproximación de la binomial
Según demostró Abraham de Moivre (1667-1754), las distribuciones binomiales de
variable discreta pueden aproximarse a distribuciones normales siempre que el
3
producto np 5. La equivalencia establecida sería la siguiente:

B (n. p) = N (np. \' npq ). ,.¡ np ~ 5:, riq :-:, :,

0,3

0,2

º· 1

o 4 10 i2 14 15 11:, 2G 22
Ejemplo gráfico de aproximación de una distribución binomial mediante una norma!.
Como se aprecia, la exactitud de la aproximación aumenta conforme se incrementa
el número de experimentos (n).

Muestreo estadístico
Un estudio estadístico ideal sería aquel que considerara en detalle los caracteres y
parámetros de todos los elementos del espacio muestra!. Sin embargo, por motivos
de coste , operatividad o limitación de recursos, normalmente los estudios se refieren
a grupos representativos dentro de un colectivo, llamados muestras, cuya elección
ha de seguir unas normas que garanticen su idoneidad y su facilidad de manejo.
Población y muestra
En una investigación estadística, se llama población al conjunto o colectivo de
elementos considerados en la misma. El número de elementos de este conjunto se
conoce como tamaño de la muestra, que puede ser finito o infinito.
Normalmente, las observaciones no se realizan de modo exhaustivo para toda una
población estadística , sino que se restringen a un subconjunto representativo de la
misma. Cada uno de estos subconjuntos recibe el nombre de muestra. Para que
una muestra pueda considerarse significativa de una población, debe cumplirse
que:
• El tamaño de la muestra y el de la población estén proporcionados.
• Los elementos no presenten distorsiones importantes.
• La muestra sea representativa de la población.

Muestreo aleatorio
Se llama muestreo a la operación que consiste en elegir unidades estadísticas
significativas dentro del conjunto de una población. Existen diversos métodos para
seleccionar las muestras, que han de regirse siempre por el principio aleatorio:
todos los elementos de la población deben tener una misma probabilidad de ser
elegidos para la muestra. Los dos procedimientos más sencillos de muestreo son :
• Muestreo aleatorio simple , que consiste en seleccionar n elementos en una
población de tamaño N, de forma que no existe reemplazamiento y todas las
muestras que se pueden formar tienen la misma probabilidad de ser eleg idas.
• Muestreo aleatorio sistemático, en el que se as igna un número a cada
elemento de la población y se aplica después un procedimiento de selección al azar
utilizando este número.
En técnicas de muestreo aleatorio simple, la probabilidad de eleg ir un a muestra es
la inversa de las combinaciones sin repetición de N elementos to mados en grupos
den:
1 1 1 (N - n ) !
P =--= ---
CN,n N! N!
{N - n)!

La probabilidad de que se elija un elemento determinado de la población para la


muestra viene dada por:
casos favorables n
P =--------
casos posibles N

Coeficiente de elevación
En la técnica de muestreo aleatorio sistemático, se numeran primero los elementos
de la población, de 1 a N, y se determina un coeficiente de elevación dado por:

N
h= -
n

siendo n el tamaño de la muestra.


Después, se toma al azar un número i, que se llama origen, ta l que 1 f i f h, .y se
forma la muestra con los elementos de numeración: i, i + h, i + 2h, ... , i + (n - 1) h.
El muestreo aleatorio sistemático exige que la variable sometida a estudio no
presente ninguna ordenación previa.
Muestreo aleatorio estratificado y por conglomerados
En poblaciones estadísticas no homogéneas, a menudo es conveniente dividir la
población en estratos o subpoblaciones de composición más homogénea, de
manera que la operación de muestreo pueda realizarse , con garantías, por el
método simple o el sistemático. La suma de todos los estratos debe conformar la
población. De cada estrato de la población (N¡) se obtendrá un estrato de muestra
(rn).
Grupo 1 Grupo 2 Grupo 3 Total
Subpoblación o estrato N1 N2 N3 N=N1+N2+N3
Muestra de cada estrato n1 n2 n3 n=n1+n2+n3
División de una población en estratos o subpoblaciones. La muestra total es igual a
la suma de las muestras elegidas para cada estrato.
Si todos los estratos tienen el mismo tamaño, se habla de muestreo aleatorio
estratificado constante, o de igual afijación. Entonces, si se divide la muestra en
L estratos, el tamaño de cada muestra vendrá dado por:
n
111 = 11 2 = ... = 111 =-
L
El muestreo se denomina estratificado proporcional, o de afijación
proporcional , cuando la muestra de cada estrato es proporcional al tamaño del
estrato. Es decir:
ll J n
=
N
En el muestreo por conglomerados , la unidad muestra! está formada por un grupo
de elementos, y no por un elemento individual. Se usa para concentrar las muestras
en zonas geográficas, unidades de población (municipios, familias , colegios),
etcétera.

Distribución muestra!
A partir de las muestras seleccionadas de una población pueden construirse
variables aleatorias alternativas, de cuyo análisis se desprenden interesantes
propiedades estadísticas . Las dos formas más comunes de estas variables
corresponden a las distribuciones muestrales de las medias y de las proporciones.
Distribución muestra! de las medias
Dada una población constitu ida por un número n de elementos, cuya media
aritmética es m y donde la desviación típica viene dada s , pueden formarse n2
muestras con reemplazamiento distintas, formadas por dos elementos de la
población .
Para cada una de estas muestras es posible una media muestra!, que denotaremos
con el símbolo x. Un ejemplo de la tabla de muestras de tamaño 2, tomada de la
población {1, 3, 5}, con sus medias aritméticas reflejadas, sería:
3., ¡
\luc>~trn 1 1.1 L3 L5 3, 1 . .:l 3 .5 S1 5 3 i 5.5
l\·IE:•dia Xi 1 l 2 3 z 3 4 3 4 1
5

A partir de la variable estadística original x de la población se puede construir una


nueva variable estadística x, que tendría como valores las medias de las muestras
tomadas de la población. La media aritmética de esta distribución muestra! de las
medias se denota por ~t :;: , y su desviación típica por fli .

Parámetros de la distribución muestra! de las medias de tamaño 2


Establecida una distribución muestra! de las medias de tamaño 2 , su esperanza
matemática adopta el valor siguiente:

E !)(] = ~1 = u;¡, = E fX]

siendo m la media aritmética de la población, x,1a media aritmética de cada muestra ,


u,, la media aritmética de todas las medias, E [x] la esperanza matemática de la
variable aleatoria x (para la población) y E [ x ) la esperanza matemática de la
variable aleatoria x(para la distribución muestra! de las medias).
Por su parte, los valores de la varianza y la desviación típica de esta distribución
muestra! de tamaño 2 son:
1
V IXl = 0 V IXl = CT;; Cii = s /V 2
donde s es la desviación típica de la población, º ··la desviación típica de la
distribución muestra!, V [x] la va rianza de la variable x (población) y V [x ] la varianza
de la variable x(d istribución muestra! de las medias).
Distribución muestra! de las medias de tamaño n
En una distribución muestra! de las medias, la variable aleatoria media muestra!
sigue una ley normal descrita como N (m,s/Ón).
l:..xtraccion
Sin rc•e-mplazo
Ll; = fl

r;: = G-'\T}
-
Hnlt.. u =u ll; =u
(1'{•
,:';; = c ·\T1 r:. = :.,\ n ·, .,,.
(:.,...
{ --n- í-=-=
T-:-, _---=-
¡,
' - - - - - ' -- - - ' -- --
Parámetros estadísticos de una distribución muestra! de las medias de tamaño n:

Distribución muestra! de las proporciones


Sea una población formada por n elementos, de los cuales algunos poseen una
determinada característica y otros no (llamaremos p a la proporción de los
elementos que poseen la característica , y q = 1 - pala de los restantes elementos).
Entonces, es posible extraer muestras de la población de manera que a cada una
se asocie como valor la proporción de la característica analizada.
Por ejemplo, en la población {1, 2 , 3}, la característica par tiene un va lor p = 1 / 3,
mientras que la impar es q = 2 / 3. Mediante la tabla siguiente de muestras se
construye una nueva distribución muestra! de las proporciones.
Muestra 1,1 1,2 1,3 2,1 2,2 2,3 3, 1 3,2 3,3
Proporción fin o 0,5 o 0,5 o 0,5 o 0,5 o
Parámetros estadísticos de una distribución muestra! de las proporciones de
tamaño n:
Ji :i.:trac nf,n
l mi reempfaztJ
IL
''
= .U ll =u
. = \ pq/n
e, . r.; _ =
'\ pq ll

lnuiu ll = u ll = ll
l(X1 " _._ - - ' - - - --1
1 "r = \ pq/n 0. = \ y,q; nl · \ t;, - rn/(N - 1)

Una distribución muestra! de las proporciones se comporta como una distribución

normal descrita por los parámetros N ,;p, \ p:¡ in, ..

Inferencia estadística
En las técnicas de muestreo, se persigue como objetivo analizar estadísticamente
las propiedades de una población a partir del estudio de muestras representativas
de todo el conjunto. La extrapolación de las conclusiones obtenidas para las
muestras a toda la población se denomina inferencia estadística. Para valorar el
grado de val idez de una inferencia de esta clase, es preciso indicar algunas
características esenciales de las muestras: errores contemplados, tamaño de la
muestra e intervalos de confianza.
Aproximación mediante una distribución muestra!
Para expresar las propiedades de una población estadística a través de un
muestreo se determinan muestras representativas de la población y se procede a
ana lizar sus parámetros estadísticos según dos té[Link] posibles: distribución
muestra! de las medias o distribución muestra! de las proporciones.
Al tratarse de una aproximación, por exacta que sea, el muestreo introduce una
diferencia entre las propiedades de la muestra y el valor real que se obtendría si se
analiza ra el conjunto de toda la población.
Por ejemplo, dada una población de tamaño N con media aritmética m y
desviación típicas , y obtenida por distribución muestra! de las medias una muestra
de la misma de tamaño n, media aritmética P;: y desviación típica (i;c , el error
absoluto introducido en el cálculo de cada med ia tendría el valor lm - µ , 1- A escala
global, la media de las medias de la distribución coincide con la media de la
población, así que las diferencias lm - ~i.:¡ serán bajas, aunque en general no nulas.

/
/!\ '¡ \

/
/ i
1
/ i
+ -;::::,__ _ _....· _ _ __;;:.........,i..., ,
µ=u
X

La distribución de todas las medias obtenidas a partir de una población mediante


una distribución muestra! de las medias tiene forma de campana de Gauss
(distribu ción norma l).
Error muestra!
Para determinar en términos estadísticos el error introducido en el muestreo se
define el concepto de error muestra! como la desviación típica de la distribución
muestra! de las medias o de las proporciones.
Valor del error muestra! en los diferentes tipos de distribuciones muestrales:
Distribución mtleStntl de Distribución [Link]~ de
las mediu lu pro¡v.1ccione.
i'(lhl:Kj'.ifl lní:1111::. o ltrdi;i -
fUli n:•('1í l¡:J~l/.;J;Ullt.i.111t• ·G; = ,:;\n) (":?· = \ pg ·11
l -'1'• 1ll.:1non ftui1:1 sm
1 r~·i~nql!az.:mll~
0 =\ ;pqnJ \ ~ - rn '(:\ - 1)
Error máximo admisible
Una distribución muestra! de las medias o de las proporciones se representa a modo
de una curva o campana de Gauss. Por tanto, nunca es posible abarcar
estadísticamente todo el área de la curva , ya que tiende asintóticamente a infinito.
Para evaluar la validez del muestreo, se maneja el concepto de nivel de confianza,
establecido como el porcentaje del área de la curva que se contempla en el estudio
(por ejemplo, el 90%, el 95%, etcétera).
Llamando d al error máximo admisible en el muestreo, la probabilidad de que la
media de la distribución muestra! y la media de la población difieran en una cantidad
menor que d se llama nivel de confianza, y se expresa por (1 - a).
En una distribución muestra! de las medias, el nivel de confianza se calcula como:

l - í1 = ]·) í
'
!.u - .U-: 1 s;, I\
)(

Como casos particulares, se obtiene que:


• Si d = º•, P = 0,6826, es decir, un nivel de confianza del 68,26%.
• Si d =2 Cl;¡ , P =0,9544, lo que sig nifica un nivel de confianza del 95,44% .
• Si d = 3 Íli , P = 0 ,9974, con un nivel del confianza del 99,74%.
Así, el nivel de confianza puede expresarse en función de la desviación típica de la
distribución muestra! de las medias, a través del valor de un coeficiente denominado
k.

En una distribución muestra! de las proporciones, el nivel de confianza obedece a


la fórmula siguiente:
1 - u = P · f. n - k \' pg, n ~ p s; f. 11 +k\ ~ :
Entre el error máximo admisible y el error muestra! existe una relación a través del
valor del coeficiente k:

Tamaño de la muestra
En la realización de estudios estadísticos, el tamaño n de una muestra
representativa depende del tamaño de la población N, del error máximo admisible
d y del nivel de confianza (1 - a), según las expresiones siguientes para determinar
el tamaño de una muestra representativa :
Ili,;trihucita:. mueztmJ d,e D.ír:trib:-.J.oíó::i ?O.\led:n,J ó.e
1m: medi:s, lo:• Jll·[Link].n.e;

[Link]~oün Í[Link] o hmta __ ltp:¡


mn 1 ~c;mplaz:I ruiQl! to .• 12
Pob~Q.(ln 6ai\4 ,in.
U?..;'~d..""1!..Jni'7:itO
n = - -- - -
d"!N - 1) + k7' CT2

Intervalos de confianza
A partir de la normalización de estudios estadísticos mediante distribuciones
muestrales, es posible determinar parámetros de una población a través de sus
valores estadísticos. Normalmente, no se indica un valor único para el parámetro
desconocido, sino un rango de valores denominado, intervalo de confianza.
Estimación paramétrica
Cuando se conoce la distribución que sigue una población estadística y se desea
determinar el valor de alguno de sus parámetros, puede elegirse una muestra
representativa de la población y aplicar las fórmulas de sus va lores estadísticos.
Este tipo de operación se denomina estimación paramétrica.
Al realizar una estimación paramétrica, pueden obtenerse dos tipos de resultados:
• Estimación puntual, con un único valor para el parámetro desconocido.
• Intervalo de confianza , que ofrece para dicho parámetro un rango de valores
comprendidos entre dos límites.
Cálculo de intervalos de confianza
En una estimación paramétrica, el intervalo de confianza [a , b] debe contener en su
interior a la media de la población m con una probabilidad igual a 1 - a, expresión
que se conoce como nivel de confianza. Es decir:
P Íi1 s ~l :5 h) = 1- u

En una distribución muestra! de las medias con media poblacional m , desviación


típica poblacional s, tamaño de la muestra n, media muestra! .u ; e intervalo de
confianza predeterminado 1 - a (expresado en porcentaje; por ejemplo, 95%), es
posible calcular el intervalo de confianza a partir de la expresión:

P (CT;¿ - 7.a,' 2 • CT/ \'n :5 µ< CT, + Za.·2 • G/ \ ' n) = 1- (1.


El intervalo de confianza de la distribución de la figura para un nivel de confianza 1
- es el formado por[-Z/2, +z,2].

En una distribución muestra! de las proporciones de tipo N (p, \ P'l 111 ), puede
determinarse el intervalo de confianza , para el cual existe una proporción p de
elementos que poseen una cierta característica, a partir de una muestra
representativa, donde la proporción es p¿, por medio de la siguiente expresión:

F' (¡ / - / ,< ~ • \ pc¡/ n .:s p:;; p ' + /-u ·¿ · \ P4· n) = 1 - u

Contraste de hipótesis
Otra operación común en el manejo de distribuciones muestrales es la que consiste
en contrastar una hipótesis de partida a través de los resultados de una muestra
obtenida de una población estad ística . El procedimiento que se sigue consta de los
pasos sig uientes:
• Proponer una hipótesis que se considera como verdadera, llamada hipótesis
nula .La inversa de la hipótesis nula se llama hipótesis alternativa.
• Definir las leyes de probabilidad de la población y de la muestra (en general, se
considera una distribución normal).
• Determinar la zona de aceptación de la hipótesis nula, mediante intervalos de
confianza . .

• Fijar posibles zonas de rechazo, donde no se admite la hipótesis nula, que se


conocen genéricamente como región crítica.
Cuando la reg ión crítica está situada a los dos lados de la zona de aceptación de la
hipótesis nula, el contraste se denomina bilateral o de dos colas; si está sólo a un
lado de la región crítica , se llama unilateral o de una cola .
n µo CT µú µ - z _Q_
.Uo- zcr/2 ·úJ iio-;-1 z[L,2 , n o [l ~
1 : "\ /J
1 1 1
1 1 1
Reglón : [Link],ón de : Reg_íón Reg ión de : RE'9 íón
rn1:1ca ' aceptación ' crítica aceptación ' crrtica

Regiones críticas y de aceptación en contraste de hipótesis bilateral (arriba) y


unilateral (abajo), en el caso de la media.

Nivel de significación
En la contrastación de hipótesis puede producirse un riesgo de rechazo de la
hipótesis para algún valor concreto del intervalo de confianza aunque la hipótesis
sea válida en el resto del intervalo. Esta probabilidad se denomina riesgo de error
o nivel de significación, y se denota por a.
• Si se acepta la hipótesis, se considera que la diferencia entre el valor del
parámetro contemplado en la hipótesis nula y el que le corresponde según la
muestra es no significativa.
• Cuando se rechaza la hipótesis nula para un valor de a = 5%, la diferencia se
dice que es significativa.
• Si la hipótesis nula se rechaza con un valor de a= 10% , se dice que la diferencia
es muy significativa.
UNIDAD 6
Test de correlación y comparación. Chi cuadrado, Odd Ratio, T de Student,
ANOVA, Me Nemar, Mann Whitley. Significación estadística.

Indispensables, son pruebas matemáticas que se aplican a las estadísticas para


determinar su grado de certeza y su significado.

Los métodos estadísticos interferenciales no paramétricos:


Son proced imientos matemáticos para testar la hipótesis estadística que, al
contrario de la estadística paramétrica, no hacen ninguna asunción sobre las
distribuciones de frecuencia de las variables que son determinadas.
El nivel de med ición puede ser nom inal u ordinal.
La muestra no tiene que ser aleatoria.
La distribución de la frecuencia no tiene que ser normal.
Se puede usar con muestras más pequeñas.
Los métodos estadísticos deductivos paramétricos:
Son los proced imientos matemáticos para testar la hipótesis estadística que asumen
que las distribuciones de las va riables determinadas tienen ciertas características .
El nivel de medición debe ser racional o intervalar.
La muestra debe ser aleatoria.
La distribución de la frecuencia debe ser normal.
La va riación de resultados entre cada frecuencia debe ser similar.
Variable de respuesta
Factor de Cualitativa Cualitativa Cualitativa Cuantitativa
estudio nominal nominal ordinal
(dos (> 2
categorías) categorías)
Cualitativo
(dos grupos)
1ndependientes z de Chi al u de Mann- t de Student-
compa ración cuadrado. Whitney. Fisher.
de Prueba de
proporciones. Welch.
Chi al
cuadrado.
Prueba exacta
de Fisher.
Apareados Prueba de Q de Prueba de t de Student-
McNemar. Cochran. los signos. Fisher para
Prueba exacta Prueba de datos
de Fisher. los rangos apareados.
signados de
Wilcoxon.
Cualitativo
(más de dos
grupos)
Independientes Chi al Chi al Prueba de Análisis de la
cuadrado. cuadrado . Kruskal- variancia.
Wallis.
Apareados Q de Cochran. Q de Prueba de Análisis de la
Cochran. Friedman. variancia de
dos vías.
Cuantitativo t de Student- Análisis de Correlación Correlación de
Fisher. la variancia. de Pearson.
Spearman. Regresión
Tau de lineal.
Kendall.
Cuando las pruebas estadísticas aplicables a las variables cuantitativas no cumplen
las asunciones necesarias para su aplicación , deben utilizarse las pruebas
correspond ientes como si las variables de respuesta fuera una variable ordinal
(pruebas no paramétricas).
PRUEBA DE KOLMOGOROV-SMIRNOV
Prueba de significación estadística no paramétrica para contrastar la hipótesis nula
cuando los parámetros de localización de ambos grupos son iguales.
Este contraste, que es vá lido únicamente para variables continuas, compara la
función de distribución (probabilidad acumulada) teórica con la observada, y calcula
un va lor de discrepancia, representado habitualmente como D, que corresponde a
la discrepancia máxima en valor absoluto entre la distribución observada y la
distribución teórica , proporcionando asimismo un valor de probabilidad P, que
corresponde , si estamos verificando un ajuste a la distribución normal, a la
probabilidad de obtener una distribución que discrepe tanto como la observada si
verdaderamente se hubiera obtenido una muestra aleatoria, de tamaño n, de una
distribu ción normal.
Si esa probabilidad es grande no habrá por tanto razones estadísticas para suponer
que nuestros datos no proceden de una distribución, mientras que si es muy
pequeña, no será aceptable suponer ese modelo probabilístico para los datos.

PRUEBA DE F
Prueba estadística que sirve para comparar va rianzas.
El estadístico F experimental es el estadístico de contraste en el ANOVA y otras
pruebas de comparación de varianzas.

TEST DE CHI AL CUADRADO


La prueba de Ji-cuadrado es cualquier prueba estadística de la hipótesis en cuál el
test estadístico de la distribución del Ji-cuadrado si la hipótesis nula es verdad.
Determina si existe asociación entre variables cualitativas.
Si el p-valor asociado al estadístico de contraste es menor se rechazará la hipótesis
nula.
Se utiliza para analizar tablas de contingencia y comparación de proporciones en
datos independientes

PRUEBA EXACTA DE FISHER (p.- 5%)


Permite valorar el efecto del azar.
Es una prueba estadística de significación usada en el análisis de los tamaños
pequeños categóricos de muestra de datos.
La necesidad de la prueba de Fischer se presenta cuando tenemos datos que se
dividan en dos categorías de dos maneras separadas.
Prueba de significación estadística utilizada para comparar proporciones en tablas
de contingencia.
Es preferible a la prueba de x2 cuando el tamaño de la muestra es reducido (de
menos de 30 efectivos).
Es la prueba estadística de elección cuando la prueba de Chi cuadrado no puede
ser empleada por tamaño muestra! insuficiente

PRUEBA DE MCNEMAR.
Prueba estadística que sirve para comparar proporciones en datos pareados.
Prueba de significación estadística para probar la hipótesis nula de inexistencia de
cambios en la proporción de sujetos que experimentan un acontecimiento, cuando
cada individuo es evaluado dos veces (en condiciones diferentes) y los datos están
emparejados.

PRUEBA BINOMIAL
En estadística, la prueba binomial es una prueba exacta de la significación
estadística de desviaciones de una distribución teóricamente prevista de
observaciones en dos categorías.
El uso más común de la prueba binomial es en el caso donde la hipótesis nula es
que dos categorías son igualmente probables ocurrir.

TEST DE CORRELACIÓN DE PEARSON


Se utiliza para estudiar la asociación entre un factor de estudio y una variable de
respuesta cuantitativa, mide el grado de asociación entre dos variables tomando
valores entre -1 y 1.
• Valores próximos a 1 indicarán fuerte asociación lineal positiva .
• Valores próxi mos a -1 indicarán fuerte asociación lineal negativa.
• Valores próximos a O indicarán no asociación lineal, lo que no significa que no
pueda existir otro tipo de asociación .
Prueba en una hipótesis nula que las frecuencias relativas de la ocurrencia de
acontecimientos observados siguen una distribución de frecuencia especificada.
Los acontecimientos deben ser mutuamente exclusivos.
Es una prueba de la calidad de ajuste que establece sí o no una distribución de
frecuencia observada diferencia de una distribución teórica.

COEFICIENTE DE KAPPA
El Kappa es un índice ómnibus de aceptación en los estudios ínter-observadores,
indica el grado de interrelación ínter-observador.
Permite cuantifica r el nivel del acuerdo ínter-observador para disminuir la
subjetividad del método utilizado (test de movilidad) y si el grado de acuerdo se debe
al azar (a la suerte).
El porcentaje de acuerdo acompañado del índice de Kappa se utiliza para las
variables cualitativas.
Se habla del coeficiente de Kappa de Cohen para dos terapeutas y de Fleiss para
más de dos terapeutas.
Este coeficiente está comprendido entre O y 1. O, corresponde a una correlación que
es idéntica a la encontrada por casualidad y 1 una correlación perfecta entre los
exámenes.
Los valores negativos indican habitualmente que existe un desacuerdo en la manera
de realizar el método entre los terapeutas.
Se calcu la como la proporción de acuerdo, aparte del que ya sería de esperar por
azar, que ha sido observado entre dos repeticiones del mismo instrumento (por
ejemplo, un juicio realizado por dos observadores por separado).
El coeficiente máximo de concordancia es de 1.00.
Un valor de 0.00 indica ninguna concordancia.
• entre 0.00 y 0.20 : ligera.
• entre 0 .21 y 0.40: pasable
• entre 0.41 y 0.60: moderada
• entre 0.61 y 0.80: importante
• entre 0.81 y 1.00: perfecta.
Un coeficiente de 0.4 puede considerarse como el límite de fiabilidad aceptable de
una prueba
El kappa es"un corrector de la medida de acuerdo".
Como test de estadística, el kappa puede verificar que el acuerdo exceda los niveles
de suerte
bloque C2-C4 bloque CS-6
Todos los bloques
Valor del Kappa K = 0.675 K = 0.756 K = 0.460
SE = 0.041 SE = 0.045 SE = 0.091
Z = 17.067 Z = 16.823 Z = 5.039
Especificidad 98% 98% 91%
Sensibilidad 74% 78% 55%
K = coeficiente de Kappa, SE = error estándar, Z =Test de especificidad de la
estadística.
COEFICIENTE DE CORRELACIÓN INTRACLASE (ICC)
El coeficiente de correlación intraclase (ICC) para las variables cuantitativas.
Utiliza el modelo 2 de Landis y Koch para la fiabilidad interexaminador, y el modelo
3 para la fiabilidad intraexaminadores (Landis RJ et Koch GG , 1977).
Este índice está también comprendido entre O y 1.
- El valor 1 corresponde a una reproductividad perfecta entre las mediciones.
- El valor O indicaría que existe la misma variancia entre las mediciones tomadas
sobre un único paciente que las mediciones tomadas entre diferentes pacientes.
TESTS ICC KAPPA
Altura crestas ilíacas 52 0.26
Altura EIPS 75 0.54
TFD 82 0.62
TFS 63 0.26
Gillet 60 0.18
Elev. activa pierna extendida 93 0.81
Joint play 75 0.61
Thigh thrust 81 0.73
Separación 58 0.17
Gaenslen 80 0.51
Patrick 80 0.65
Sacral thrust 68 0.38
Sensibilidad ligamento SI. 91 0.83
Compresión 85 0.59

TEST DE CORRELACIÓN DE SPEARMAN


Es una medición no paramétrica de correlación, asume una función monotónica
arbitraria para describir la relación entre dos variables, sin hacer ningunas
asunciones sobre la distribución de frecuencia de las variables.
A la diferencia del coeficiente del test de Pearson, no requiere la asunción que la
relación entre las variables es linear, ni que las variables sean medidas en escalas
del interva lo; puede ser utilizado para variables medidas en nivel ordinal.
Se utiliza si no se cumplen las condiciones de aplicación del test de Pearson.
Es una variante del test de correlación de Pearson se aplica cuando cada valor en
sí no es tan importante como su situación respecto a los restantes.
Sus valores se interpretan exactamente igual que los del coeficiente de correlación
de Pearson.
La correlación de Spearman mide el grado de asociación entre dos variables
cuantitativas que siguen una tendencia siempre creciente o siempre decreciente.
Es más general que el Coeficiente de correlación de Pearson, la correlación de
Spearman, en cambio se puede calcular para relaciones exponenciales o
logarítmicas entre las variables.
TEST DE WILCOXON
Contrasta la hipótesis nula de que la muestra procede de una población en la que
la magnitud de las diferencias positivas y negativas entre los va lores de las variables
es la misma.
Prueba estadística no paramétrica para la compa ración de dos muestras (dos
tratamientos).
Las distribuciones de datos no necesitan seguir la distribución normal.
Es por tanto una prueba menos restrictiva que la prueba t-Stu dent.

PRUEBA DE SHAPIRO-WILKS.
Aunque esta prueba es menos conocida es la que se recomienda para contrastar el
ajuste de nuestros datos a una distribución normal, sobre todo cuando la muestra
es pequeña (n<30).
Mide el ajuste de la muestra a una recta, al dibujarla en papel probabilístico normal.

PRUEBA "t" DE STUDENT-FISHER


Si se comparan dos grupos respecto a una variable cuantitativa.
En caso contrario, se utiliza una prueba no paramétrica equiva lente, como la U de
Mann-Whitney.
Se utiliza para la com paración de dos medias de poblaciones independientes y
normales.
Prueba de s ignificación estadística paramétrica para contrastar la hipótesis nula
respecto a la diferencia entre dos medias.
Cuando las dos med ias han sido calcu ladas a partir de dos muestras
completamente independientes de observaciones (situación poco probable en la
práctica , por lo menos desde un punto de vista teórico), la prueba se describe como
no emparejada.
Cuando las dos m edias han sido extraídas de observaciones consecutivas en los
mis mos s ujetos en dos s ituaciones diferentes, se comparan los valores de cada
in div iduo, y se aplica una prueba emparejada.
La prueba "t" de Student es un tipo de estadística deductiva.
Se utiliza para determinar si hay una diferencia significativa entre las medias de dos
grupos.
Con toda la estadística deductiva, asumimos que las variables dependientes tienen
una distribución normal.
Especificamos el nivel de la probabilidad (nivel de la alfa, nivel de la significación ,
p) que estamos dispuestos a aceptar antes de que cerco datos (p < .05 es un valor
común que se utiliza).
Notas sobre la prueba t de Student:
• Cuando la diferencia entre dos promedios de la población se está investigando,
se utiliza una prueba t. Es decir que se utiliza cuando deseamos comparar dos
medias (las cuentas se deben medir en una escala de intervalo o de cociente).
• Utilizaríamos una prueba t si deseamos comparar el logro de la lectura de
hombres y de mujeres.
• Con una prueba t, tenemos una variable independiente y una dependiente.
• La variable independiente (géne ro en este caso) puede solamente tener dos
niveles (varón y hembra).
• Si la independiente tuviera más de dos niveles, después utilizaríamos un análisis
de la va riación unidireccional (ANOVA).
• La prueba estadística para t de Student es el valor t. Conceptualmente, la t-valor
representa el número de unidades estándares que están separando las medias de
los dos grupos.
• Con una t-prueba , el investigador desea indicar con un cierto grado de confianza
que la diferencia obtenida entre los medios de los grupos de la muestra sea
demasiado grande ser un acontecimiento chance .
• Si nuestra t-prueba produce una t-valor que da lugar a una probabilidad de .01,
decimos que la probabilidad de conseguir la diferencia que encontramos sería por
casualidad 1 en 100 veces.
Cinco factores contribuyen para indicar si la diferencia entre dos medias de los
grupos se puede considerar significativa:
1. Cuanto mayor es la diferencia entre las dos medias, mayor es la probabilidad que
una diferencia estadística sig nificativa existe.
2. La cantidad de traslapo que existe entre los grupos (es una función de la variación
dentro de los grupos). Cuantas más pequeñas son las variaciones que existen entre
los dos grupos, mayor es la probabilidad que una diferencia estadística significativa
existe.
3. El tamaño de la muestra es extremadamente importante en la determinación de
la significación de la diferencia entre las medias. Aumentando el tamaño de la
muestra, las medias tienden a ser más estables y más representativas.
4. Un nivel más grande de la alfa requiere menos diferencia entre las medias (p <
.05).
5. Se debe utilizar una hipótesis (con dos colas) no directivas.
Asunciones subyacentes la prueba de t:
1. Las muestras se han dibujado aleatoriamente a partir de sus poblaciones
respectivas.
2. La población se debe distribuir normalmente.
3. Unimodal (un modo).
4. Simétrico (las mitades izquierdas y derechas son imágenes espejo), el mismo
número de gente arriba o abajo de la media.
5. Acampanado (altura máxima (moda) en el medio).
6. Media, moda, y mediana se localizan en e l centro.
7. Asintótico (cuanto más lejos se aleja la curva de la media, más cerca na será el
eje de X; pero la curva nunca debe tocar el eje de X).
8. El número de personas en las poblaciones debe tener la misma varia nza (s2 =
s2).Si no es el caso se utiliza otro cálculo para el error estándar.
Existen 2 tipos de prueba t de Student
• Test t para diferencia par ( grupos dependientes, test t correlacionado) : df= n
(número de pares) -1
Esto se refiere a la diferencia entre las cuentas medias de una sola muestra de
individuos que se determina antes del tratamiento y después del tratamiento. Puede
también comparar las cuentas medias de muestras de individuos que se aparean
de cierta manera (por ejemplo los hermanos, madres, hijas, las personas que se
emparejan en términos de las características particulares).
• Test t para muestras independientes
Esto se refiere a la diferencia entre los promedios de dos poblaciones.
Básicamente, el procedimiento compara los promedios de dos muestras que fueron
seleccionadas independientemente una de la otra.
Un ejemplo sería comparar cuentas matemáticas de un grupo experimental con un
grupo de control.

¿Cómo decido qué tipo de t-prueba a utilizar?


Error tipo 1:
• Rechaza una hipótesis nula que sea realmente verdad . La probabilidad de hacer
un error tipo I depende del nivel alfa que se Eligio.
• Si se fijó la probabilidad alfa en p < 05, entonces existe un 5% de posibilidades
de hacer un error de tipo l.
• Se puede reducir la posibilidad de hacer un error tipo I fijando un nivel alfa más
pequeño (p < .0 1). El problema haciendo esto es que se aumenta la posibilidad de
un error tipo 11.
Error tipo 11:
• Falla en rechazar una hipótesis nula que sea falsa.
• La idea básica para calcular una prueba de Student es encontrar la diferencia
entre las med ias de los dos grupos y dividirla por el error estándar (de la diferencia),
es decir la desviación de estándar de la distribución de las diferencias.
• Un inteNalo de confianza para una prueba t con dos colas es ca lculado
multiplicando los valo res críticos por el error de estándar y agregando y restando
eso de la diferencia de las dos medias.
• El efecto tamaño se utiliza para calcular la diferencia práctica. Si existen varios
miles de pacientes, es muy fácil encontrar una diferencia estadísticamente
significativa.
• Saber si esa diferencia es práctica o significativa es otra pregunta.
• Con los estudios implicando diferencias de grupo, el tamaño del efecto es la
diferencia de las dos medias dividido por la desviación estándar del grupo control (o
la desviación estándar media de ambos grupos si no hay grupo de control).
• Generalmente, el tamaño del efecto es solamente importante si existe una
significación estadística.
• Un efecto tamaño de 2 se considera pequeño, 5 se considera medio, y 8 se
considera grande.

TEST DE MANN-WHITNEY
La prueba de Mann-Whitney U es una de las pruebas de significación más
conocidas.
Es apropiada cuando dos muestras independientes de observaciones se 'miden en
un nivel ordinal, es decir que podemos decir cuál es la mayor de estas dos
observaciones.
Determina si el grado de coincidencia entre dos distribuciones observadas es
inferior a la esperada por suerte en la hipótesis nula que las dos muestras vienen
de una misma población.
Prueba de significación estadística no paramétrica para probar la hipótesis nula de
que el parámetro de localización (generalmente la mediana) es el mismo cuando se
comparan dos grupos independientes, cualquiera que sea el tipo de distribución de
la variable (distribución normal o de otro tipo).
Se usa cuando se quiere comparar dos poblaciones usando muestras
independientes, es decir; es una prueba alterna a la prueba de t para comparar dos
medias usando muestras independientes.
La hipótesis nula es que la mediana de las dos poblaciones son iguales y la hipótesis
alterna puede ser que la mediana de la población 1 sea mayor (menor ó distinta) de
la mediana de la población 2.
Prueba de Mann-Whitney para muestras independientes:
• Si tenemos dos series de valores de una variable continua obtenidas en dos
muestras independientes: X1 , X2, ... , Xn, Y1, Y2 , .. . , Ym , procederemos a ordenar
conjuntamente todos los valores en sentido creciente, asignándoles su rango,
corrigiendo con el rango medio los empates.
• Calculamos luego la suma de rangos para las observaciones de la primera
muestra Sx, y la suma de rangos de la segunda muestra Sy.
• Si los valores de la población de la que se extrajo la muestra aleatoria de X se
localizan por debajo de los valores de Y, entonces la muestra de X tendrá
probablemente rangos más bajos, lo que se reflejará en un valor menor de Sx del
teóricamente probable.
• Si la menor de las sumas de rangos es excesivamente baja, muy improbable en
el caso de que fuera cierta la hipótesis nula, ésta será rechazada.

PRUEBA DE KRUSKAL-WALLIS
Prueba de significación estadística no paramétrica para contrastar la hipótesis nula
cuando los parámetros de localización de dos o más grupos son iguales.
La prueba de Kruskal-Wallis, es una alternativa a la prueba F del análisis de
varianza para diseños de clasificación simple. En este caso se comparan varios
grupos pero usando la mediana de cada uno de ellos, en lugar de las medias.
La prueba de Kruskal-Wallis, es una alternativa a la prueba F del análisis de
varianza para diseños de clasificación simple.
En este caso se comparan varios grupos pero usando la mediana de cada uno de
ellos, en lugar de las medias.
• Ho: La mediana de las k poblaciones consideradas son iguales y,
• Ha: Al menos una de las poblaciones tiene mediana distinta a las otras.

H = 12
n(n+l)
±
M
RJ -J(n+l)
11¡

Donde, n es el total de datos.


Este contraste , que es válido únicamente para variables continuas, compara la
función de distribución (probabilidad acumulada) teórica con la observada, y calcula
un valor de discrepancia, representado habitualmente como D, que corresponde a
la discrepancia máxima en valor absoluto entre la distribución observada y la
distribución teórica, proporcionando asimismo un valor de probabilidad P, que
corresponde, si estamos verificando un ajuste a la distribución normal, a la
probabilidad de obtener una distribución que discrepe tanto como la observada si
verdaderamente se hubiera obtenido una muestra aleatoria, de tamaño n, de una
distribución normal.
Si esa probabilidad es grande no habrá por tanto razones estadísticas para suponer
que nuestros datos no proceden de una distribución, mientras que si es muy
pequeña, no será aceptable supo ner ese modelo probabilístico para los datos.

PRUEBAS NO-PARAMÉTRICAS
El análisis de la variació n asume que las distribuciones subyacentes están
distribuidas normalmente y que las variaciones de las distribuciones que son
comparadas son similares.
El coeficiente de correlación de Pearson asume normalid ad.
Mientras que las técnicas paramétricas son robustas (es decir, conserva n a menudo
un poder considerable para detectar diferencias o semejanzas incluso cuando se
violan estas asunciones), algunas distribuciones violan tanto que un alternativa no
paramétrica es más deseable para detectar una diferencia o un a semejanza .

Pruebas no paramétricas para muestras relacionadas


Prueba Núm. Variables Objetivo
devariables
McNemar 2 Cualitativas : 2 Determinar si la diferencia entre las
valores distribuciones de frecuencias de los
valores de las dos variables es
estad ísticame nte significativa.
Signos 2 En escala al Determinar si la diferencia entre el
menos ordinal número de veces en que el valor de
una variable es mayor que el de la
otra y el número de veces en que es
menor es estadísticamente
1 significativa.
Wilcoxon 2 En escala al Determinar si la diferencia e ntre la
menos ordinal magnitud de las diferencias positivas
entre los valores de las dos variables
y ia magnitud de las diferencias
negativas es estadísticamente
significativa.
Q de p>2 Cualitativas: 2 Determinar si las diferencias entre las
Cochran valores distribuciones de frecuencias de los
valores de las p variables son
estadísticamente significativas.
F de p>2 En escala al Determinar si las diferencias entre las
Friedman menos ordinal distribuciones de las p variables son
estadísticamente significativas.

ELECCIÓN DE LA TÉCNICA ESTADÍSTICA APROPIADA


Con los elementos definidos en los párrafos anteriores se pueden establecer árboles
de decisión para la ayuda en la elección de la técnica o prueba estadística
apropiada.
Existen más de 300 pruebas estadísticas básicas, con lo que es difícil poder
abordarlas todas de forma exhaustiva en este artícu lo.
Criterio Descripción Aclaraciones
Estadística Ningún contenido estadístico o únicamente
1
descriptiva estadística descriptiva
Pruebas t de Student, Para una muestra o dos muestras (datos
2
pruebas z apareados y/o independientes)
Chi cuadrado , prueba exacta de Fisher, test
3 Tablas bivariables
de MC Nemar
Tests no Test de los signos. U de Mann-Whitney,
4
para métricos prueba t de Wilcoxon
Riesgo relativo . Odds ratio. Log. Odds.
Estadísticas demo-
5 Medidas de asociación. sensibilidad y
epidemiológicos
especificidad
Correlación lineal de Correlación clásica (coeficiente r de
6
Pearson correlación lineal)
Correlación lineal de Correlación clásica (coeficiente r de
7
Pearson correlación lin ea l)
Regresión de mínimos cuadrados con una
8 Regresión simple
variable productora y una respuesta
9 Análisis de varianza ANOVA, análisis de la covarianza, pruebas F
Transformación de
10 Empleo de transformaciones (logarítmicas .... )
variables
Correlación no Rho de Spearman, Tau de Kendall, pruebas
11
paramétrica de tendencia
Incluye la regres ión polinómica y la regresión
12 Regresión múltiple
paso a paso
Comparaciones
13 Comparaciones múltiples
múltiples
Ajuste y Estandarización de tasas de incidencia y
14
estandarización prevalencia
Procedimientos de Mantel-Haenszel- modelos
15 Tablas multivariables
log . lineales
Potencia y tamaño Determinación del tamaño de la muestra en la
16
muestra! base a una diferencia detectable
Incluye tablas de vida, regresión de
Análisis de la
17 supervivencia y otros anális is de
supervivencia
supervivencia
Estimación de los costes de sa lud para
Análisis coste-
18 comparar directrices alternativas (coste-
beneficio
efectividad)
Test no incluidos en las categorías
19 Otros análisis precedentes: análisis de Sensibilidad , aná lisis
cluster. Análisis discriminante.
Clase Práctica 1.
Asignatura: Bioestadística
Tema 1: Estadística
Descriptiva
Titulo: Ejercicios sobre organización y resumen de la información.
Objetivos:
1. Construir la tabla de distribución de frecuencia segú n tipo de variable.
2. Calcular e interpretar las medidas de resumen de·la información.

Ejeq En el diagnóstico de situación de sj!]u de un área, al recolectar los datos


de 86 pacientes obtenemos que en el grupo dispensa.J!.a I hay 22 pacientes, en el grupo
111, 43 pacientes y en el grupo IV, 2 paciente J>~¿(7,,'tf'
Q Clasifique la variable grupo dispensarial.
((§} Calcule la cantidad de pacientes que se encuentran en el grupo dispensarial 11.
c) Constru ya la tabla de distribución de frecuencia de la variable grupo dispensarial. __.,.....
é por ciento de pacientes se encuentran en el grupo dispensarial IV?

16
"&1-r.,,· gnóstico de situación de salud de un área, se recogen los datos de •
pacientes y se realizó el procesamiento estadístico a la variable hemoglobina (Hb) y se
obtuvo la tabla de distribución de frecuencia que a continuación se muestra. Responda
las preguntas siguientes.
Hb (g/dl) Fa Fr Faa Far f,. ~ ~ a, e~ ~[Link]-J
-;:-(.,,.-1;o.l').
100:5 X :5 111 11 0,14
-20.-· o,a~.. .
-¡,1. q ¡1¡
111 < X :5 122
1 ' (¿. ( : ~-=- \.,~-~-~)
-· :!, 1 D .ti.O

122< X :5 133 15 0,"2.0 4b


I
o,(.()
"
{, - -,-e, ----- --
- 133< X :5 144 . 22 0 ' lf. ..(:,s ~B'í
144<x :5155 8 Q (
II ~b ;,-..... f-.-

Total 76
/.<XJ ~ _/

a. Complete la tabla de distribución de frecuencia de la variable hemoglobina. /


b. Interprete la Fa y Faa de la segunda clase. ¡'
3 1nterprete la Fr y Far de la tercera clase
@¿ Qué cantidad de pacientes tienen menos de 144 g/dl de hemoglobina?
(y ¿Qué por ciento de pacientes tienen entre 133< x s; 144 g/dl de hemoglobina?
Ejercicio 3.
Para los 89 pacientes de un área de salud, en el diagnóstico de situación de salud
realizado, se obtuvo, a través de un paquete estadístico el siguiente resumen de·
información.
Hb en g/dl
Media 125,87
Mediana 127,00
Moda 123,00
Desviación estándar 11 ,75
Mínimo 100,00
Máximo 152,00
Tamaño de la muestra 89
a. Interprete cada una de las medidas descriptivas para la variable Hb en g/dl

Ejercicio 4.
Para un estudio en la sala de Cirugía de un hospital, un grupo de investigadores recogió datos de las
historias clínicas del grupo de pacientes ingresados en la última semana de noviembre de 2017. Como
resultado del procesamiento de obtuvo la siguiente información acerca del peso de éstos:

Peso (en Kg) Fa Faa Fr Fra


35<x<=40 1 1 0,03
40<x<=45 5 0.17 0.2
45,<x<=SO 5 11 0.17
50<x<=55 10 21 0,34 0.71
SS<x<=?O 4 0,14 0.85
60<x<=~5 2 27
65<x<=¡70 2 29 0,07 1.00
Total

a. ¿Cómo clasificarías la fuente de obtención de esta información? Justifique

b. Clasifique la variable peso y diga qué gráfico se puede usar para representar sus
frecuencias absolutas.
c. Complete la tabla estadística
d. Interprete:
la frecuencia absoluta de la primera clase
- la frecuencia acumulada absoluta de la tercera clase
la frecuencia relativa de la última clase
la frecuencia acumulada relativa de la segunda clase.
e. Calcule e interprete la razón entre las clases 5y 4.
f. Calcule e interprete el índice entre las clases 5 y 4.
g. Diga qué porcentaje de sujetos tienen entre 40 y 45 kilogramos de peso.
h. ¿Cuántos pacientes pesan más de 60 kg?
i. Mencione las medidas de tendencia central, de dispersión y de posición relativa que se
pueden calcular con esta variable.
Ejercicio 6. .,
A continuación se dan frecuencias absolutas de otra variable importante para el referido
estud io:

-.,.
~

?-aa t f' ~
• 9 r11·5. J

- No
Pasto eratorias
Total
- .3'?
5(() -
(i ~Z.
•---
11 :)0.
L-
'

j. Clasifique la variable y diga qué tipo de gráfico se puede usar para representar sus
frecuencias absolutas.
k. ¿Por qué no tienen sentido las frecuencias acumuladas para esta variable?
l. Calcule las frecuencias que faltan. ¿Qué relación hay entre las frecuencias relativas y los
porcentajes?
0m. Calcule e interprete la razón entre la categoría No y la categoría lntraoperatorias. ¿cuál
sería el índice entre estas categoría~?
n. Interprete todas las frecuencias de la 3ra categoría.
o. ¿Cuáles de las medidas descriptivas que conoces no se pueden calcular con esta
variable? Justifique su respuesta.
p. Mencione 4 medidas descriptivas que se pueden calcular con esta variable? Justifique su
respuesta.

<:,)J >"-,.· . ~ .._, <3--- &.- , ( ~ e ,( • ._

~.h-:)_.1-, .... , . .... ,


~-~'t,
-
•¡ ....
: ,¿
·,¡.;..~-. .
k- ~.s ,....._~ ~
~

L. -

'' '
C'

o-
Clase Práctica 2.
Asignatura:
Bioestadística
Tema: 3, 4 y 5.
Titulo: Ejercicios sobre estadística demográfica, tab las y gráficos, y est adística
inferencia l.

Objetivos:
1. Identificar los principa les gráficos y el tipo de variable donde se uti lizan .

2. Rea lizar inferencias estadísticas básicas.

1. En un estudio realizado en el Centro de Médico "Florida Sur" en la Provi ncia de


Bue nos Aires en el periodo de enero de diciembre de- 2018 se analizó la variable
complicaciones quirúrgicas de los pacientes:
a . Calcule las frecuencias ue faltan .
~ - L - - - - - - -- - -- - ---,

Posto eratorias
Total r 1Y ·1)
b. Clasifique la variable y diga qué tipo de gráfico se- puede usar para represe ntar
sus frecuencias absolutas.
,. c. Interprete la categoría Complicaciones quirúrgicas lntraoperatorias.
-..__ .Q_ Interprete todas las frecuencias de la 3ra categoría .
·2. Identifique el tipo de gráfico y diga un tipo de variable (cualitativa, cuantitativa o
ambas) podrían representarse en ellos:
Tasa de Mortalidad Infantil 2007

:1111111111 Hul111111f tl
TASA DE MORTALIDAD INFANTIL por 1.000 nacidos vivos
Arsentin a 2000-2017

,.

2000 2001 1001 2003 2()()11 2DOS 2.006 1001 toog 2009 7010 2011 2011 20U 20J4 201S 2016 2017

b.

) ..
--
. i
\...;

-~-
··"··--.....,,,,-
E :..Oll
•• ,,u

i....L.,. _ _ _ _
c.
Ciit.,.),,f1('A-'
DEFl~C101''ES ~[Link]..."-:AS POR CAL'~ tUú

(O'Tl:>i Cló01ti...t
1Jl.t:'"!'!•~r,c.10i8
d. [Link]:.[Link]

3. En un área de salud de la Provincia de Buenos Aires se realizó una intervención


educativa sobre la prevención de la anemia en el embarazo. Para evaluar la
efectividad de la intervención educativa (conjunto de charlas) se seleccionaron al
azar 92 embarazadas, y se realizó un instrumento de evaluación de conocimientos
(en~ta) antes·y después de la intervención educativa. A partir de estos datos:
a . Escriba las hipótesis apropiadas: Hipótesis nula (Ha) e Hipótesis alternativa
(H1 ).
b. Diga que tipo de muestreo probabilístico pudo haberse utilizado para
seleccionar la muestra.
c. Luego de analizar los datos estadísticos, se encontró una significación
estadística con p<0.05. Interprete este resultado.
4. Menciones dos propiedades de la media aritmética y de la moda.
t,, l-, • lh > cJr-. ("~ U>- L-, .1..¡ v ~ ).
i2<.. ¡ _
;_;---- •v_.>~-z.c:....
cJ.. ~z_-Z.:::,

~·(·L ~¡J . ln) ~


\
h..- e...,1...,...-.
J...: L., -:...,
1" 'v-- 1 1,- -L.

~...., ' ,.. ,.8· -i.:o- Q_ '- .,.,e__ ..,J ,,L . CtJ-,::, ~ -
(..1,(\ /.). ) ~ .
@~~ ~,~ p.-o~~' l) i, ~-
@(¿- D/~~ . IGX) ~~
0 1
0 0:S ~<o? ~ ~

También podría gustarte