100% encontró este documento útil (1 voto)
201 vistas48 páginas

Texto Base Bioestadística

Este documento presenta una introducción a la bioestadística. Explica brevemente la historia de la bioestadística y sus principales contribuidores como Francis Galton, Karl Pearson y Ronald Fisher. Distingue entre estadística y bioestadística, señalando que la bioestadística se aplica a las ciencias de la vida. Finalmente, define la estadística descriptiva e inferencial y los pasos del método científico en un estudio estadístico.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
100% encontró este documento útil (1 voto)
201 vistas48 páginas

Texto Base Bioestadística

Este documento presenta una introducción a la bioestadística. Explica brevemente la historia de la bioestadística y sus principales contribuidores como Francis Galton, Karl Pearson y Ronald Fisher. Distingue entre estadística y bioestadística, señalando que la bioestadística se aplica a las ciencias de la vida. Finalmente, define la estadística descriptiva e inferencial y los pasos del método científico en un estudio estadístico.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Bioestadística e Informática Aplicada 1

BIOESTADÍSTICA E
INFORMÁTICA APLICADA

Autor: Lic. Jimmy Orellana Maturano

Gestión: 2021
Bioestadística e Informática Aplicada 2

Índice.

TABLA DE CONTENIDO Pág.


Tema 1: Introducción
1.1 Historia de la Bioestadística.
1.1. Introducción a la Bioestadística.
1.3 Estadística y Bioestadística
1.4 ¿Para qué sirve la Estadística?
1.5 Definición
1.6 La Estadística Descriptiva
1.7 La Estadística Inferencial
1.8 Método científico y estadística.
Tema 2: Conceptos Básicos de Estadística
2.1 Población.
2.2 Muestra
2.3 Dato
2.4 Estadístico y parámetro
2.5 Escalas de medición
2.6 Variable
2.7 Modalidades
Tema 3. TABLA DE FRECUENCIAS.
3.1 Conceptos importantes
3.2 Conceptos importantes
3.3 Histogramas
3.4 Polígono de frecuencias
3.5 Grafica de sectores o diagramas circulares
Tema 4. Media, Mediana y Moda
4.1 Media
4.2 Mediana
4.3 Moda
4.4 Media, para datos clasificados
4.5 Mediana, para datos clasificados
Bioestadística e Informática Aplicada 3

4.6 Moda, para datos clasificados


4.7 Calculo de cuartiles en SPSS
Tema 5. Interpretación de datos
Tema 6. Muestreo y estimación
6.1 Muestreo
6.2 Muestreo probabilístico
6.2 Métodos más utilizados
1.1 Muestreo aleatorio simple
1.2 Muestreo aleatorio sistemático
1.3 Muestreo aleatorio estratificado
Tema 7 SPSS

2. Capítulo 1
2.1 HISTORIA DE LA BIOESTADÍSTICA
El primer médico que utilizó métodos matemáticos para cuantificar variables de pacientes y sus
enfermedades fue el francés Pierre Charles-Alexandre Louis (1787-1872), en un estudio de la
tuberculosis, que influyó en toda una generación de estudiantes. Sus discípulos, a su vez,
reforzaron la nueva ciencia de la epidemiología con el método estadístico.
Otros eventos a considerar son los deWilliam Heaton Hamer (1862-1936) propuso un modelo
temporal discreto en un intento de explicar la ocurrencia regular de las epidemias de sarampión.

John Brownlee (1868-1927), luchó durante veinte años con problemas de cuantificación de la
infectividad epidemiológica. Ronald Ross (1857-1932) exploró la aplicación matemática de la teoría
de las probabilidades con la finalidad de determinar la relación entre el número de mosquitos y la
incidencia de malaria en situaciones endémicas y epidémicas. El cambio más radical en la
dirección de la epidemiología se debe a Austin Bradford Hill (1897-1991) con el ensayo clínico
aleatorizado y, en colaboración con Richard Doll (1912),el épico trabajo que correlacionó el tabaco
y el cáncer de pulmón.

El precursor histórico y llamado padre de la Bioestadística fue el inglés: Sir Francis Galton(1822-
1911), introdujo un método matemático para el ajuste de curvas a puntos experimentales: el de los
mínimos cuadrados. Además formuló los conceptos de Regresión y Correlación.
Bioestadística e Informática Aplicada 4

Karl Pearson aplicó la estadística a los problemas biológicos de la herencia y la evolución,


resaltándose la publicaciones realizadas entre 1893-1912 tituladas "Contribuciones de la
Matemática a la teoría de la Evolución", en las cuales se encuentran contribuciones al Análisis de
Regresión, Coeficiente de Correlación. Descubrió la Distribución Chi-cuadrada y fue el quien acuñó
el término Desviación Estándar.

Ronald A. Fisher (1890-1962), considerado el creador del 50% de la Bioestadística actual. Fisher
realizó muchos avances en la estadística, siendo una de sus más importantes contribuciones, la
inferencia estadística creada por él en1920. En Cambridge en 1912, estudió la teoría de errores.
Se dedicó al estudio pionero de los principios del diseño de experimentos (The Design of
Experiments, 1935). Elaboró sus trabajos sobre el Análisis de Varianza (procedimiento utilizado en
todo el mundo).

1.2 INTRODUCCIÓN A LA BIOESTADÍSTICA.


Constantemente buscamos información para tomar decisiones. Al levantarnos en la mañana
observamos cómo está el tiempo para decidir cómo vestirnos o averiguamos si va a llover para
decidir si llevamos paraguas, etc. Inconscientemente aplicamos la lógica estadística para tomar
ese tipo de decisiones. Además, podemos usar la estadística para situaciones tan diversas como:
• Analizar si el tabaquismo se asocia al cáncer al pulmón.
• Analizar si la reforma educacional mejoró la calidad de la Educación en Venezuela.
• Predecir los resultados de las próximas elecciones.
• Predecir si ocurrirá una situación de emergencia ambiental en Mérida. Aprender Estadística es
como aprender un nuevo idioma.

1.3 Estadística y Bioestadística


Deriva su nombre del hecho de haber sido aplicada primeramente a la recolección de datos que
permitieran la administración de los estados, con propósitos militares e impositivos, preocupación
fundamental de los Imperios, debido a que los gobernantes necesitaban conocer información
referente al número y riquezas de sus súbditos.

Se derivan dos significados:


1. El término estadísticas, en plural, es sinónimo de datos numéricos.
2. Estadística, en singular, es el método utilizado en el manejo de datos.
Bioestadística e Informática Aplicada 5

Por lo tanto la Estadística es un método con procedimientos lógicos que logran el máximo de la
experimentación científica. A pesar de la sencilla caracterización de Estadística, ésta nos permite
entrever vastos campos de acción, pudiéndose decir que no hay prácticamente rama del saber
humano en donde no tenga utilización. Sin embargo, lo anterior no quiere decir que la Estadística,
sea el único mecanismo a través del cual puedan obtenerse nuevos conocimientos o que el solo
hecho de manejar una gran cantidad de datos numéricos implique un trabajo científico.

Especificando de una vez se define a la Estadística, como una ciencia que estudia la recolección,
análisis e interpretación de datos, ya sea para ayudar en la toma de decisiones o para explicar
condiciones regulares o irregulares de algún fenómeno, problema o estudio aplicado, de ocurrencia
en forma aleatoria o condicional. Sin embargo estadística es más que eso, en otras palabras, es
el vehículo que permite llevar a cabo el proceso relacionado con la investigación científica. Es una
ciencia transversal a una amplia variedad de disciplinas, desde la física hasta las ciencias sociales,
desde las ciencias de la salud hasta el control de calidad. Se usa para la toma de decisiones en
áreas de negocios o instituciones gubernamentales.

Cuando se hace referencia a la Bioestadística, se considera una rama de la estadística aplicada a


la ciencias de la vida, la cual ha sido clave en el desarrollo de nuevos fármacos, en el entendimiento
de enfermedades crónicas; la estrecha relación de la Estadística con el método científico hace de
la Bioestadística una disciplina imprescindible en la mayoría de los proyectos de biológicos y de
salud.

El pensamiento estadístico aplicado a las ciencias de la salud no sólo resuelve y entiende compleja
metodología para dar respuesta a hipótesis, sino que es capaz de organizar el “sistema” que
involucra la investigación desde el diseño general de experimentos en el área específica, diseño
de muestreo, control de calidad de la información, análisis y presentación de resultados.

1.4 ¿Para qué sirve la Estadística?

 La ciencia se ocupa en general de fenómenos observables


Bioestadística e Informática Aplicada 6

 La ciencia se desarrolla onservando hechos, formulando leyes que los explican y realizando
experimentos para validar o rechazar dichas leyes
 Los modelos que crea la ciencia son de tipo aleatorio (estocastico)
 La Estadistica se uliliza como tecnología al servicio de las ciencias donde la variabilidad y
la incertidumbre forman parte de su naturaleza.
 “La Bioestadistica, enseña y ayuda a investigar en todas las áreas de las Ciencias de la
vida donde la variabilidad no es la excepción sino la regla” Carrasco de la peña (1982)

1.5 Definición.
La estadística es la ciencia de la:
 Sistematizacion, recolección, ordenación y presentación de los datos
referentes a un fenómeno que presenta variabilidad o incertidumbre para su
estudio metodológico, con objeto de

 Deducir la leyes que rigen esos fenómenos,

 Y poder de esa forma hacer previsiones sobre los mismos, tomar decisiones
y obtener conclusiones.

1.6 La Estadística Descriptiva, es una parte de la Estadística como su nombre lo indica


caracteriza, detalla, especifica, grafica, presenta los datos de un conjunto de elementos
delimitados espacial y temporalmente, por lo tanto, describe los elementos de una muestra objeto
de investigación, resumiéndolos resultados numéricamente por medio de tablas, gráficas,
indicadores, estadísticos, para enunciar lo obtenido en una muestra fenómenos, temas o
problemas en estudio.

1.7 La Estadística Inferencial, es una parte de la Estadística que hace referencia a los
procedimientos y técnicas de muestreo, diseños experimentales, inferencias y predicciones de una
población, para hacer pruebas de hipótesis, estimaciones, correlaciones, regresiones,
modelamiento de datos.

1.8 Método científico y estadística.


Bioestadística e Informática Aplicada 7

Pasos en un estudio estadístico


 Plantear hipótesis sobre una población
o Los fumadores tienen “más bajas ” laborales que los no fumadores
o ¿En qué sentido? ¿Mayor numero? ¿Tiempo medio?
 Decidir que datos recolectar (diseño de experimentos)
o Que individuos pertenecerán al estudio (muestras)
 Fumadores y no fumadores en edad laboral
 Criterios de exclusión ¿Cómo se eligen? ¿Descartamos los que padecen
enfermedades crónicas?
o Que datos recolectar de los mismos (variables)
 Número de bajas
 Tiempo de duración de cada baja
 ¿Sexo? ¿Sector laboral? ¿otros factores?
 Recolectar datos (muestreo)
o ¿Estratificado? ¿Sistemáticamente?
 Describir (resumir) los datos obtenidos
o Tiempo medio de baja en fumadores y no fumadores (estatificado)
o % de bajas por fumadores y sexo (frecuencias), graficos
 Realizar una inferencia sobre la población
o Los fumadores están de baja al menos 10 dias/año de media que los no fumadores
 Cuantificar la confianza de la inferencia
o Nivel de confianza 95%
Bioestadística e Informática Aplicada 8

Ejemplo 1. Para una patología que afecta a una población:


 JOSE observó ciertas formas bacilares en los esputos de pacientes tuberculosos (Paso 1)
 Como hipótesis de trabajo atribuyó a ellas la causa de la enfermedad (Paso 2).
 Comprobó que el bacilo se encontraba en los esputos de individuos tuberculosos y nunca
de los procedentes sin la enfermedad (Paso 3).

3. Tema2. CONCEPTOS BÁSICOS DE ESTADÍSTICA


3.1 POBLACIÓN (N)
En términos sencillos que la población es a quién le vamos a indagar sobre un tema con
propiedades comunes. De manera técnica, es el conjunto de elementos que cumplen ciertas
propiedades comunes. Las poblaciones se definen de acuerdo al campo de interés, por lo general,
se delimitan especial y temporalmente. Puede ser finita, cuando se tiene un número fijo de
elementos o infinita, cuando existe un número indeterminado de elementos.

Ejemplo:
 Población finita: El conjunto de neonatos según el sexo en el Hospital Universitario de Los
Andes, durante el último año.
 Población infinita: El conjunto de neonatos según el sexo en Bolivia, durante el último año.

3.2 MUESTRA (n)


Es un subconjunto de elementos de la población que cumplen ciertas propiedades comunes. En
otras palabras, es parte de la población. Ejemplo: 100 neonatos según el sexo en el Hospital
Universitario de Los Andes, durante el último año.

3.3 DATO (Xi)


Son cada uno de los elementos, individuos, cosas o entes abstractos que integran una muestra
determinada.

3.4 ESTADÍSTICO Y PARÁMETRO


Los resultados de un estudio de carácter científico se obtienen a partir de cada uno de los
elementos (individuos o unidades experimentales) que son parte de la población en estudio. El
valor numérico obtenido a partir de los datos individuales de los integrantes de una población, se
Bioestadística e Informática Aplicada 9

conoce con la denominación de parámetro, por lo tanto este resultado muestra el comportamiento
del total de datos que constituyen una población.

EJERCICIO 1. Determine tipo de población, población, muestra, dato, unidad estadística,


estadístico y parámetro del siguiente enunciado:
Un profesor de la Escuela de Medicina de la Universidad de Los Andes (Bolivia) durante el
presente año, quiere indagar si la edad (en años cumplidos) , la clase social (alta, media, baja),
el género (femenino, masculino), el nivel educativo de la madre (primaria, secundaria, superior);
tienen influencia en el promedio aritmético de notas (puntos) de los estudiantes de primer año,
para ello toma al azar una sección conformada por 43 estudiantes (dichos datos los recopila a
través de la Oficina de Registros Estudiantiles). Se obtuvo que 60% de los 43 estudiantes son de
sexo femenino y que 20 años es la edad promedio de los estudiantes de la Escuela de Medicina.

SOLUCIÓN
 Tipo de Población: Finita.
 Población: El conjunto de estudiantes de la Escuela de Medicina de la Universidad de
Los Andes, Bolivia, durante el presente año.
 Muestra: El conjunto de estudiantes de primer año de la Escuela de Medicina de la
Universidad de Los Andes, Bolivia, durante el presente año(n=43).
 Dato: Cada uno de los estudiantes de primer año de la Escuela de Medicina de la
Universidad de Los Andes, Mérida, Bolivia, durante el presente año.
 Unidad Estadística: Cada uno de los estudiantes de la Escuela de Medicina de la
Universidad de Los Andes, Bolivia, durante el presente año.
 Estadístico: El 60% de los 43 estudiantes son de sexo femenino
 Parámetro: 20 años es la edad promedio de los estudiantes de la Escuela de Medicina.

3.5 ESCALAS DE MEDICION


Es un conjuntos de reglas que sirven para asignar categorías o números a una o varias
propiedades de las cosas o eventos que se estudian. A continuación se discutirán las principales,
así como las implicaciones en Bioestadística, dentro de ellas tenemos: Escala Nominal, Escala
Ordinal, Escala de Intervalo, Escala de Razón.
Bioestadística e Informática Aplicada 10

ESCALA NOMINAL: Es una clasificación categórica no ordenada de las cosas o eventos que se
estudian, por lo tanto, sólo se permite la diferencia entre categorías. Las categorías (es cada uno
de los conjuntos básicos en los que puede clasificarse cada variable) son mutuamentes
excluyentes, ejemplo: sano o enfermo, si o no. La práctica de utilizar números para distinguir
entre diversos diagnósticos médicos constituye una medición sobre una escala nominal.

ESCALA ORDINAL: Es una sucesión de tipo categórica de las cosas o eventos que se estudian.
Este tipo de escala, no sólo permite la diferencia de categoría a categoría, sino que además
pueden ordenarse por grados de acuerdo con algún criterio de orden (Glass y Stanley, 1986).
Ejemplos: Niveles de una enfermedad, Rango académico, Edad (menor igual a 18 años; mayor a
18 años y menor a 40 años; mayor igual a 40 años).

3.6 VARIABLE.
Una variable es una característica observable que varía entre los diferentes individuos de una
población. La información que disponemos de cada individuo es resumida en variables.

Ejemplos:
 El grupo sanguíneo
o {A, B, AB, O} var. Cualitativa
 Su nivel de felicidad “declarado”
o {Deprimido, Ni fu ni fa, Muy feliz} var. Ordinal
 El número de hijos
o {0,1,2,3,….} var. Numérica discreta
 La altura
o {1.62, 1.74, ….} var. Numérica continua

Ejercicio: complete las siguientes variables, como se hizo en ejemplo anterior.


 Presión sanguínea

 Masa de niños en edad preescolar

 Frecuencia cardiaca

 Estatura de varones adultos


Bioestadística e Informática Aplicada 11

Edad de los pacientes de un médico.

Los tipos de variables son: cualitativas nominales, cualitativas ordinales, cuantitativas discretas
y cuantitativas continuas.

 Cualitativas
Si sus valores (modalidades) no se pueden asociar naturalmente a un número (no se
pueden hacer operaciones algebraicas con ellos)
o Nominales: si sus valores no se pueden ordenar
Ej.: sexo, grupo sanguíneo, Religion, Nacionalidad ( Si/No)

o Ordinales: Si sus valores se pueden ordenar


Ej.: Mejoría a un tratamiento, Grado de satisfacción, Intensidad del dolor

 Cuantitativas o Numericas
Si sus valores son numéricos (tiene sentido hacer operaciones algebraicas con ellos)
o Discretas: Si toma valores enteros
Ej. Número de hijos, Numero de cigarrillos, Núm. De “cumpleaños”

o Continuas: Si entre dos valores, son posibles infinitos valores intermedios


Ej. Altura, Presión intramuscular, Dosis de medicamento administrado, edad

3.7 Modalidades
 Los posibles valores de un variable suelen denominarse modalidades
 Las modalidades pueden agruparse en clases (intervalos)
Ej. de Edades: Menos de 20 años, de 20 a 50 años, mas de 50 años.
Ej. de hijos: Menos de 3 hijos, de 3 a 5 hijos, 6 o mas hijos
 Las modalidades/clases deben formar un sistema exhaustivo y excluyente
Exaustivo: No podemos olvidar ningún posible valor de la variable
Mal ¿Cuál es su color del pelo?: (Rubio, Moreno) ?????
Bien ¿Cuál es su grupo sanguíneo?
Bioestadística e Informática Aplicada 12

Excluyente: Nadie puede presentar dos valores simultaneos de la variable


Estudio sobre el ocio
Mal: ¿De los siguientes, que le gusta?: (deporte, cine)
Bien: Le gusta el deporte: (Si/No)
Bien: Le gusta el cine: (Si/No)
Mal: Cuantos hijos tiene: (Ninguno, Menos de 5, Mas de 2)

4. Tema 3. TABLA DE FRECUENCIAS


Luego de estudiar los conceptos básicos podemos realizar un estudio descriptivo de una colección
de datos, que habitualmente inicia con la construcción de tablas y/o gráficos adecuados al tipo de
variable. La TABLA, consiste en presentar los datos organizadamente de manera rectangular en
filas y columnas. La presentación tabular constituye la forma más general de presentar datos
estadísticos

Ejemplo 1:
Bioestadística e Informática Aplicada 13

4.1 CONCEPTOS IMPORTANTES

CLASIFICACIÓN

Los datos obtenidos en la primera etapa suelen ser registrados en el orden en que se recopilan,
para facilitar su interpretación y el análisis correspondiente debemos organizarlos o clasificarlos
de manera sistemática y una manera sencilla de hacerlo es ordenar los datos según su
magnitud y/o agruparlos de acuerdo a sus características en grupos más condensados; este
último equivale a sub-dividir los datos en subgrupos o clases; a este proceso se le conoce como
Clasificación.

Ordenando los datos en forma creciente o decreciente de sus magnitudes se distinguirán


claramente los datos de mayor valor (máximo) y de menor valor (mínimo); pero clasificándolos
convenientemente podremos distinguir otras características que nos permitirán una mayor
comprensión y descripción de los datos bajo estudio. Condensar y simplificar sin perder muchos
detalles es el objetivo de la clasificación

Es conveniente tomar en cuenta la analogía existente entre clasificación y partición matemática.

Haremos algunas definiciones en base al siguiente ejemplo: Clasificar los siguientes datos
recopilados del número de cabezas de ganado vacuno que poseen cada una de las 40 familias
de las comunidades campesinas de Potosí, elegidos al azar.

1 2 0 3 5 1 0 8 1 2
4 3 3 5 12 0 4 3 0 10
0 0 4 9 0 1 3 2 1 3
5 4 6 8 2 0 1 3 2 0

Observamos que los datos tal como fueron registrados en el proceso de recopilación están en
completo desorden y no sugieren ninguna interpretación. Procedamos a organizarlos en orden
creciente de sus magnitudes.

0 0 0 0 0 0 0 0 0 1
1 1 1 1 1 2 2 2 2 2
3 3 3 3 3 3 3 4 4 4
4 5 5 5 6 8 8 9 10 12
Bioestadística e Informática Aplicada 14

O bien:

0 1 2 3 4 5 6 8 9 10 12
0 1 2 3 4 5 8
0 1 2 3 4 5
0 1 2 3 4
0 1 2 3
0 1 3
0 3
0
0

Observamos que el mínimo es 0 y el máximo es 12; y además, el dato que más se repite es el
0. Pero, clasificándolos, podremos distinguir otras características, a la par de conseguir una
mayor simplificación o condensación de los datos bajo estudio.

Comencemos con algunas definiciones:

ALCANCE (A)

Es del intervalo cerrado definido por los datos de menor y mayor valor (mínimo y máximo). En
el ejemplo, A = [0, 12]

0 12

RANGO
En una serie de datos, constituye la diferencia entre el Valor Máximo (MAX) y el valor mínimo (MIN) de la
variable.

Rango= MAX - MIN

NUMERO DE CLASES (Intervalos)


Es el número de intervalos en los cuales se agrupara los datos, para este cálculo se utilizar la siguiente
formula.
Formula de Sturges(K): con la que podremos agrupar nuestros datos :
Bioestadística e Informática Aplicada 15

K = 1 + 3.322 log(N)

Donde N = cantidad datos


K = Número de clases
Log(N) = logaritmo decimal de N

TAMAÑO O ANCHO DE UNA CLASE


Una vez conocido el número de clases (K), se determina el ancho de clase (C)

A= Rango/K

CLASE (Intervalo)
Para agrupar los datos es necesario definir el límite inferior de la clase. La diferencia entre los limites
determina el ancho.

CLASE ó INTERVALO Frecuencia F


Numero de clases(Intervalos) = 5
(Estatura) Nº Estudiantes
[60 – 62) 5 En la clase 60 – 62 el límite inferior es
[63 – 65) 18 60 y el límite superior es 62
[66 – 68) 42
[69 – 71) 27
[72 – 74] 8 Ancho = 62- 60 = 2
Total 100

MARCA DE CLASE
La marca de clase es el punto medio del intervalo, se obtiene sumando los límites inferior y superior y
dividiendo por2.

X= (Li + Ls )/2
Bioestadística e Informática Aplicada 16

INTERVALO Frecuencia F X
(Estatura) Nº Estudiantes
Numero de intervalo = 5
[60 – 62) 5 61 En el intervalo 60 – 62 el límite inferior es = 60
[63 – 65) 18 64
[66 – 68) 42 Y el límite superior es 62
[69 – 71) 27
[72 – 74] 8 Intervalo de clase= 2
Total 100 X= (Li + Ls)/2
X=(60+62)/2
X= 61

Frecuencia Absoluta (f). Cantidad de elementos que existen por categoría o valor, la suma
de la frecuencia absoluta debe ser igual al total de datos de la muestra.
Frecuencia absoluta

fi= cantidad de veces que se repite dentro un intervalo

Frecuencia Relativa (h): Idem, pero dividido por el total


Frecuencia relativa

hi= fi / N

Frecuencia Acumulada (F): Cantidad de elementos que existen por cada categoría o valor de
manera acumulada, es decir que se va sumando de manera ordenada, la última frecuencia
acumulada debe ser igual al total de la muestra.

3.3 Histogramas: Son graficas de rectángulos cuyas bases representan los intervalos de clase
y las alturas las Frecuencias absolutas o Relativas o Porcentuales. Nos permiten comparar
frecuencias. Los rectángulos deben tocarse unos a otros sin brechas, excepto para clases vacías.

3.4 Polígono de frecuencias: Es una poligonal construida uniendo, mediante segmentos de recta,
los puntos medios de los “techos” de los rectángulos del Histograma.
Bioestadística e Informática Aplicada 17

3.5 Grafica de sectores o diagramas circulares

Son círculos o eclipses en los que los sectores angulares representan propiciamente los
porcentajes correspondientes. Comúnmente se le denomina “Pastel”.

Se recomienda colorear o distinguir de alguna manera cada sector y/o asociarle una leyenda que
explique claramente su significado o la característica que representa.
Bioestadística e Informática Aplicada 18

PROBLEMAS RESUELTOS

A) Tablas de frecuencia
1) Los siguientes datos son los puntajes obtenidos por 50 estudiantes en un examen.
33, 64, 35, 54, 41, 42, 45, 47, 48, 65,
50, 52, 65, 39, 55, 57, 59, 60, 60, 50,
61, 35, 65, 65, 53, 66, 77, 67, 68, 61,
69, 81, 73, 73, 74, 76, 66, 77, 78, 66,
80, 71, 84, 85, 88, 89, 91, 94, 97, 97
Clasificar estos datos convenientemente en intervalos de clase de igual amplitud u construir los
gráficos respectivos.
Rango= MAX - MIN
Solución
I) Rango = 97 – 33 = 64 Formula de sturges
II) K = 1 + 3.32 * log(50) = 1+ 3.22(1.699) = 6.64
K = 1 + 3.322 log(N)
Redondeando al entero inmediato superior K=7
A= Rango/K
III) Ancho de clase A= 64/7 = 9.14
A=10
Para facilitar el conteo de las frecuencias, tomaremos como límite inferior de la primera
clase 33.

Intervalos 100*hi fi= conteo de frecuencias


Xi fi Fi hi Hi
puntaje
[33,43) 38 6 6 0.12 0.12 12% Fi= frecuencia acumulada
[43,53) 48 6 12 0.12 0.24 12%
[53,63) 58 9 21 0.18 0.42 18% Frecuencia relativa
[63,73) 68 12 33 0.24 0.66 24% hi= fi / N
[73,83) 78 9 42 0.18 0.84 18%
[83,93) 88 5 47 0.1 0.94 10%
[93,103] 98 3 50 0.06 1 6%
Total N=50 100%
Bioestadística e Informática Aplicada 19

Las gráficas son realizadas en Excel.


B) Grafica histograma

Histograma
14

12
12
10
Frecuencias

8 9 9

6
6 6
4 5
2 3

0
33 - 43 43 - 53 53 - 63 63 - 73 73 - 83 83 - 93 93 - 103
Puntos

C) Grafica polígono de frecuencias

Poligono de frecuencias
14
12 12
10
Frecuencias

9 9
8
6 6 6
5
4
3
2
0
33 - 43 43 - 53 53 - 63 63 - 73 73 - 83 83 - 93 93 - 103
Puntos

Series1

D) Grafica de torta
Bioestadística e Informática Aplicada 20

Grafica de porcentajes
93 - 103
6%

33 - 43
83 - 93 12%
10%
43 - 53
12%
73 - 83
18%
53 - 63
18%
63 - 73
24%

Ejercicio 2: Realizar el mismo procedimiento que el anterior.


1) Los siguientes datos son los puntajes obtenidos por 45 estudiantes en un examen.
64, 35, 54, 41, 42, 45, 47, 48, 33,
52, 65, 39, 55, 57, 59, 60, 60, 50,
35, 65, 65, 53, 66, 77, 67, 68, 61,
81, 73, 73, 74, 76, 66, 77, 78, 69,
71, 84, 85, 88, 89, 91, 94, 97, 80,

Ejercicio 3: Realizar el mismo procedimiento que el anterior.


1) Los siguientes datos son los puntajes obtenidos por 45 estudiantes en un examen

1 2 0 3 5 1 0 8 1 2
4 3 3 5 12 0 4 3 0 10
0 0 4 9 0 1 3 2 1 3
5 4 6 8 2 0 1 3 2 0
Bioestadística e Informática Aplicada 21

5. Tema 4: Media, mediana y la moda


5.1 ¿Qué es la media?
La media, también conocida como promedio, es el valor que se obtiene al dividir la suma de
todos los números entre la cantidad de ellos.
Algunas características de la media son:
Considera todas las puntuaciones
El numerador de la fórmula es la cantidad de valores
Cuando hay puntuaciones extremas, no tiene una representación exacta de la muestra
Ejemplo de media

Queda como tarea de investigación, investigar:


- Media Geométrica
- Media Armónica
- Media Cuadrática

5.2 ¿Qué es la mediana?


La mediana es un valor que se encuentra a la mitad de los otros valores, es decir, que al
ordenar los número de menor a mayor, éste se encuentra justamente en medio entre los que
están por arriba.
Algunas características de la media son:
Las operaciones para calcular el valor son muy sencillas de realizar.
Bioestadística e Informática Aplicada 22

La medida no depende de los valores de las variables, solamente de su orden.


Generalmente, los valores son enteros.
Se puede calcular aunque los números que se encuentren arriba y abajo no tengan límites.

Ejemplo de Mediana
Si la cantidad de valores es impar
Si se tienen los valores: 9,5,4,2,7,
se ordenan: 2, 4, 5, 7, 9.
El elemento de en medio es el 5, ya que se encuentra dos valores por encima y dos valores
por debajo.
Si la cantidad de valores es par
Si se tienen los valores 9,5,4,2,
se ordenan: 2,4,5,9.
En este caso se toman los dos valores centrales 5 y 4, la mediana es el promedio de ambos: 4.5

5.3 ¿Qué es la moda?


La moda es el valor que aparece más dentro de todos los datos. En un grupo puede haber dos
modas y se conoce como bimodal, y más de dos modas o multimodal cuando se repiten más
de dos valores; se llama amodal cuando no se repiten los valores.

Por último, se conoce como moda adyacente cuando dos valores continuos tienen la misma
cantidad de repeticiones. En este caso se saca el promedio de ambos.

Las principales características de la moda son:


Es una muestra muy clara
Las operaciones para determinar el resultado son muy fáciles de elaborar
Los valores que se presentan pueden ser cualitativos y cuantitativos
Bioestadística e Informática Aplicada 23

Ejemplo de Moda

5.4 Media, para datos clasificados

5.5 Mediana, para datos clasificados


Bioestadística e Informática Aplicada 24

5.6 Moda, para datos clasificados

4.7 cálculo de cuartiles en SPSS

Mediana
Divide a la distribución en dos partes iguales
Nos da una idea de donde está la mitad de la distribución
Es una mejor medida de tendencia central cuando la distribución es asimétrica

Cuartiles
Bioestadística e Informática Aplicada 25

Divide a la distribución en 4 partes iguales

Q2
Q1 Q3

50 personas 50 personas 50 personas 50 personas

Dividen en 4 partes iguales.

50 personas tienen peor puntaje 50 personas con mejor puntaje

Ejercicio de cálculo de cuartiles


Nº Edad sexo Puntaje
1 20 Femenino 95
2 23 Femenino 45
3 26 Masculino 51
4 20 Masculino 30
5 27 Femenino 45
6 25 Masculino 49
7 25 Masculino 53
8 27 Femenino 65
9 25 Femenino 97
10 20 Masculino 86
11 26 Femenino 71
12 19 Femenino 27
13 25 Masculino 46
14 19 Masculino 58
15 26 Masculino 92
16 20 Femenino 17
17 27 Femenino 60
18 25 Masculino 1
19 20 Masculino 56
20 26 Femenino 62

1. Ingresamos a SPSS
2. Creamos las 3 variables en spss
Bioestadística e Informática Aplicada 26

3. Hacemos el llenado de los datos

4. Ahora para sacar cuantiles, entramos a menú: Analizar/Estadística


descriptivos/frecuencias
Bioestadística e Informática Aplicada 27

5. Elegir la variable que nos interesa sacar

6. Luego clic en estadísticos

7. clic en continuar

Estadísticos
puntaje
N Válido 20
Perdidos 0
Mínimo 1
Máximo 97
Percentiles 25 45,00
50 54,50
75 69,50

El 75% tiene puntaje hasta 69,50


Bioestadística e Informática Aplicada 28

5 Tema 5: INTERPRETACION DE DATOS


EDADES DE UN GRUPO DE AMIGOS

14,14,15,15,15,16,17,17,18

̅ = 15.6 ñ
= 15
= 15

Interpretacion quiere decir que quiere decir cada uno de los datos
X EL PROMEDIO DE ………………. ES ………………..
Me EL 50% DE ………….. ES MENOR O IGUAL A …………….
Mo LA EDAD CON MAS FRECUENCIA……………..

NUMERO DE HIJOS DE 50 FAMILIAS DE UNA CIUDAD


̅ = 2.5 ℎ
x f
=2 0 2
=2 1 5
2 20
3 15
4 6
5 1
6 1
50
Interpretacion quiere decir que quiere decir cada uno de los datos
X EL PROMEDIO DE ……………DE LAS …. ES ………………..
Me EL 50% DE ………….. ES MENOR O IGUAL A …………….
Mo LA EDAD CON MAS FRECUENCIA……………..
Bioestadística e Informática Aplicada 29

NUMERO DE HORAS TRABAJADAS POR 130 EMPLEADOS DE


UNA EMPRESA

̅ = 72.11 ℎ Horas f
= 72,2 ℎ 55 - 60 5
60 – 65 18
= 74,28 ℎ 65 – 70 20
70 – 75 50
75 – 80 17
Interpretacion quiere decir que quiere decir cada uno de los datos
80 – 85 16
X EL PROMEDIO DE ……………DE LAS …. ES ……………….. 85 – 90 4
Me EL 50% DE ………….. ES MENOR O IGUAL A ……………. 50
Mo …………..CON MAS FRECUENCIA……………..

NUMERO DE HERMANOS DE 30 ESTUDIANTES DE UN CURSO:

̅ = 3ℎ
= 2,2 ℎ
=2ℎ
Interpretación quiere decir que quiere decir cada uno de los datos
X EL PROMEDIO DE ……………DE LAS …. ES ………………..
Me EL 50% DE ………….. ES MENOR O IGUAL A …………….
Mo …………..CON MAS FRECUENCIA……………..

SUELDO DE LOS 70 TRABAJADORES DE UN EMPRESA.

̅ = 1000,000
= 947,000 .
= 950,000 .

Interpretacion quiere decir que quiere decir cada uno de los datos
X EL PROMEDIO DE ……………DE LAS …. ES ………………..
Bioestadística e Informática Aplicada 30

Me EL 50% DE ………….. ES MENOR O IGUAL A …………….


Mo el sueldo …………..CON MAS FRECUENCIA……………..

6. Tema 6. Muestreo y estimación


6.1 Muestreo

6.2 Muestreo probabilístico

• El muestreo probabilístico es un método de muestreo (muestreo se refiere al estudio o el


análisis de grupos pequeños de una población) que utiliza formas de métodos de selección
aleatoria.
Bioestadística e Informática Aplicada 31

• El requisito más importante del muestreo probabilístico es que todos en una población
tengan la misma oportunidad de ser seleccionados.

6.3 Métodos más utilizados

6.4 Muestreo aleatorio simple


Bioestadística e Informática Aplicada 32

6.5 Muestreo aleatorio sistemático

Ejemplo de muestreo sistemático


• Suponemos que queremos saber la opinión sobre un profesor de una clase de 60 personas.
Dichas personas están ordenadas por orden alfabético en la lista de alumnos de clase. Para
realizar la encuesta, seleccionamos a 12 personas. Por lo tanto, N=60 y n=12. El intervalo
fijo entre sujetos es:

• Ahora elegimos al azar un número entre 1 y k=5. Suponemos que nos sale i=2. La muestra
resultado mediante el muestreo sistemático será:
Bioestadística e Informática Aplicada 33

Cuando utilizarlo
• La ventaja del método de muestreo sistemático respecto al muestreo aleatorio simple es
su sencillez.
• El método de muestreo sistemático es más potente que el muestreo simple cuando el orden
de los datos influye en que los sujetos próximos son semejantes.

6.6 Muestreo aleatorio estratificado


Bioestadística e Informática Aplicada 34

Este es un método de muestreo muy utilizado cuando el investigador dispone de determinada


información que permite segmentar internamente el universo poblacional.

Elección simple (o uniforme):


• Se toman de la muestra el mismo número de sujetos para cada uno de los k estratos. De
cada estrato se seleccionarían n/k individuos. Este criterio no es recomendable cuando los
estratos tienen un número de individuos significativamente diferente.
• Por ejemplo, en una muestra de 900 individuos dividida en tres estratos, cada uno de ellos
tendría 900/3 = 300 elementos.

Elección proporcional al tamaño del estrato


• El tamaño de la muestra en cada grupo es proporcional a los elementos de dicho grupo. En
cada estrato se tomarán ni elementos, calculados mediante la fórmula:

Ejemplo:

• Por ejemplo, suponemos que se está haciendo un estudio sobre la toma de pastillas para
dormir en una ciudad de 100.000 habitantes.
Bioestadística e Informática Aplicada 35

• La variable edad se considera adecuada para obtener resultados en esta investigación.


Se incluyen solamente los mayores de 40 años en el estudio. Se distribuyen en tres
grupos o estratos, resultando una agrupación, según el censo:

• Por el procedimiento de muestreo elegido obtenemos una muestra de 750 sujetos. Para
asignar el número de componentes a los tres estratos de edad, aplicaremos la fórmula
anterior:

Donde n / N es una constante


llamada razón de muestreo, que en
este caso es de 0,015.

Resulta una distribución muestral por estratos tal que así:


Bioestadística e Informática Aplicada 36

7. Tema 6: SPSS

Objetivos

 Familiarizarse con el entorno del editor de datos de SPSS


 Definir variables en SPSS
 Crear variables a partir de otras ya existentes

El Editor de Datos

Al iniciar SPSS se muestra la siguiente ventana donde se puede seleccionar ¿Qué desea hacer? Así, si se
desea analizar un conjunto de datos nuevo, se marca la opción Introducir datos

Ventana de bienvenida

Elegida esta opción y pulsando Aceptar se muestra el Editor de datos de SPSS.


Bioestadística e Informática Aplicada 37

El Editor de datos de SPSS es el marco de trabajo inicial que se utiliza para introducir los datos y elegir el
procedimiento adecuado para el análisis. Esta ventana está formada por:

 La Barra de menú que contiene el Menú principal de SPSS con todas sus opciones

Cada
una de estas opciones contiene distintos procedimientos que se muestran pulsando en cada una de ellas.

 la Barra de herramientas, formada por diferentes iconos que permiten acceder directamente a los
procedimientos más comunes

El
significado de cada uno de estos iconos, que se muestra posicionando el ratón sobre el icono, de izquierda a
derecha es el siguiente:

 Abrir documentos de datos


 Guardar este documento
 Imprimir
 Recuperar los cuadros de diálogo recientes
 Deshacer una acción del usuario
 Volver a hacer la acción del usuario
 Ir a caso
 Ir a variable
Bioestadística e Informática Aplicada 38

 Variables
 Buscar
 Insertar caso
 Insertar variable
 Segmentar archivo
 Ponderar casos
 Seleccionar casos
 Etiquetas de valor
 Utilizar conjuntos de variables
 Mostrar todas las variables
 Corregir ortografía.

 la Barra de presentación de los datos o de las variables

 la Barra de estado (Área del procesador)

El Editor de datos SPSS está formado por celdas. Cada fila representa un elemento del conjunto de datos y
cada columna representa una variable y se muestra cuando se tiene activada la casilla Vistas de datos en
la Barra de presentación

Marcando cada una de estas variables y pulsando el botón secundario del ratón se muestran las
opciones Insertar variables, Ordenar de forma ascendente y Ordenar de forma descendente los datos.
Bioestadística e Informática Aplicada 39

Análogamente se pueden insertar casos marcando una de las filas y pulsando el botón secundario del ratón.

El Editor de datos SPSS presenta dos pestañas:


Bioestadística e Informática Aplicada 40

 Vista de datos: Muestra los valores de los datos.

 Vista de variables: Muestra las características de las variables.


Bioestadística e Informática Aplicada 41

En Vista de variables cada una de las filas corresponde a una variable y cada columna determina una
característica de ésta.

 Nombre: Se introduce el nombre de la variable


 Tipo: Se escoge el tipo de variable entre las posibilidades que se ofrecen pulsando en Tipo
o Numérica: Una variable cuyos valores son números. Los valores se muestran en formato numérico
estándar (se establece la Anchura y Cifras decimales)
o Coma: Una variable numérica donde las comas determinan los miles
o Punto: Una variable numérica donde los puntos determinan los miles
o Notación científica: Una variable numérica cuyos valores se muestran con una E intercalada y un
exponente con signo que representa una potencia de base diez
o Fecha, Dólar: Una variable numérica cuyos valores se muestran en uno de los diferentes formatos de
fecha y de dólar, respectivamente
o Moneda personalizada: Una variable numérica cuyos valores se muestran en uno de los diferentes
formatos de moneda personalizada que se hayan definido previamente en la pestaña Moneda del
cuadro de diálogo Opciones (Edición/Opciones)
o Cadena: Variables cuyos valores no son numéricos. También se conocen como variables
alfanuméricas.

o Anchura: Determina el ancho de la columna


Bioestadística e Informática Aplicada 42

 Decimales: Determina el número de decimales que aparecen en pantalla.

 Etiqueta: Las variables pueden ser etiquetadas para que en los análisis posteriores aparezca dicha etiqueta
 Valores: Permite introducir las modalidades de las variables tipo cadena

 Valores Perdidos: SPSS permite codificar los valores perdidos de forma discreta o en un rango determinado

 Columnas: Permite introducir el ancho de la columna que también puede cambiarse en la Vista de
datos pulsando y arrastrando los bordes de la columna

 Alineación: Permite elegir entre alinear los datos introducidos a la Izquierda, Derecha o Centrado
Bioestadística e Informática Aplicada 43

 Medida: Permite definir la variable como Ordinal o Nominal


o Ordinal: Los valores de los datos representan categorías con un orden intrínseco (Ej: grande, medio,
pequeño; suspenso, aprobado, notable, sobresaliente)
o Nominal: Los valores de los datos representan categorías sin un orden intrínseco (Ej: rojo, amarillo,
verde)

 Rol: Funciones, roles que se pueden asignar a las variables para el análisis


o
 Entrada: La variable se utiliza como una entrada (por ejemplo: predictor, variable
independiente)
 Objetivo: La variable se utiliza como salida o de destino (por ejemplo: variable dependiente)
 Ambos: La variable se utiliza como entrada y salida
 Ninguna: La variable no tiene una asignación de funciones
 Partición: La variable se utiliza para dividir los datos en muestras separadas
 Segmentar: Las variables con este papel no se utilizan como variables de un archivo
segmentado.

Por defecto, a todas las variables se les asigna el papel de entrada. Esto incluye los datos de los archivos
externos y archivos de datos de versiones de SPSS Statistics anteriores a la versión 18.

Barra del menú principal: Opciones

Desde la barra del Menú principal se puede acceder a todos los menús del Editor de Datos. Los primeros
menús: Archivo, Edición, Ver, Ventana y Ayuda son habituales en los programas bajo Windows. El resto de
menús son específicos de SPSS, estos permiten realizar cambios en los datos, obtener resultados estadísticos,
numéricos, gráficos……A continuación se muestran los distintos menús desplegables, así como la finalidad
de alguna de las opciones.

El menú Archivo
Bioestadística e Informática Aplicada 44

 Nuevo: Abrir un archivo nuevo de datos, de sintaxis, de resultados o de proceso


 Abrir: Abrir un archivo existente de datos, de sintaxis, de resultados o de proceso
 Abrir base de datos: Crear, editar y ejecutar consultas a bases de datos
 Leer datos de texto: Abrir archivos de texto
 Cerrar: Cerrar el archivo actual
 Guardar: Guardar el archivos actual
 Guardar como: Guardar el archivo actual con otro nombre
 Mostar información del archivo de datos: (Archivo de trabajo o archivo externo)
 Caché de los datos: Crear una copia temporal de los datos puede mejorar el rendimiento en el caso de que
los archivos grandes de datos se lean desde una fuente externa. Aunque el archivo activo virtual puede
reducir considerablemente la cantidad de espacio en disco temporal, la ausencia de una copia temporal del
archivo “activo” significa que la fuente de datos original tiene que releer para cada procedimiento
 Repositorio: (Conectar, Almacenar desde SPSS Statistics, Publicar en Web, Añadir archivo, Recuperar en
SPSS Statistics, Descargar un archivo)
 Presentación preliminar: Muestra en pantalla completa la tarea actual
 Imprimir: Imprimir la tarea actual
 Datos usados recientemente: Muestra los datos usados recientemente
 Archivos usados recientemente: Muestra los archivos usados recientemente
 Salir: Salir de SPSS.

Practica 1:
Bioestadística e Informática Aplicada 45

Objetivo: Introducir al estudiante al programa SPSS

Encuesta para el ejercicio SPSS

Universidad Autónoma Practica SPSS


Tomás Frías

Encuesta

Objetivo: Estudiar la satisfacción de los empleados en su lugar de trabajo, en la empresa


…. de la ciudad de Potosí.

1. Edocivil: Estado civil

1. Casado, 2. Soltero

2. Antigued: Antigüedad en el puesto (en años)


_______
3. Antig2: Antigüedad en el puesto
1= “5 años o menos”, 2=“6 -11 años”, 3. “11-15 años”, 4=”16-20 años”

4. Satlab1: satisfacción laboral en el puesto


1=“Nada satisfecho”, 2=“Algo satisfecho”, 3=“Bastante satisfecho”, 4=“Totalmente
satistecho”

5. Satlab1b: Satisfacción laboral en el puesto1


1=”Alta”, 0=”Baja”

6. Satlab2: Satisfacción laboral en el puesto2


1=”Nada satisfecho”, 2=”Algo satisfecho”, 3=”Bastante satisfecho”, 4=”Totalmente
satisfecho”

Ejercicio propuesto 1.

Puntos a realizar en la práctica de SPSS.

 Diseñar una encuesta sobre un tema de salud


 Coloque un objetivo a la encuesta
 La encuesta debe de tener 8 preguntas cerradas
Bioestadística e Informática Aplicada 46

 La encuesta se aplicara a una población de 10 personas de la ciudad de potosí, pero para


efectos practicos se hara a 6 estudiantes de la carrera
 Cada pregunta debe de contener mas de 2 opciones, estas deveran estar numeradas o
con letras
 Asigne a cada pregunta una variable
 Realice la tabulación en papel, como se hizo en el anterior laboratorio

VAR1 VAR2 VAR3 VAR4 VAR5 …


1
2

10

 Lleve los datos a SPSS


 Genere tablas con valores de frecuencia y porcentaje
 Realice gráficos de cada pregunta
 Valore y critique el trabajo que hizo

EJERCICIOS PROPUESTOS SPSS

Los siguientes datos proceden de un grupo de alumnos de Administración de Empresas


Bioestadística e Informática Aplicada 47
Bioestadística e Informática Aplicada 48

También podría gustarte