0% encontró este documento útil (0 votos)
32 vistas8 páginas

Introducción a la Estadística y Bioestadística

Introducion a la estadistica

Cargado por

Mariana Mendez
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
32 vistas8 páginas

Introducción a la Estadística y Bioestadística

Introducion a la estadistica

Cargado por

Mariana Mendez
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

CAPITULO 1 INTRODUCCIÓN A LA ESTADÍSTICA 1.

CONSIDERACIONES PRELIMINARES

Todo lo que hasta ahora tiene que ver con la recolección, procesamiento, análisis e
interpretación de datos numéricos pertenece al dominio de la estadística. Los orígenes de la
estadística se encuentran ya en tiempos muy remotos de los cuales podemos citar algunos
ejemplos: • Egipto (antiguo), existía una administración pública que recopilaba regularmente
datos sobre las tierras cultivadas y de su población. • También en la época Babilónica, se
encontraron testimonios de datos de producción, comercio y alguna información sobre
impuestos. • Los romanos aplicaron estadística con el fin de hacer sus censos y
empadronamientos en todas sus provincias. • En la Biblia se encuentran citas de censos, entre
los que se encuentra una llevada a cabo por Moisés y un empadronamiento hecho en la época
del nacimiento de Cristo (Lucas 2:1). Sin embargo, la estadística moderna, metódica y científica
se atribuye al inglés Jhonn Graunt (1620 - 1670), quién publicó los primeros resultados de sus
estudios sobre las causas de la muerte en Londres en el año 1662.

De ahí en adelante muchos matemáticos contribuyeron a darle un fundamento teórico,


transformándola en una rama de las matemáticas. Como toda ciencia, el desarrollo de la
estadística no ha concluido ya que continuamente se crean diferentes métodos para el manejo
de datos, análisis de la relación entre ellos y la interpretación de los mismos. La computadora
ha hecho un gran aporte al análisis de la información y las pruebas de diferentes modelos
matemáticos relacionados con la estadística. Uno de los fenómenos mas comentados de las
últimas décadas ha sido el desarrollo de los métodos y conceptos estadísticos. Por muchos años,
a la estadística le concernían únicamente la recolección de datos y su presentación en tablas y
gráficas; hoy día ha evolucionado hasta el punto en que es un auxiliar imprescindible para la
toma de decisiones bajo condiciones de incertidumbre, razón por la que su impacto se percibe
en casi todas las áreas de trabajo del ser humano.

2 ¿QUÉ ES LA ESTADÍSTICA?

Cuando coloquialmente se habla de estadística, se suele pensar en una relación de datos


numéricos presentada de forma ordenada y sistemática. Esta idea es la consecuencia del
concepto popular que existe sobre el término y que cada vez está más extendido debido a la
influencia de nuestro entorno, ya que hoy día es casi imposible que cualquier medio de difusión,
periódico, radio, televisión, etc, no nos aborde diariamente con cualquier tipo de información
estadística sobre accidentes de tráfico, índices de crecimiento de población, turismo, tendencias
políticas, etc. La estadística es una disciplina que estudia los métodos para recoger, organizar,
resumir y analizar datos, así como para sacar conclusiones validas y tomar decisiones razonables
basadas en tal análisis.

Veamos otra definición:

Estadística es un conjunto de métodos científicos para la recopilación, representación


condensación y análisis de los datos extraídos de un sistema en estudio. Con el objeto de poder
hacer estimaciones y sacar conclusiones, necesarias para tomar decisiones.
Podríamos, desde un punto de vista más amplio, definir la estadística como la ciencia que
estudia cómo debe emplearse la información y cómo dar una guía de acción en situaciones
prácticas que entrañan incertidumbre.

De esta manera la estadística nos permite conocer numéricamente las características de un


grupo que ha sido estudiado y también nos ayuda a establecer conclusiones que sean aplicables
a una población grande, cuando solo se ha estudiado una fracción de esta población, con la
finalidad de ayudar a la toma de decisiones y en su caso formular predicciones.

Podríamos por tanto clasificar la Estadística en descriptiva, cuando los resultados del análisis no
pretenden ir más allá del conjunto de datos, e inferencial cuando el objetivo del estudio es
derivar las conclusiones obtenidas a un conjunto de datos más amplio.

Estadística descriptiva:

Describe, analiza y representa un grupo de datos utilizando métodos numéricos y gráficos que
resumen y presentan la información contenida en ellos. No generaliza las conclusiones
obtenidas a otro grupo de datos

Estadística inferencial:

Apoyándose en el cálculo de probabilidades y a partir de datos muestrales, efectúa


estimaciones, decisiones, predicciones u otras generalizaciones sobre un conjunto mayor de
datos. Es la parte de la Estadística dedicada a la formulación de supuestos y estimaciones, para
hacer predicciones y poder sacar conclusiones de los datos obtenidos con el estudio de las
muestras. Y así, poder tomar decisiones con base científica.

Las herramientas de la estadística se utilizan en muchos campos: ingeniería, psicología,


economía, etc. Cuando los datos que se analizan, provienen de las ciencias biológicas o médicas
se habla entonces de Bioestadística, solamente para diferenciar esta aplicación particular de las
herramientas y conceptos de la estadística general.

3. PORQUE ESTUDIAR BIOESTADÍSTICA?

Somos afortunados por vivir en una época en la cual los increíbles avances científicos y
tecnológicos permiten alargar la vida humana más que nunca. El uso apropiado de estos avances
ha tenido un impacto asombroso en la condición humana. Debido a la adecuada intervención
de los profesionales del área de la salud, la esperanza de vida casi se ha doblado en el siglo
pasado. Además de vivir más años, la gente también es más productiva debido a su mejor estado
de salud general.

Los profesionales del área de las ciencias de la salud, proporcionan los medios para que estos
avances puedan aplicarse a la población. A través de la investigación, de la atención
individualizada del paciente, el establecimiento de indicadores bioquímicos, la generación de
medicamentos más eficaces que los ya existentes, de las políticas sanitarias, etc. intentamos
proporcionar la mejor asistencia al mayor número de personas. Hay dos motivos por los cuales
los profesionales de la salud, hacemos lo que hacemos: ayudar a la gente a vivir más tiempo y
ayudarla a vivir mejor. Cualquier intervención que recomendamos o realizamos, desde la simple
aspirina diaria hasta el trasplante de células madre, debería estar justificada por la contribución
realizada en al menos uno de estos dos propósitos.
La bioestadística nos permite cuantificar el hecho de vivir más tiempo y vivir mejor. Éste es el
sistema a través del cual verificamos que las actividades que realizamos (o que recomendamos
realizar a otros), son realmente la mejor opción para la mayor parte de las personas. Midiendo
respuestas con valores matemáticos podemos ponderar el beneficio de una intervención sobre
otra, o comparar una intervención con no hacer nada. El resultado final es nuestra verificación
de por qué hacemos lo que hacemos. La aplicación de esta ciencia se refleja en el incremento
de vida útil y la gran calidad de vida de que disfrutamos actualmente.

Una de las manifestaciones de inteligencia de los seres humanos, es la capacidad para procesar
la información, del pasado y del presente, y elegir la opción que con menos probabilidad vaya a
causarnos algún perjuicio (¿recuerda lo de vivir más tiempo y vivir mejor?). Según esto, las
especies más inteligentes son aquellas que reconocen y utilizan un hecho que pueda afectar a
su propio devenir reaccionando adecuadamente en una situación dada. Cuando encuentran una
nueva situación, analizan las circunstancias e integran la información que aprendieron en el
pasado para decidir la mejor actuación. La bioestadística nos permite recoger y utilizar
lógicamente los datos para incrementar nuestro conocimiento sobre una situación concreta y,
por tanto, podremos usarla para alcanzar el máximo beneficio.

4. ALGUNOS CONCEPTOS BASICOS

Establecemos a continuación algunas definiciones de conceptos básicos y fundamentales a las


cuales haremos referencia continuamente a lo largo del texto

a) Individuos o elementos: Cada una de las personas u objetos que contienen la información
que se desea estudiar.

b) Dato: La palabra dato, proviene del latín datum (“lo que se da”), es una representación
simbólica numérica o alfabética que se usa como unidad de registro de la información. Si
registramos el peso de un grupo de estudiantes, el valor resultante de pesar a cada estudiante,
constituye un dato y podrá ser después utilizado para analizar la característica observada (el
peso)

c) Población: Conjunto de individuos o elementos que contienen en común la característica que


deseamos estudiar. Es importante señalar que el tamaño y los componentes de una población
en estadística son muy variables y que estos dependen de los fines de cada estudio

En relación al tamaño de la población, ésta puede ser:

c.1) Finita: Cuando el número de individuos que componen la población es definido y se puede
abarcar completamente. Ejemplos

✓ El número de personas que llegan al servicio de urgencia de un hospital en un día.

✓ Edades de los alumnos de la carrera de bioquímica, farmacia, etc.

c.2) Infinita: Cuando el número de individuos que los componen no está definido o a efectos
prácticos no es posible cuantificarla adecuadamente. Ejemplos:

✓ Los enfermos de SIDA en Bolivia (población finita, pero difícilmente cuantificable)

✓ El número de cabellos que posee una persona.


d) Muestra: Subconjunto representativo de una población. Dicho de otra manera, la muestra es
una pequeña parte de la población que, para ser válida, debe tener todas las características y
peculiaridades de la población.

e) Parámetro: Funciones obtenidos (promedio, por ejemplo) en base a los valores numéricos o
características medibles de todos los componentes de una población.

f) Estadístico: funciones obtenidas (promedios, por ejemplo) sobre los valores numéricos o
características medibles de una muestra.

g) Censo: Es el proceso de recoger, recopilar y publicar datos demográficos pertenecientes a


todos los elementos de una población estadística determinada y en un determinado tiempo. Los
censos requieren normalmente condiciones especiales para su realización. En nuestro país es el
Instituto Nacional de Estadística (l.N.E.) es la encargada de realizar este trabajo.

h) Muestreo: Es un método, un procedimiento tal que al escoger un grupo pequeño de la


población (tomar una muestra), podemos tener un grado de probabilidad de que ese grupo
efectivamente posea las características de la población que se está estudiando.

Veamos ahora los siguientes ejemplos:

Ejemplo 1

Consideremos la población formada por todos los estudiantes de la U.A.G.R.M. (finita). La altura
media de todos los estudiantes es el parámetro µ. El grupo formado por los alumnos de la
Facultad de Ciencias de la salud será por lo tanto una muestra de dicha población y la altura
media de esta muestra.x, es un estadístico.

Ejemplo 2

Se realiza un muestreo de opinión para determinar si las amas de casa de Santa Cruz, prefieren
un detergente de una marca A con relación a otra. Con este fin se entrevistan 2.000 amas de
casa y entre ellos 1500 prefieren la marca A

a) ¿Qué constituye la muestra?  Las 2.000 amas de casa entrevistadas

b) ¿Qué constituye la población?  Las amas de casa de Santa Cruz

c) ¿La población es finita o infinita?  Por definición es finita, pero podría comportarse como una
población infinita

5. VARIABLES ESTADÍSTICAS

Cuando estamos estudiando una característica, esta debe ser común a todos los miembros de
la población, pero tomará diferentes valores para cada individuo. Entonces esta característica
se convierte en una variable.

Por ejemplo, si estudiamos el peso de un grupo de estudiantes todos los estudiantes tienen un
peso determinado (característica común), pero algunos estudiantes tendrán pesos diferentes
entre si (valores diferentes), por lo tanto, tenemos la variable “peso”. Ahora bien, si por
casualidad todos los estudiantes observados tuvieran el mismo peso, la variable como tal
desaparece y tendremos una constante.
De ahí podemos decir que una variable es una característica común a todos los individuos de
una población, susceptible de tomar valores diferentes en cada uno de ellos

Cuando hablemos de variable haremos referencia a un símbolo (X, Y, A, B…) que puede tomar
cualquier valor dentro de un intervalo determinado, a lo que llamaremos dominio de la variable
o rango. En función del tipo de dominio, las variables las clasificamos del siguiente modo:

5.1. Variables cualitativas:

Se denominan como variables cualitativas a aquellas características cuyo valor o significado no


puede ser representado por un valor numérico real. Representan una cualidad que no puede
expresarse con un valor matemático. Dentro de esta categoría se pueden distinguir dos grupos

a) Nominales Cuando los valores o categorías de una variable, no admiten valores de jerarquía
entre ellos. Por ejemplo, Color de ojos = {negro, café, verde, azul} Estado civil = {soltero, casado,
viudo, etc.}

b) Categóricas o cuasi-cuantitativas. Son aquellas variables que, aunque su asignación es de tipo


nominal, es posible establecer un orden entre ellas. Por ejemplo, si estudiamos la llegada a la
meta de un corredor en una competición de 20 participantes, la variable orden de llegada (C)
puede medirse como sigue:

C = {primero, segundo, tercero, etc.}

Otro ejemplo de variable cuasi-cuantitativa es el nivel de dolor (D) que sufre un paciente ante
un tratamiento médico: D = {inexistente, leve, moderado, fuerte}

Nota: Aunque muchas veces, cuando utilizamos programas informáticos para almacenar la
información, las variables nominales pueden designarse a través de un número (por ejemplo:
hombre = 1; mujer = 2, o viceversa), estos números jamás podrán ser sometidos a operaciones
aritméticas.

5.2. Variables cuantitativas

Son las variables que tienen por valores cantidades numéricas con las que podemos hacer
operaciones aritméticas. Dentro de este tipo de variables podemos distinguir dos grupos:

a) Discretas, Cuando no admiten siempre una modalidad intermedia entre dos valores
cualesquiera, o dicho de otro modo, solo toman valores por intervalos determinados. Un
ejemplo de una variable discreta podría ser el número de alumnos por aula (X). Entonces; X = {0,
1, 2, ... 20, 21, 22, ... 40, 45, ... etc.} Como puede observarse es imposible tener por ejemplo 12.5
alumnos en un curso y en este caso solo tenemos valores enteros. Es obvio que cada valor de la
variable es un número natural

b) Continuas: Cuando admiten una modalidad intermedia entre dos valores cualesquiera de sus
modalidades, Ejemplo: el peso (X) de un niño al nacer. En este caso los valores de las variables
son números reales. En este caso podemos notar que dependiendo de la precisión de la balanza
el peso puede expresarse en kilos, pero además podemos usar cuantos decimales sea posible

X = {... 3.5, 3.55, 3.558, etc.}

A veces ocurre que una variable cuantitativa continua por naturaleza, aparece como discreta.
Este es el caso en que hay limitaciones en lo que concierne a la precisión del aparato de
medida de esa variable, si medimos la altura (Y) en centímetros de personas con una regla de
poca precisión (que no muestre milímetros) podemos obtener.

Y = {..,166, 167, 168, 169, ....}

En realidad, lo que ocurre es que con cada una de esas mediciones expresamos que el verdadero
valor de la misma se encuentra en un intervalo de 0.5 unidades antes o después del valor
anotado., es decir una persona cuya altura hemos registrado como 168 cm, podría en realidad
medir entre 167.5 y 168.5 (esto solo podrá notarse si utilizamos una medida que tenga mas
precisión) Por tanto cada una de las observaciones de Y representa más bien un intervalo que
un valor concreto.

Así mismo se pueden encontrar variables que siendo continuas suelen manejarse como si fueran
discretas, así la edad de una persona solo se registra en años cumplidos, cuando en realidad
seguramente le deberían corresponder algunos decimales.

6. REDONDEO DE DATOS

Es ampliamente conocido que si debemos redondear un número como 52.8, el resultado será
53, puesto que 52.8 está mucho más cerca de 53 que de 52. Análogamente 52.474 si
redondeamos en centésimas (o sea con dos decimales) será redondeado a 52.47, puesto que
52.474 está más cerca de 52.47 que de 52.48.

Sin embargo, cundo queremos redondear con dos decimales 52.475, nos encontramos ante un
dilema, puesto que este número es equidistante tanto a 52.47 como a 52.48. En este caso se
recomienda redondear hacia el numero par que precede al 5, por lo tanto 52.475, será
redondeado a 52.48. En otros casos 54.5 será redondeado a 54, mientras que 55.5 será
redondeado a 56 y así sucesivamente. Esta estrategia es útil para minimizar los errores de
redondeo acumulados, cuando se efectúa un gran número de operaciones.

7. FUENTES DE INFORMACION

La recolección correcta de los datos es de extrema importancia para el investigador, las técnicas
de recolección se pueden dar a través de las siguientes alternativas:

a) Registros rutinarios, Es difícil imaginar algún tipo de organización que no lleve registros de
sus actividades. Los registros clínicos de un hospital o centro de salud por ejemplo tienen una
inmensa cantidad de información acerca de los pacientes. Cuando surge la necesidad de de
tener datos, se recomienda buscar primeramente en los registros rutinarios institucionales,
puesto que estos nos permiten un acceso rápido y económico a una gran cantidad de
información.

b) Encuestas, Si los datos que estamos buscando para nuestra investigación, no están
disponibles en los registros rutinarios, podríamos pensar en obtener estos datos a través de
encuestas. Si estamos interesados en averiguar por ejemplo si los pacientes de un hospital
toman analgésicos sin receta médica (lo cual es casi seguro) y estos datos no están consignados
en las historias clínicas, entonces podríamos conseguir esta información a través de encuestas.

c) Experimentación, Esta alternativa será considerada si los datos que buscamos no están
disponibles a través de registros rutinarios ni encuestas. Podríamos estar interesados por
ejemplo en averiguar entre tres alternativas, cual es la mejor estrategia para hacer que los
pacientes diabéticos cumplan con su tratamiento. Entonces conduciremos un experimento en
que se apliquen a tres grupos de pacientes cada uno de las tres alternativas y al final haremos
una evaluación que nos permita decidir cuál de las estrategias es la más efectiva.

d) Fuentes externas, A veces los datos que necesitamos, para responder alguna interrogante,
podrían ya existir como informes publicados, bancos de datos, etc. En otras palabras, esto ocurre
cuando alguna persona en otro tiempo o lugar tuvo las mismas interrogantes que nosotros y
que las respuestas que esta persona obtuvo, podrían ser utilizadas por nosotros para resolver
nuestras interrogantes presentes.

8. TIPOS DE MUESTREO

Existen muchas clases de muestras que podemos obtener a partir de una población y aunque se
supone que buscamos siempre que la muestra sea lo más representativa posible de la población,
esto no siempre es posible. Afortunadamente existen procedimientos científicamente
establecidos para procurar que la muestra que vayamos a obtener sea realmente representativa
(o al menos eso intentamos) conocidas como técnicas de muestreo.

El muestreo estadísticamente recomendado debe procurar medios para asegurarse que todos
los elementos que conforman la población, deben tener la misma posibilidad de ser incluidos en
la muestra. Por ejemplo, si la población estuviera formada por 5000 personas y se pretende
tomar una muestra de 120 personas, cada una de las 5000 personas de debe tener la misma
chance de ser seleccionada entre las 120 personas de la muestra. Este tipo de muestreo se
conoce como muestreo probabilístico. Como se comprenderá, no siempre es posible hacer
muestreos probabilísticos, puesto que muchas veces las poblaciones no son finitas y es muy
difícil acceder a todos sus componentes, por lo que para seleccionar la muestra se seguirán
criterios arbitrarios, lo que originará muestreos no probabilísticos.

Aunque la descripción exhaustiva de los métodos de muestreo, debería corresponder a los


dominios de la Metodología de la Investigación, aquí vamos a señalar algunos tipos de
muestreo probabilístico básicos que nos ayudaran a obtener muestra.

8.1.- Muestreo Aleatorio Simple.

El procedimiento consiste en enumerar todos los elementos de una población y luego


someterlos al sorteo o al azar. Una manera sencilla de obtener una muestra es la técnica de la
urna o rifa, donde se colocan los nombres o los números de cada elemento de la población y
luego mezclarlos adecuadamente, se extrae tantos elementos como haya que tener la muestra
que se ha decidido escoger. También se pueden utilizar programas informáticos o la Tabla de
números aleatorios

8.2.- Muestreo aleatorio sistemático

En este procedimiento, se selecciona una muestra tomando cada k-ésima unidad de la


población, una vez que las unidades de muestreo están numeradas o arregladas en alguna
forma. El número k es la razón de muestreo, esto es la razón del tamaño de la población "N" y
el tamaño de la muestra "n" o sea:

Ejemplo: Se desea seleccionar una muestra de 20 unidades a partir de una población de tamaño
500 unidades, o sea:
Luego para obtener la muestra se sortea el primer valor entre 1 y 25. Si saliera sorteado el
número 15 incluimos esta unidad en la muestra, luego vamos sumando 25 y aquella unidad
que este en la posición 40avo será incluida en la muestra, luego la 65avo, después 90avo y así
sucesivamente. Es decir, de una lista numerada seleccionaremos 20 personas saltando cada 25

7.3.- Muestreo aleatorio estratificado

En este muestreo se clasifica los elementos de la población en sub-grupos (estratos), separados


de acuerdo con una o más características relacionadas con la variable que se estudia, ejemplo:
un grupo de alumnos podría ser dividido en dos estratos si consideramos el factor sexo =
masculino y femenino

Después se obtiene por separado una muestra aleatoria simple o sistemática de cada estrato. El
muestreo estratificado garantiza que todos los estratos de la población tengan una posibilidad
de ser seleccionados y se utiliza cuando la población no es homogénea.

Al hacerse la estratificación, las clases se establecen de modo que las unidades de muestreo
tiendan a ser uniformes dentro de cada clase y las clases tiendan a ser diferentes entre sí. Así se
puede controlar la proporción de cada estrato en la muestra global y al no dejarla al azar queda
asegurado el carácter representativo de la muestra.

Las ventajas del muestreo estratificado sobre el aleatorio simple son fundamentalmente dos:
✓ Se obtiene información separada para cada uno de los estratos.

✓ Se evita de que determinado estrato quede inadecuadamente representado.

7.4.- Muestreo por conglomerados

Se usa en poblaciones grandes y muy dispersos desde el punto de vista geográfico, en los cuales
el muestreo aleatorio simple sería antieconómico o muy poco práctico a la hora de su aplicación

En este tipo de muestreo, en lugar de seleccionar directamente los elementos de la población,


se hace una selección inicial de grupos o conglomerados que existen de forma natural en la
población. Estos conglomerados que son agrupaciones de elementos que deben ser lo más
heterogéneo posible, a diferencia de los estratos, de forma que cada una de ellas resulte una
réplica reducida de la población, la muestra general está formada por todos o por una sub-
muestra de las unidades en cada conglomerado.

Ejemplo: Si queremos tomar una muestra de adolescentes en un barrio sería muy difícil intentar
localizar a cada adolescente el todo el barrio para luego hacer una selección aleatoria o
sistemática, en todo caso lo mas sencillo sería seleccionar de manera aleatoria algunos colegios
(conglomerados) y allí tomar una submuestras.

También podría gustarte