0% encontró este documento útil (0 votos)
165 vistas11 páginas

Introducción a la Estadística Básica

Este documento proporciona una introducción básica a la estadística. Explica que la estadística se utiliza para resumir y analizar grandes cantidades de datos para extraer conclusiones. Describe conceptos clave como población, muestra, censo y muestreo. También distingue entre estadística descriptiva e inferencial. Finalmente, cubre temas como variables estadísticas, escalas de medición y recolección de datos.

Cargado por

Fatima
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
165 vistas11 páginas

Introducción a la Estadística Básica

Este documento proporciona una introducción básica a la estadística. Explica que la estadística se utiliza para resumir y analizar grandes cantidades de datos para extraer conclusiones. Describe conceptos clave como población, muestra, censo y muestreo. También distingue entre estadística descriptiva e inferencial. Finalmente, cubre temas como variables estadísticas, escalas de medición y recolección de datos.

Cargado por

Fatima
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

Estadística básica

La estadística es la parte de las Matemáticas que estudia cómo recopilar y resumir gran cantidad de
información para extraer conclusiones. La mayoría de los libros, estudios e investigaciones
especializadas en economía, educación, sociología, medicina, psicología, etc., contienen resultados
basados en el análisis estadístico. Sin lugar a dudas, aquellos profesionales que no conozcan Estadística
tendrán serias dificultades para ser expertos en su respectivo campo científico.

Población: Es el colectivo que abarca a todos los elementos cuya característica o características
queremos estudiar; dicho de otra manera, es el conjunto entero al que se desea describir o del que se
necesita establecer conclusiones. Como ejemplos de poblaciones, podemos citar: todos los estudiantes
de la Universidad Central del Ecuador, o los artículos producidos en una semana en una determinada
fábrica.

Por su tamaño, las poblaciones pueden ser finitas o infinitas:

 Población finita: es aquella cuya cantidad de elementos es posible de determinar. Ejemplo:


conjunto de librerías de la ciudad de Lima.
 Población infinita: es aquella cuya cantidad de elementos es imposible de determinar. Ejemplo:
conjunto de lápices fabricados en un proceso continuo.

Muestra: Es un conjunto de elementos seleccionados de una población de acuerdo a un plan de acción


previamente establecido (muestreo), para obtener conclusiones que pueden ser extensivas hacia toda la
población. Es una parte o subconjunto de una población en estudio. La muestra está constituida de
elementos seleccionados de una manera deliberada, con el objeto de investigar las propiedades de su
población. La muestra sólo da información de aquella población de la que ha sido extraída. Ejemplos
constituyen las muestras que escogen las empresas encuestadoras en estudios de sondeos de opinión, o
la selección de un grupo de artículos recibidos en una bodega para estimar las condiciones de todo un
embarque.

Censo: Es el estudio de todos y cada uno de los elementos de una población. Esta condición hace que
este tipo de estudios no sean muy frecuentes, por cuanto la recolección de toda esa información, sobre
todo cuando el tamaño de la población es muy grande o sus elementos se encuentran muy dispersos,
sea muy costosa. Ejemplo: último censo de población y vivienda que se realizó en Ecuador en noviembre
de 2010.

Muestreo: Es la técnica que nos permite seleccionar muestras adecuadas de una población de estudio.
El muestreo debe conducir a la obtención de una muestra representativa de la población de donde
proviene, esta condición establece que cada elemento de la población tiene la misma probabilidad de
ser incluida en la muestra. El estudio de selección de muestras, en sí constituye todo un estudio
pormenorizado, que no atañe al estudio en este texto.

Parámetro: Es cualquier medida descriptiva o representativa de una población. Generalmente se utilizan


las letras griegas como símbolo. Ejemplos: media aritmética poblacional (μ) (mu), desviación estándar
poblacional (σ) (sigma), calculada a partir de los datos observados de toda la población.

Estadístico: Constituyen cualquiera de las medidas descriptivas de una muestra. Se las simboliza con
letras minúsculas de nuestro alfabeto. Ejemplos: media aritmética (x), desviación estándar (s).
Estadística: Es la ciencia que se encarga de la recolección, ordenamiento, representación, análisis e
interpretación de datos generados en una investigación sobre hechos, individuos o grupos de los
mismos, para deducir de ello conclusiones precisas o estimaciones futuras.

División de la Estadística Básicamente la estadística se divide en dos grandes ramas: estadística


descriptiva o matemática y estadística inferencial, estas dos divisiones se articulan adecuadamente
mediante las probabilidades.

Estadística descriptiva: Es la parte de la estadística que permite analizar todo un conjunto de datos, de
los cuales se extraen conclusiones valederas, únicamente para ese conjunto. Para realizar este análisis
se procede a la recolección y representación de la información obtenida. Como ejemplo de estas
estadísticas podemos citar a aquellas que se obtienen generalmente en los deportes, en los
rendimientos académicos de los estudiantes de una determinada materia, en los negocios al determinar
las ventas obtenidas mensualmente en un determinado año por una empresa en particular.

Estadística inferencial: En esta rama de la estadística, lo que se pretende es obtener conclusiones


generales de una determinada población, mediante el estudio de una muestra representativa sacada de
ella, dicho de otra manera, lo que se trata es que, con el valor de los estadísticos obtenidos, podamos
establecer los valores de los parámetros. Entonces podemos concluir que la estadística inferencial
analiza o investiga a una población, valiéndose de los datos y resultados que se obtienen de una
muestra. Ejemplos muy claros de este tipo de estadística constituyen la aplicación de nuevos
tratamientos con nuevos fármacos, o las proyecciones que pueden hacer los investigadores de mercado
sobre cómo influye la publicidad en ciertos segmentos de mercado.

Esta condición vista anteriormente, ha permitido que la estadística inferencial, tenga un crecimiento
cada vez mayor, por cuanto sus aplicaciones son cada vez más eficientes en el manejo de poblaciones;
por tal motivo es que existen métodos muy variados para poder realizar la generalización de los
resultados obtenidos en el muestreo. (Pruebas de hipótesis, predicciones futuras y más).

Ejemplo:

a) Para estudiar cuál es el candidato presidencial por el cual votarán los peruanos en las próximas
elecciones, se toma una muestra de 3500 personas de todo el país. La pregunta es la siguiente,
¿por quién votará en las próximas elecciones presidenciales? Determine la población, muestra e
individuos.
 En este caso, la población sería la población electoral del país, es decir, peruanos con derecho a
voto.
 La muestra sería el conjunto de 3500 peruanos que forman parte de la población.
 Un individuo sería cada uno de los peruanos con derecho a voto.
b) Un conocido fabricante de medicamentos, desea conocer la proporción de personas cuya
diabetes tipo 2, puede ser controlada con un nuevo fármaco. Se realiza un estudio en 3500
personas con esta diabetes, y se encontró que el 75% de ellas pudo controlar su diabetes tipo 2
usando el fármaco. Asumiendo que estas 3500 personas son representativas del grupo de
pacientes de diabetes tipo 2, identifique la muestra y la población.

Solución:

 Población: personas con diabetes tipo 2.


 Muestra: conjunto de 3500 personas con diabetes tipo 2 (personas sometidas al estudio).

VARIABLES ESTADÍSTICAS
La variable estadística es la propiedad o característica de la población que estamos
interesados en estudiar. Puede ser cualitativa o cuantitativa.
Las variables cualitativas toman valores no numéricos. A excepción de las numéricas que no
admiten un criterio de orden. Por ejemplo: El estado civil, con las siguientes modalidades:
soltero, casado, separado, divorciado y viudo. presenta modalidades no numéricas, en las que
existe un orden. Por ejemplo: conseguido en una prueba deportiva: 1º, 2º, 3º,...
Las variables cuantitativas toman valores numéricos. Entre ellas, distinguimos dos tipos:
discretas y continuas.

ESCALAS DE MEDICIÓN
Es un instrumento de medida, de acuerdo al cual se asignan valores a los datos estadísticos.
Se reconocen cuatro niveles de medición: nominal, ordinal, de intervalo y de razón. En la
Figura, se resumen las principales características de cada nivel.
Ejemplos:
a) Escala nominal o clasificatoria:
Variable: Profesión
Escala: Ingeniero, Médico, Abogado, Enfermero, Odontólogo
Diferencia: No existe diferencia entre los profesionales en cuanto a nivel de estudio (tercer
nivel).
b) Escala ordinal:
Variable: Grado de militar y/o policial
Escala: Soldado, Sargento, Suboficial, Oficial, General
Diferencia: Existe diferencia entre los grados jerárquicos no solo en Años de experiencia, sino
en tiempo de estudio.
c) Escala discreta o discontinua:
Variable: Número de hijos
Escala: 1 hijo, 2 hijos, 3 hijos, 4 hijos
Amplitud: Entre 4 y 1 hijos, existe una amplitud de 3 hijos.
d) Escala concreta o continua
Variable: Estatura
Escala: 1,65 m 1,66 m 1,67 m 1,68 m 1,69 m
Amplitud: Entre 1,65 y 1,69 m, existe una amplitud de 0,5 m.
Escala cronológica
Variable. Cambios físicos de una persona
Escala de medición: al 1 año, 5 años, 25 años, 50 años, 75 años, 100 años
Respuesta: descripción de las alteraciones físicas durante su vida.
e) Escala intervalar:
Variable: Medición de la temperatura corporal
Escala: Grados centígrados o Celsius (37º)
Diferencia: Números mayores o menores de 37º en la escala de temperatura
f) Escala de razón
Variable: Relación entre edades
Escala: Juan: 0 años (recién nacido) José: 9 años Joaquín: 18 años
Diferencia: Joaquín 18 años (9 años más que José y 18 años más que Juan).
RECOLECCIÓN DE DATOS
La recopilación o recolección de datos es el momento en el cual el investigador se pone en
contacto con los objetos o elementos sometidos a estudio, con el propósito de obtener los
datos o respuestas de las variables consideradas; a partir de estos datos se prepara la
Información estadística, se calculan medidas de resumen e indicadores para el análisis
estadístico.
El trabajo de recolección de datos, en general, se puede realizar mediante dos modalidades:
1. La técnica de investigación documental o bibliográfica.
2. La técnica de trabajo de campo.
Por su parte, el trabajo de campo puede realizarse de dos maneras:

 La observación y la exploración en el terreno, que consiste en el contacto directo del


investigador con el objeto de estudio.
 La encuesta y la entrevista, que consiste en el acopio de testimonios orales y escritos
de personas vivas. La fase de recolección de datos es uno de los puntos principales de
la investigación, en consecuencia, debe dotarse de ciertas garantías para que los datos
científicos puedan ser confiables y comparables, evitar las desviaciones y la falta de
representatividad.
TÉCNICA DE RECOLECCIÓN DE DATOS
Las técnicas de recolección son diversas y dependen de: la naturaleza del objeto de estudio, de
las posibilidades de acceso o contacto con los elementos investigados, del tamaño de la
población o muestra, de los recursos y de la oportunidad de obtener los datos. La técnica
también está asociada al tipo y naturaleza de la fuente de datos. Entre las técnicas más
frecuentes se tiene:
1. La observación: La observación en el proceso de investigación es la acción de mirar con
rigor, en forma sistemática y profunda, con el interés de descubrir la importancia de
aquello que se observa. La observación es el método básico que se utiliza para adquirir
información acerca del mundo que nos rodea, y, por lo tanto, constituye la técnica
primordial de la investigación científica. La observación puede tener lugar en situaciones
auténticas de la vida ordinaria o también en el laboratorio.
2. Técnica documental: La técnica documental es un tipo de observación que recopila o
busca sus datos en documentos, fuentes escritas o gráficas de todo tipo. En los
documentos se tienen:
- Documentos académicos, constituido por la bibliografía más importante para conocer el
estado del conocimiento de una ciencia.
- Actas e informes, donde las actas son documentos que recogen lo ocurrido en el
momento mismo en que está pasando; en tanto que los informes son documentos
escritos después de ocurrido el acontecimiento.
- Documentos personales, como las autobiografías, diarios, cartas, historias de vidas y
estudios de casos.
- Fotografías, planos, videos, etc.
3. La entrevista: La entrevista es una situación de interrelación o diálogo entre personas,
es una técnica donde una persona llamada entrevistador, encuestador o empadronador
solicita al entrevistado, le proporciona algunos datos o información. La entrevista es un
diálogo intencionado entre personas. El éxito de la entrevista como técnica de
recolección, depende de la eficiencia del trabajo del entrevistador.
4. El cuestionario: El cuestionario es un instrumento constituido por un conjunto de
preguntas sistemáticamente elaboradas, que se formulan al encuestado o entrevistado,
con el propósito de obtener los datos de las variables consideradas en el estudio.
Cuando las preguntas se organizan y se imprimen, se obtiene el formulario o cédula,
que es el instrumento que se utiliza para registrar las respuestas o datos.
5. La encuesta: La encuesta es una técnica de recolección de satos, donde se obtiene la
información tal como se necesita, preparada exprofesamente y con objetivo estadístico.
Permite observar y registrar características en las unidades de análisis de una
determinada población o muestra, delimitada en el tiempo y en el espacio.
ORGANIZACIÓN DE LOS DATOS
Cuando se realiza la recopilación de antecedentes con fines estadísticos, se obtiene una gran
cantidad de datos, algunas veces estos están en su forma natural o empírica (fuentes
primarias) y otras ya están organizadas en tablas, cuadros y gráficos (fuentes secundarias).
Los datos pueden estar incompletos, incorrectos, desordenados, pero en todos los casos
constituyen los datos básicos para iniciar un estudio, conocer y analizar el comportamiento y
las características de los elementos de una población.
TABLAS ESTADISTICAS
Son tablas de trabajo estadístico, que presentan la distribución de un conjunto de elementos de
acuerdo a las categorías de la variable. En ellas se observa la frecuencia o repetición de cada
uno de los valores de la variable, que se obtiene después de realizar la operación de
tabulación; las tablas presentan los diversos tipos de frecuencia (absoluta, relativas, etc.), como
se indica en el Cuadro adjunto. Las tablas de frecuencia también se utilizan para organizar los
datos y calcular algunos indicadores, medidas de resumen o estadígrafos.
En toda tabla de frecuencia completa, se identifican los siguientes elementos:
1) Valor de la variable o intervalo de clase, que resulta de la clasificación o categorización de la
variable. Se representa por Y¡ a los punto d, y por L¡- Ls a los intervalos de clase.
2) Frecuencia absoluta o repetición, es el número de veces que se repite un determinado valor
de la variable; en el caso de intervalos es el número de observaciones comprendido en dicho
intervalo. Se representa por n¡ con (i= 1,2,,..m) donde «m» representa el número de valores
distintos que toma la variable X¡ o el número de intervalos considerados (m<n). Algunos
autores utilizan f¡ para las frecuencias, o sea f¡ = n¡.
3) Frecuencia relativa o frecuencia, es el cociente — representado por h, n 1 con (i =1,2, ...,m).
4) Frecuencias absolutas acumuladas, que resulta de acumular sucesivamente las frecuencias
absolutas, se representa por N¡ (i=1,2,..m). Donde

5) Frecuencias relativas acumuladas, que resulta de acumular o sumar sucesivamente las


frecuencias relativas, se representa por H¡ (¡=1,2,.^), tal como:

6) Frecuencia porcentual, es el porcentaje de elementos que pertenecen a una clase o


categoría. Se puede calcular rápidamente multiplicando la frecuencia relativa por 100%.
7) Frecuencia porcentual acumulada, es el porcentaje de datos respecto al total que se han
reportado hasta ese momento. Se puede calcular rápidamente multiplicando la frecuencia
relativa acumulada por 100%.
GRÁFICOS ESTADISTICOS
La función de los gráficos es la presentación ilustrativa – visual de los datos de los cuadros
correspondientes. Los gráficos nos permiten acercarnos a los datos de unas formas más
intuitivas y directas. Un buen gráfico debe ser: En toda representación gráfica hay sistema de
coordenadas. La línea o eje vertical se llama ordenada o eje de las Y, y la línea o eje horizontal
se denomina abscisa o eje de las X.
VARIABLES CUALITATIVAS:
1.Pictograma
2.Sector circular
3.Barras simples o bastones
4.Barras compuestas (superpuestas o adyacentes)
VARIABLES CUANTITATIVAS:
1. Histograma de Pearson – Pirámide
2. Polígono de frecuencias
3. Gráfico de concentración (Lorentz- Gini)
MEDIDAS DE TENDENCIA CENTRAL
En la búsqueda de la concreción y la simplificación, la información recogida en una tabla o
gráfica estadística suele resumirse en unos pocos valores que nos informan del
comportamiento de todos los individuos del colectivo estudiado. Estos valores, representativos
de todos los datos de una distribución, se llaman parámetros o medidas de centralización.
- Media Aritmética: Media aritmética de una variable estadística es el cociente que
resulta de dividir la suma de todos los valores por el número total de éstos. Se
representa por x. Su cálculo se realiza, según las expresiones que siguen, atendiendo a
la presentación de los datos.
Para datos sin frecuencias Si la variable toma los N valores x1 , x2 ,...,xn la media
aritmética adopta la expresión:

Para datos con frecuencias Si la variable toma los valores o marcas de clase x1, x2, xn,
siendo f1, f2, .fn las frecuencias absolutas correspondientes de la distribución, la media
aritmética se calcula con la expresión:

Para datos ponderados La media ponderada se calcula cuando todos los valores de la
variable no tienen el mismo “peso”. Su fórmula es análoga a la vista con anterioridad,
cambiando las frecuencias fi, por los pesos pi, y, en el denominador, N por la suma de
todos los pesos pi, por lo que resulta:

- Mediana y moda: Se denomina moda de una variable estadística al valor de la variable que
tiene mayor frecuencia absoluta. Se representa por Mo. La moda de una variable discreta
es fácil de calcular, basta buscar el valor de la variable que presenta mayor frecuencia.
Puede ocurrir que la moda no sea única, es decir, la distribución puede tener 2, 3 o más
modas, recibiendo el nombre de bimodal, trimodal, etc. En el caso de que los datos se
encuentren agrupados en intervalos, la clase con mayor frecuencia se denomina clase
modal. Puede tomarse como moda la marca de clase de la clase modal. Si se desea mayor
precisión en el cálculo de la moda, ésta puede obtenerse mediante la expresión:
Li= Límite inferior del intervalo.
C= Amplitud del intervalo.
=Diferencia entre la frecuencia absoluta del intervalo modal y los vecinos.

MEDIDAS DE POSICIÓN PARA DATOS AGRUPADOS Y NO AGRUPADOS: PERCENTILES,


DECILES Y CUARTILES MEDIDAS DE POSICIÓN
Las Medidas de Posición, también conocidas como Otras Medidas de Dispersión, son otras
medidas o métodos que resultan ser más prácticos para precisar ciertas situaciones en las que
se busca describir la variación o dispersión en un conjunto de datos.
LOS CUANTILES: Los cuantiles son los valores de la distribución que la dividen en partes
iguales, es decir, en intervalos que comprenden el mismo número de valores. Cuando la
distribución contiene un número alto de intervalos o de marcas y se requiere obtener un
promedio de una parte de ella. Generalmente, se divide la distribución en cuatro, en diez o en
cien partes. Los cuantiles más usados son los percentiles, cuando dividen la distribución en
cien partes, los deciles, cuando dividen la distribución en diez partes y los cuartiles, cuando
dividen la distribución en cuatro partes.
PERCENTILES: Los percentiles son números que dividen en 100 partes iguales un conjunto de
datos ordenados. Es decir, El percentil k es un valor que deja aproximadamente el k por ciento
de los datos por abajo de él. Se denota por medio de P(k%). Los percentiles son, tal vez, las
medidas más utilizadas para propósitos de ubicación o clasificación de las personas cuando
atienden características tales como peso, estatura, etc. 21 Los percentiles son ciertos números
que dividen la sucesión de datos ordenados en cien partes porcentualmente iguales. Estos son
los 99 valores que dividen en cien partes iguales el conjunto de datos ordenados. Los
percentiles (P1, P2,... P99), leídos primer percentil,..., percentil 99.
DECILES: Los deciles son números que dividen la sucesión de datos ordenados en diez partes
porcentualmente iguales. Son los nueve valores que dividen al conjunto de datos ordenados en
diez partes iguales, son también un caso particular de los percentiles. Los deciles se denotan
D(1), D(2),..., D(9), que se leen primer decil, segundo decil, etc.
CUARTILES: Los cuartiles se definen como los tres valores que dividen la distribución en
cuatro partes iguales. En términos de percentiles el primer cuartil Q(1) coincide con el P(25)
(percentil 25); el segundo cuartil Q(2) con el P(50) o mediana, y el tercer cuartil Q(3) con el
P(75). Entre el primer y el tercer cuartil se encuentra el 50% central de las observaciones.
MEDIDAS DE DISPERSIÓN
La dispersión mide que tan alejados están un conjunto de valores respecto a su media
aritmética. Así, cuanto menos disperso sea el conjunto, más cerca del valor medio se
encontrarán sus valores. Este aspecto es de vital importancia para el estudio de
investigaciones. Se llaman medidas de dispersión aquellas que permiten retratar la distancia de
los valores de la variable a un cierto valor central, o que permiten identificar la concentración de
los datos en un cierto sector del recorrido de la variable. Se trata de coeficientes para variables
cuantitativas. Las principales medidas de dispersión son:

RANGO: El rango de una distribución es la diferencia entre el valor máximo (M) y el valor
mínimo (m) de la variable estadística. Para su cálculo, basta con ordenar los valores de menor
a mayor m de M.
RANGO INTERCUARTIL:Para un cálculo de rangos más eficiente, se elimina n los valores
extremadamente alejados aplicando el rango intercuartil que es una medida de variabilidad
adecuada cuando la medida de posición central empleada ha sido la mediana y él se define
como la diferencia entre el Tercer Cuartil superior y el Primer Cuartil, es decir: Rango
Intercuartil = Q(3) – Q(1).
DESVIACIÓN MEDIA: La desviación respecto a la media es la diferencia entre cada valor de la
variable estadística y la media aritmética. Di = x - x La desviación media es la media aritmética
de los valores absolutos de las desviaciones respecto a la media.
VARIANZA: La varianza, es una medida que, en promedio, cuantifica el nivel de dispersión o de
variabilidad de los valores de una variable cuantitativa con respecto a su media aritmética. Si
los datos tienden a concentrarse alrededor de su media, la varianza será pequeña. Si los
valores tienden a distribuirse lejos de su media, l varianza será grande. La varianza es la media
aritmética del cuadrado de las desviaciones respecto a la media de una distribución estadística.
DESVIACIÓN TÍPICA O ESTÁNDAR: La desviación típica es la raíz cuadrada de la varianza.
Es decir, la raíz cuadrada de la media de los cuadrados de las puntuaciones de desviación. La
desviación típica se representa por σ.
PROBABILIDADES
Elementos de Probabilidades Los primeros estudios de probabilidad fueron motivados por la
posibilidad de acierto o fracaso en los juegos de azar. La probabilidad es un mecanismo por
medio del cual pueden estudiarse sucesos aleatorios, es decir, operaciones cuyo resultado no
puede ser predicho de antemano con seguridad. Por ejemplo, el lanzamiento de una moneda.
Enfoques de probabilidad
1) Experimento aleatorio o experimento: cualquiera operación cuyo resultado no puede ser
predicho de anterioridad con seguridad.
2) Espacio muestral: es el conjunto de todos los posibles resultados asociados a un
experimento.
3) Evento o suceso: es cualquier subconjunto de un espacio muestral. Todo subconjunto
es un evento, en particular Ω mismo es un evento, llamado suceso seguro y el conjunto
vacío, Ø, también es un evento, llamado. Suceso imposible.
CONCEPTO DE PROBABILIDAD EN ESPACIO FINITO EQUIPROBABLE: Si Ω es un
espacio muestral con n elementos, entonces la probabilidad de un evento A es el cociente ,
donde m es el número de elementos de A

También podría gustarte