0% encontró este documento útil (0 votos)
34 vistas6 páginas

Guía Estadística

El documento presenta una guía sobre estadística. Explica que la estadística se deriva de la palabra "Estado" en latín y que se utilizó para recopilar datos sobre poblaciones y territorios en el Imperio Romano. Define la estadística descriptiva, inferencial y probabilística. Describe elementos básicos como universo, población, muestra, variable y datos. Explica conceptos como tendencia central, medidas de dispersión, distribución de frecuencias y gráficas.

Cargado por

Marlone Pérez
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
34 vistas6 páginas

Guía Estadística

El documento presenta una guía sobre estadística. Explica que la estadística se deriva de la palabra "Estado" en latín y que se utilizó para recopilar datos sobre poblaciones y territorios en el Imperio Romano. Define la estadística descriptiva, inferencial y probabilística. Describe elementos básicos como universo, población, muestra, variable y datos. Explica conceptos como tendencia central, medidas de dispersión, distribución de frecuencias y gráficas.

Cargado por

Marlone Pérez
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

Guía estadística.

Antecedentes.

La palabra Estadística se deriva del latín "Status" que en el Medioevo se traducía como “Estado
Político".

El Imperio Romano fue el primer gobierno que recopiló una gran cantidad de datos sobre la
población, superficie y renta de todos los territorios Profesor Rodolfo Soriano Casas bajo su
control.

Los egipcios analizaban los datos de la población y la renta del país mucho antes de construir las
pirámides en el siglo XXXI A.C.

Los griegos clásicos realizaban censos cuya información se utilizaba para cobrar impuestos hacia el
594 A.C.

Utilidad

(Descriptiva) – Sistematización, recogida, ordenación y presentación de los datos referentes a un


fenómeno que presenta variabilidad o incertidumbre para su estudio metódico, con objeto de

(Probabilística) Deducir las leyes que rigen esos fenómenos, –

(De Inferencia) y poder de esa forma hacer previsiones sobre los mismos, tomar decisiones u
obtener conclusiones.

Estadística

Definiciones

Es el estudio de los métodos y procedimientos para recoger, clasificar, resumir y analizar datos y
para hacer inferencias científicas partiendo de tales datos.

• “Rama de las matemáticas que trata de la recopilación, el análisis, la interpretación y la


representación de una gran cantidad de datos numéricos”.

TIPOS DE ESTADÍSTICA

ESTADÍSTICA DESCRIPTIVA: Puede definirse como aquellos métodos que incluyen la recolección,
presentación y caracterización de un conjunto de datos con el fin de describir apropiadamente
las diversas características de esa población o de ese conjunto de datos. EJEMPLO: Durante los
últimos dos días se ha informado un total de ocho homicidios en el Distrito Federal.

ESTADÍSTICA INFERENCIAL: Pueden definirse como aquellos métodos que hacen posible la
estimación de una característica de una población o la toma de una decisión referente a una
población, basándose sólo en los resultados de la muestra. EJEMPLO: Si aún hay un 11% de los
electores indecisos y si la población electoral es de cerca de 88 millones electores, quiere decir
que aún hay cerca de 10 millones de electores quienes realmente decidirán cuál va a ser el
candidato ganador.
Elementos básicos.

◼ UNIVERSO: Es un conjunto integrado por todos los elementos, seres u objetos que contienen
las características u observaciones que se requieren en una investigación dada

POBLACIÓN: Es el conjunto integrado por todas las mediciones u observaciones del universo de
interés en la investigación. Por lo tanto pueden definirse varias poblaciones en un sólo universo,
tantas como características a medir POBLACIÓN FINITA POBLACIÓN INFINITA

INDIVIDUO: También llamado unidad estadística, es cada uno de los elementos que componen la
población.

MUESTRA: Es una parte (sub-conjunto) de la población, obtenida con el propósito de investigar


propiedades que posee la población. Es decir, se pretende que dicho sub-conjunto, represente a la
población de la cual se extrajo.

MUESTREO: Es la reunión de los datos que se desea estudiar obtenidos de una proporción
reducida y representativa de la población.

VALOR: Es cada uno de los distintos resultados que se puede obtener en un estudio estadístico. Si
lanzamos una moneda 5 veces, obtenemos dos valores: águila o sol.

DATO: Es cada uno de valores que se ha obtenido al realizar un estudio estadístico. Si lanzamos
una moneda 5 veces obtenemos 5 datos: águila, sol, sol, águila, sol.

VARIABLE: Característica que puede tomar diferentes valores dentro de un conjunto de datos
(susceptible a medirse u observarse).

VARIABLE CUALITATIVA

Sus valores (modalidades) no se pueden asociar naturalmente a un número (no se pueden hacer
operaciones algebraicas con ellos), sin embargo, expresan atributos o categorías.

Nominales: Si sus valores no se pueden ordenar. Pueden ser codificados numéricamente pero hay
una relación arbitraria entre los números asignados y el valor de la variable. ◼ Sexo (H, M), Grupo
Sanguíneo, Religión, Nacionalidad, Fumar (Sí/No)…

Ordinales: Si sus valores se pueden ordenar. Al ser codificados numéricamente deben guardar una
correspondencia entre los números asignados y el verdadero valor de la variable. ◼ Mejoría a un
tratamiento, Grado de satisfacción, Intensidad del dolor…

VARIBALES CUANTITATIVAS.

Si sus valores son numéricos (tiene sentido hacer operaciones algebraicas con ellos).

Discretas: Sólo toma valores enteros ◼ Número de hijos, cigarrillos, “cumpleaños”… ◼

Continuas: Pueden tomar cualquier valor de un intervalo, son posibles infinitos, valores
intermedios. ◼ Altura, Presión intraocular, dosis de medicamento administrado…

Clasificación de Variables por su relación.


Independientes: Se denominan así a aquéllas que son “manipuladas” por el investigador en un
experimento con el objeto de estudiar cómo incide sobre la expresión de la variable dependiente.
(Causa “X”)

Dependientes: El carácter de Dependiente se define como la propiedad o característica que se


trata de cambiar mediante la manipulación de la variable independiente. Esta variable no se
manipula, se mide para ver el efecto que la manipulación de la independiente tiene sobre ella.
(Efecto “Y”)

Tipos de muestras.

Muestras no probabilísticas: La elección de los elementos no depende de la probabilidad, sino de


causas relacionadas con las características de la investigación.

Muestras Probabilísticas: Los elementos de una población tienen la misma posibilidad de ser
escogidos por medio de una selección aleatoria o mecánica de las unidades de análisis.

Distribución de Frecuencias.

Es la forma de agrupar datos por categorías convenientes, indicando el número de observaciones


por cada categoría; se utiliza una tabla.

A veces las categorías de las distribuciones de frecuencia son tantas que es necesario resumirlas. ◼
FRECUENCIA ABSOLUTA.- agrupación conveniente de datos por categoría

◼ FRECUENCIA RELATIVA.- porcentajes de casos en cada categoría. (.1)

◼ FRECUENCIA ACUMULADA.- Lo que se va acumulando en cada categoría. (100)

Gráficas

Forma gráfica de barras que emplea variables con escala de intervalos o de proporciones. Por
ejemplo: para realizarla, se toma en cuenta para el eje “X”, los Límites reales, y para el eje “Y”, las
frecuencias absolutas.

HISTOGRAMA: Forma gráfica de barras que emplea variables con escala de intervalos o de
proporciones. Para realizarla, se toma en cuenta para el eje “X”, los Límites reales, y para el eje
“Y”, las frecuencias absolutas.

Polígono De Frecuencias: Forma gráfica que representa una distribución de frecuencias en la


forma de una línea continua que traza un histograma. Para su elaboración, se consideran las
marcas de clase en el eje “X” y las frecuencias absolutas en el eje “Y”.

Gráfica De Barras Utiliza barras para indicar la frecuencia de ocurrencia de las observaciones: se
construye con las frecuencias absolutas en el eje “Y”, y en el eje “X” por los LI y LS de cada clase,
dejando un espacio entre barras.

Medidas de tendencia central

La tendencia central se refiere al punto medio de una distribución. Las medidas de tendencia
central se conocen como medidas de posición.
Son las medidas que describen un valor típico en un grupo de observaciones, cuya característica
principal es que estas medidas se aplican principalmente a grupos. MEDIA. MEDIANA, MODA.

Media (aritmética) Promedio de todas las observaciones de un grupo, es decir el valor obtenido
sumando las observaciones y dividiendo esta suma por el número de datos que hay en el grupo.
❖La media se utiliza cuando se pueden sumar los valores (datos cuantitativos)

❖La media no se debe utilizar en datos cualitativos

❖La media es sensible a valores en los extremos

Conjunto de datos: 6, 3, 8, 6 y 4 X = 6 + 3 + 8 + 6 + 4 5 = 27 / 5 = 5.4

Mediana: Es la observación media (punto a partir del cual la mitad de los datos son menores y la
otra mitad son mayores).

Procedimiento para obtener la mediana:

❖Ordenar los datos de mayor a menor o viceversa

❖Contar hasta encontrar el valor medio

❖Si n es par, entonces se define como el promedio de los dos valores medio.

Mediana de: 6, 7, 8, 9, 9, 10 8 + 9/ 2 (valor) Mediana = = 8.5

MODA Es el valor que se presenta con mayor frecuencia.

❖Por lo general se utiliza con grandes promedios de datos

❖Se puede utilizar con datos nominales

❖No tiene por qué ser única

Cuando un grupo de datos tiene dos modas, se llama bimodal

• Cuando un grupo de datos tiene varias modas, se llama multimodal

Medidas de variabilidad o dispersión

Son medidas que indican la dispersión de los datos en la escala de medición y tienen por objeto
medir la magnitud de los desvíos de los valores de la variable con respecto al valor central de la
distribución.

Responden a la pregunta ¿dónde están diseminadas las puntuaciones o valores obtenidos? Son
intervalos, designan distancias o un número de unidades en la escala de medición.

Son: [Link] [Link]ón estándar [Link]

Dispersión: La distribución conjunta de dos variables puede expresarse gráficamente mediante un


diagrama de dispersión.
Medidas de Dispersión o Variabilidad

• La dispersión de un conjunto de observaciones se refiere a la variabilidad que presentan éstas.

• Una medida de dispersión conlleva información respecto a la cantidad total de variabilidad


presente en el conjunto de datos

Rango: También llamado recorrido, es la diferencia entre la puntuación mayor y la puntuación


menor, e indica el número de unidades en la escala de medición que se necesitan para incluir los
valores máximo y mínimo.

Desviación estándar: Es el promedio de desviación de las puntuaciones con respecto a media.

MEDIDAS DE DISPERSIÓN

Varianza : La varianza es una medida de la dispersión que emplea todos los valores de los datos. Se
basa en la diferencia entre cada valor y la media. Fluctuación o variabilidad promedio de un
determinado valor de la población.

◼ La diferencia entre cada valor del dato Xi y el promedio ( x para una muestra y µ para una
población) se llama desviación respecto al promedio.

◼ Para calcular la varianza, las desviaciones respecto al promedio se elevan al cuadrado. Podemos
decir que: la desviación estándar y la varianza evalúan la manera en que fluctúan los valores
respecto a la media.

◼ Para una muestra la desviación se expresa como: (Xi – x); para una población: (Xi - µ).

Varianza: Es la desviación estándar elevada al cuadrado y se simboliza como:

El coeficiente de variación, también denominado como coeficiente de variación de Pearson, es


una medida estadística que nos informa acerca de la dispersión relativa de un conjunto de
datos.
COEFICIENTE DE VARIACIÓN % CV = S/ X -(100)
ANÁLISIS DESCRIPTIVO DE DATOS BIVARIADOS, CORRELACIÓN: Cuando sobre una
población se estudian simultáneamente los valores de dos variables estadísticas, el conjunto
de los pares de valores correspondientes a cada individuo se denomina distribución
bidimensional.
Covarianza:
La covarianza es una medida de la asociación lineal entre dos variables que resume la
información existente en un gráfico de dispersión. Es un indicador de si los valores están
relacionados entre sí, se simboliza por σxy y se calcula por medio de:
Diagramas de dispersión y correlación
La distribución conjunta de dos variables puede expresarse gráficamente mediante un
diagrama de dispersión: en un plano se representa cada elemento observado haciendo que
sus coordenadas sobre los ejes cartesianos sean los valores que toman las dos variables para
esa observación.

La relación entre dos variables cuantitativas queda representada mediante la línea de mejor
ajuste, trazada a partir de la nube de puntos.

Correlación
Si los cambios en una variable influyen en los valores de otra, dichas variables están
correlacionadas o que presentan correlación entre sí.
Ejemplo: Las calificaciones de 10 alumnos en Matemáticas y Física:

También podría gustarte