1.
) Aspectos generales de la estadística (conceptos)
La estadística matemática es la escala previa en el estudio de la estadística
desde un punto de vista puramente formal, usando la teoría de la probabilidad y
otras ramas de la matemática tales como álgebra lineal y análisis matemático .
La estadística matemática trata de la obtención de información a partir de los
datos. En la práctica tales datos contienen cierta aleatoriedad o incertidumbre
(metrología) incertidumbre, La estadística trabaja con estos datos usando los
métodos de la teoría de la probabilidad.
La estadística es una ciencia formal , con un conocimiento propio, dinámico y
en continuo desarrollo obtenido a través del método científico formal. En
ocasiones, las ciencias fácticas, necesitan utilizar técnicas estadísticas durante
su proceso de investigación factual, con el fin de obtener nuevos conocimientos
basados en la experimentación y en la observación. En estos casos, la
aplicación de la estadística permite el análisis de datos provenientes de una
muestra representativa, que busca explicar las correlaciones y dependencias
de un fenómeno físico o natural , de ocurrencia en forma aleatoria o
condicional.
La estadística es útil para una amplia variedad de ciencias fácticas, desde
la física hasta las ciencias sociales, desde las ciencias de la salud hasta
el control de calidad . Además, se usa en áreas de negocios o
instituciones gubernamentales con el objetivo de describir el conjunto de datos
obtenidos para la toma de decisiones, o bien para realizar generalizaciones
sobre las características observadas.
En la actualidad, la estadística aplicada a las ciencias fácticas permite estudiar
una determinada población a partir de la recopilación de información,
el análisis de datos y la interpretación de resultados. Del mismo modo, también
es una ciencia esencial para el estudio cuantitativo de los fenómenos de masa
o colectivos.
2.) Tipos de estadísticas
R= Hay dos tipos de estadística: la descriptiva y la inferencial.
Estadística descriptiva: te ayuda a organizar una gran cantidad de
datos a través de métodos, tablas y gráficos que te permiten
presentar los resultados de forma ordenada. En este curso te
mostramos algunas de estas herramientas.
Objetivo
La finalidad última de la estadística descriptiva es resumir la información de
conjuntos más o menos numerosos de datos. Para ello se asienta en un
concepto inmediato a la tarea de recuento: la frecuencia, medida empírica de la
ocurrencia de los distintos estados que puede presentar una variable.
Ejemplo:
Un docente de educación primaria desea conocer cuántos de los
alumnos del curso que dirige saben cómo hacer operaciones
aritméticas con el ábaco. Realizó una prueba a todos los
estudiantes con la cual midió su grado de conocimientos en el uso
de esta herramienta, así obtuvo datos que pudo representar en
tablas y gráficos, además de calcular algunos indicadores con los
cuales pudo apreciar que solo un 50% de sus discípulos contaba
con los conocimientos requeridos para empezar el curso, por lo
cual concluyó que lo mejor era impartir unas clases iniciales de
nivelación para que todos estén en capacidad de aprovechar las
lecciones.
°estadística inferencial: se encarga de realizar conclusiones y
deducciones a partir de una muestra de datos. Es útil cuando necesitas tomar
decisiones o establecer cuál es la tendencia en un grupo de información.
Objetivo
La inferencia estadística intenta tomar decisiones basadas en la aceptación o el
rechazo de ciertas relaciones que se toman como hipótesis. Esta toma de
decisiones va acompañada de un margen de error, cuya probabilidad está
determinada.
La estadística inferencial tiene dos objetivos básicos: a) obtener conclusiones
válidas acerca de una población sobre la base de una muestra, es decir, que
las conclusiones que obtengamos de una muestra se puedan extrapolar a la
población que dio origen a esa muestra y b) poder medir el grado de
incertidumbre presente en dichas inferencias en términos de probabilidad
Ejemplo
Un fabricante de colchones quiere conocer los hábitos de sueño de sus
posibles clientes, para lo cual decide realizar una encuesta. Inicialmente
establece una muestra de consumidores con el perfil requerido y procede a
aplicarla, obteniendo así un conjunto de datos que le permiten inferir que una
gran mayoría de usuarios prefieren los colchones blandos así que, para
satisfacer al mercado, decide que empleará espumas de este tipo en la
producción.
3.) Datos
R= son agrupaciones de cualquier número de observaciones
relacionadas. Para que se considere un dato estadístico debe tener 2
características: a) Que sean comparables entre sí. b) Que tengan alguna
relación.
Son números que representan las modalidades de las variables. Por ejemplo,
el 1 puede representar la modalidad "Mujer", el 6.3 representa una de las
magnitudes que podemos registrar en la variable "grado de conocimiento de las
técnicas estadísticas". Los datos pueden ser clasificados según diferentes
criterios, uno de los cuales se basa en las modalidades que presentan: Se dirá
que son datos dicotómicos los que provienen de variables que solo admiten
dos modalidades (por ejemplo la variable "género"), son datos dicotomizados
aquellos que presentan dos categorías pero provienen de variables con más de
dos modalidades (por ejemplo datos con valores 1 y 0 que representan
aprobado y suspenso).
Nos posibilita cuantificar la realidad y disponer de los elementos que nos
permitan su análisis. La base de las actuaciones políticas y
administrativas es el estudio de los datos estadísticos, porque conocer la
realidad nos permite actuar de una forma más coherente (con
conocimiento de causa).
4.) Población
R= Es un conjunto de sujetos o elementos que presentan características
comunes. Sobre esta población se realiza el estudio estadístico con el fin de
sacar conclusiones.
En términos estadísticos se utiliza la muestra de una población como
representativa de su total. De este modo, se deduce que si ciertas
características se presentan en una porción de la población, entonces el total
debe ser similar. Cuando se toma el total de una población determinada, el
estudio recibe el nombre de censo.
Es el conjunto de todos los posibles elementos que intervienen en un
experimento o en un estudio
Tiempo. Toda población se encuentra en un momento histórico o
temporal.
Espacio. Toda población debe tener un espacio delimitado.
Edad o género. Ciertas poblaciones pueden estar comprendidas por
un rango etario o por un género en común.
Gustos/preferencias. Ciertas poblaciones pueden delimitarse por sus
preferencias en común.
Evolución. Toda población varía y evoluciona con el tiempo.
Homogeneidad. Toda población debe compartir características de
similitud entre sus integrantes. Por ejemplo: Distintos postulantes a un
empleo forman una población porque comparten la intención de aplicar
al puesto.
Heterogeneidad. Una población determinada debe ser heterogénea en
relación a otra población. Por ejemplo: Las personas de origen chino
que habitan Estados Unidos son similares entre sí, pero diferentes de
los miembros de otras poblaciones.
5.) Tipos de población
R= El tamaño poblacional es el número de individuos que constituyen la
población. Según el número de sujetos, el tamaño puede ser finito o infinito.
Los conjuntos infinitos son algo artificial o conceptual, ya que toda población de
entidades físicas es finita.
Población finita. Es aquella que indica que es posible alcanzarse o
sobrepasarse al contar. Es aquella que posee o incluye un número
limitado de medidas y observaciones.
Población infinita. Es infinita si se incluye un gran conjunto de medidas y
observaciones que no pueden alcanzarse en el conteo. Son poblaciones
infinitas porque hipotéticamente no existe límite en cuanto al número de
observaciones que cada uno de ellos puede generar
6.) Muestra
R= Una muestra estadística (o una muestra) es un subconjunto de elementos
de la población estadística.
El mejor resultado para un proceso estadístico sería estudiar a toda
la población. Pero esto generalmente resulta imposible, ya sea porque supone
un coste económico alto o porque requiere demasiado tiempo.
Frente a la dificultad de hacer un censo (estudio de toda la población), se
examina una muestra estadística que representará a la totalidad de los sujetos.
Con los resultado obtenidos mediante la muestra, se intentará inferir las
propiedades de todos los elementos, mediante la estadística inferencial.
La muestra elegida debe ser representativa de la población. Las muestras
tienen un nivel de confianza de la bondad con la que representan a todos los
sujetos, generalmente del 95% o superior
7.) Tipos de muestra
R=
Muestra estadística
…siguiente pregunta: ¿Cómo elegimos la muestra? Existen
diferentes tipos de muestreo. Y otra pregunta: ¿Cuál debe ser el tamaño de
la muestra? Tamaño de la muestra Calcular el tamaño de…
Muestreo
…se elige una muestra para representar a todos los individuos.
Esta muestra debe ser representativa de todas las características de todos los
elementos. Tipos de muestreo Las muestras pueden ser…
Muestreo probabilístico
Son aquellas que se escogen a través de métodos más o menos
aleatorios, para garantizar la menor intervención de los criterios del
investigador en la muestra. A su vez, se clasifican en:
Muestras aleatorias simples. Las más simples de todas, se eligen
absolutamente al azar entre la población. Es el caso, por ejemplo, de un
sondeo de opinión pública nacional para el cual son elegidos algunos
ciudadanos por su número de documento.
Muestras estratificadas. Se eligen de manera aleatoria entre los distintos
estratos o niveles de clasificación en los que previamente se ha organizado la
población. Por ejemplo, se puede escoger la muestra al azar entre los distintos
rangos de edad de la población, obteniendo así una muestra al azar, pero
estratificada.
Muestras por conglomerado. Similares a las estratificadas, se eligen
aleatoriamente entre un conjunto previamente determinado, pero en este caso
estos conjuntos no son fruto de los criterios del investigador, sino que están
dados de manera espontánea, natural. Por ejemplo, una muestra de los
vecinos de un barrio determinado, o de los trabajadores de un determinado
edificio.
Muestreo no probabilístico
Son aquellas cuya selección no está libradas al azar, sino a determinados
criterios de búsqueda del investigador, debido a limitantes que impiden un
muestreo mayor. Por ende, este tipo de muestras no son realmente
representativas del universo estadístico estudiado, pero permiten obtener una
aproximación, dotada de un cierto margen de error. Estas muestras pueden ser
de los siguientes tipos:
Muestras intencionales. Aquellas que son escogidas de acuerdo a los criterios
del investigador, o sea, tomando aquellas que considera darán mejores
resultados, al ser más representativas. Un ejemplo de ello es cuando un
periodista pide opiniones a ciertas personas que ha elegido de antemano.
Muestras por conveniencia. Aquellas que son escogidas de acuerdo a lo
que está más a mano, o sea, limitadas a lo inmediato. Es lo que ocurre, por
ejemplo, cuando un representante de una empresa ofrece sus productos a
quienes pasen cerca.
Muestras consecutivas. Aquellas que forman parte de un recorrido del
investigador, que va de grupo en grupo extrayendo los datos para
posteriormente constituir un todo. Un ejemplo de esto lo constituyen los
métodos de aproximación al público de ciertos vendedores o promotores, en
los que invitan a la gente a detenerse para escuchar las virtudes del producto:
algunos lo hacen y otros no, y posteriormente el vendedor cambia de área. Al
final, se reunirán todos los datos de las distintas áreas en que estuvo.
Muestras por cuotas. Se trata de una combinación de las muestras
estratificadas y las muestras intencionales, ya que el investigador elige a las
personas que entrevistar de acuerdo a su pertenencia (y representatividad) de
un determinado estrato o grupo determinado de antemano.
8.) Variables
R= es un símbolo que puede ser reemplazado o que toma un valor numérico
en una ecuación o expresión matemática en general.
En matemáticas se llama variable a cualquier símbolo o palabra que represente
a cualquier valor de los comprendidos en un conjunto. Por ejemplo, en la
función matemática ex la letra x representa a cualquier número real y recibe el
nombre de variable (matemáticamente hablando es una variable
independiente), programación también existen variables para representar
valores, sin embargo su contexto es diferente y aunque en esencia es la misma
idea de las variables matemáticas se definen de otra manera.
Una variable está formada por un espacio en el sistema de almacenaje
(memoria principal de un ordenador) y un nombre simbólico (un identificador)
que está asociado a dicho espacio.
9.) Tipos de variables
R=Variable aleatoria continua
Una variable aleatoria continua es aquella que puede tomar todos los
valores posibles dentro de un cierto intervalo de la recta real.
Ejemplos
La altura de los alumnos de una clase, las horas de duración de una pila.
Variable aleatoria binomial
La variable aleatoria binomial, X, expresa el número de éxitos obtenidos en
cada prueba del experimento.
La variable binomial es una variable aleatoria discreta, sólo puede tomar
los valores 0, 1, 2, 3, 4, ..., n suponiendo que se han realizado n pruebas.
Ejemplo
k = 6, al lanzar una moneda 10 veces y obtener 6 caras.
Variable aleatoria normal
Una variable aleatoria continua, X, sigue una distribución normal de media
μ y desviación típica σ, y se designa por N(μ, σ), si se cumplen las siguientes
condiciones:
[Link] variable puede tomar cualquier valor: (-∞, +∞ )
[Link] función de densidad, es la expresión en términos de ecuación matemática
de la curva de Gauss.
Variable estadística bidimensional
Una variable bidimensional es una variable en la que cada individuo está
definido por un par de caracteres, (X, Y).
Estos dos caracteres son a su vez variables estadísticas en las que sí existe
relación entre ellas, una de las dos variables es la variable independiente y la
otra variable dependiente
10.) Graficas estadísticas
R=Los gráficos estadísticos son las distintas maneras de representar series de
datos estadísticos de diverso tipo y origen para mostrar de manera visual cómo
evoluciona una o más variables en comparación con otras. Por ejemplo, cómo
ha evolucionado el precio del carburante durante un año o el número de
espectadores que recibe un cine y sus elecciones por género cinematográfico
durante una semana.
Los gráficos estadísticos son potentes herramientas para la visualización de
datos que permiten representar de manera accesible información compleja.
Consiguen presentar la información al usuario o lector de manera clara y
precisa, facilitando la comparación y la comprensión de la evolución de
distintas variables
11.) Distribución de frecuencia
R=Las distribuciones de frecuencias son tablas en que se dispone las
modalidades de la variable por filas. En las columnas se dispone el número de
ocurrencias por cada valor, porcentajes, etc. La finalidad de las agrupaciones
en frecuencias es facilitar la obtención de la información que contienen los
datos.
Ejemplo: Quieren conocer si un grupo de individuos está a favor o en contra de
la exhibición de imágenes violentas por televisión, para lo cual han recogido los
siguientes datos: Histograma
12.) Histograma
R= Un histograma es un gráfico que se utiliza para representar la
distribución de frecuencias de algunos puntos de datos de una variable. Los
histogramas frecuentemente clasifican los datos en varios “contenedores” o
“grupos de rango” y cuentan cuántos puntos de datos pertenecen a cada uno
de esos contenedores.
El siguiente ejemplo de histograma representa los resultados de las pruebas de
los estudiantes. Los resultados se clasifican en varios rangos. La altura de cada
barra representa la cantidad de estudiantes que lograron una calificación en
ese rango.
13.) Polígonos de frecuencia
R= Son diagramas de línea que se obtienen al unir los puntos medios del lado
superior de cada rectángulo del histograma correspondiente.
Para completar el polígono, se tiene en cuenta un punto en la marca de clase
del intervalo que esta al inicio y otro punto en la marca de clase del intervalo
final del histograma, ambos con frecuencia 0.
El gráfico generado es un polígono, ya que está formado por segmentos rectos
consecutivos.
Recuerda que el histograma y el polígono de frecuencias son gráficos que se
utilizan para representar distribuciones de frecuencias para datos agrupados.
El siguiente es un polígono de frecuencias que relaciona el puntaje obtenido en
un concurso y la cantidad de participantes del mismo
14.) Distribución de frecuencia acumuladas
R= La frecuencia acumulada o frecuencia acumulativa es la frecuencia de
ocurrencia de valores de un fenómeno menor que un valor de referencia. El
fenómeno puede ser una variable aleatoria que varia en el tiempo o en el
espacio. La frecuencia acumulada se llama también frecuencia de
no−excedencia. El análisis de la frecuencia acumulada se hace con el
propósito de obtener una idea de cuantas veces ocurriría un cierto fenómeno lo
que puede ser instrumental en describir o explicar una situación en la cual el
fenómeno juega un papel importante, o en planificar intervenciones, por
ejemplo en el control de inundaciones
15.) Ojiva
R=Una ojiva es un gráfico que muestra la curva de una función de distribución
acumulativa dibujada a mano o en software de computadora. Los puntos
trazados son el límite de la clase superior y la frecuencia acumulativa
correspondiente. La ojiva para la distribución normal se asemeja a un lado de
un arco arabesco u ojival . El término también se puede usar para referirse a la
función empírica de distribución acumulativa . Este es un tipo de gráfico de
frecuencia y también se denomina polígono de frecuencia acumulada. Sirve
para dar el número (o proporción) de observaciones más pequeño o igual a un
valor particular.
Ejemplo de gráfica de ojiva de la distribución acumulativa
16.) Medidas de tendencia central
R=La medida de tendencia central (moda, media y mediana), parámetro de
tendencia central o medida de centralización es un número ubicado hacia el
centro de la distribución de los valores de una serie de observaciones
(medidas), en la que se encuentra ubicado el conjunto de los datos. Las
medidas de tendencia central más utilizadas son: media, mediana y moda.
Cuando se hace referencia únicamente a la posición de estos parámetros
dentro de la distribución, independientemente de que esté más o menos
centrada, se habla de estas medidas como medidas de posición
En este caso se incluyen también los cuantiles entre estas medidas.
Entre las medidas de tendencia central tenemos lo siguientes:
Media aritmética
Media ponderada
Media geométrica
Media armónica
Mediana (estadística)
Moda (estadística)
Se debe tener en cuenta que existen variables cualitativas y variables
cuantitativas, por lo que las medidas de posición o medidas de tendencia se
usan de acuerdo al tipo de variable que se está observando, en este caso se
observan variables cuantitativas.