0% encontró este documento útil (0 votos)
31 vistas21 páginas

Informe Final

estadistica

Cargado por

Mayra Samaniego
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
31 vistas21 páginas

Informe Final

estadistica

Cargado por

Mayra Samaniego
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

MAESTRÍA EN GERENCIA DE

INSTITUCIONES DE SALUD

MATERIA:
ESTADÍSTICA APLICADA SECTOR
SALUD

ESTADÕSTICA APLICADA SECTOR


SALUD

INFORME FINAL

DOCENTE:
ING. SALOMÒN QUITO GUACHAMIN
INDICE

REGRESIÓN SIMPLE
FRECUENCIAS DE LA VARIABLE “CATEGORÍA LABORAL”
ESTADÍSTICOS DE LA VARIABLE
REPRESENTE GRÁFICO
COMPARACIÓN DE ESTADÍSTICOS
DESCRIPTIVOS, VALORES ATÍPICOS Y PERCENTILES
DIAGRAMA DE TUKEY
TABLA DE CONTINGENCIAS (DOS VARIABLES)
TABLA DE CONTINGENCIAS (SEGMENTADA)

REGRESIÓN MULTIPLE
DETERMINACIÓN DE UNA MUESTRA ALEATORIA DE CASOS
ANALISIS DE REGRESIÓN LINEAL SIMPLE
CALCULO DE LA ECUACIÓN DE REGRESIÓN. VARIABILIDAD
DIAGRAMAS DE DIPERSIÓN
ECUACINÓ DE REGRESÓN

DISTRIBUCIÓN NORMAL
ANALISIS DE VARIANZA
PRUEBA POSTHOC
COMPARACIONES MULTIPLES POST HOC O COMPARACIONES A
POSTERIOR
REGRESIÓN SIMPLE
Por favor calcule e interprete los procedimientos correspondientes al archivo de SPSS
“Datos de empleados” en el análisis descriptivo de los datos que se indican. Utilice los
apuntes de la asignatura o lo que usted considere necesario.

FRECUENCIAS DE LA VARIABLE “CATEGORÍA LABORAL”

a) Frecuencias de la variable “Categoría laboral”

Tabla 1 categoria global

De las 474 personas de la muestra en la variable Categoría laboral

- 363 corresponden a un cargo Administrativo con un porcentaje de 76.6%

- 27 corresponden a un cargo de Seguridad con un 5,7%

- 84 corresponden a un cargo Directivo correspondiendo al 17,7%.


ESTADÍSTICOS DE LA VARIABLE

b) Estadísticos de la variable anterior (media, mediana, moda, desviación típica,


asimetría y curtosis).

- Media = 1,41

- Mediana = 1,00

- Moda = 1, representa el valor que m·s se repite dentro de la variable de CategorÌa


laboral.

Por ende, no existe simetría y se presentan una distribución de datos asimétrica con valor
de 1,456, lo que se explica con la curtosis que representa un valor de 0,268.
REPRESENTE GRFÁICO

c) Represente un gráfico de “Salario actual” (con curva normal).

COMPARACIÓN DE ESTADÍSTICOS

d) Comparación de estadísticos indicados de la variable de la primera pregunta con la


variable “Nivel educativo”.
Se analiza que en la categoría laboral el total de colaboradores de la empresa son 474
equivaliendo el 100%

- En ·rea administrativa pertenecen 363 personas que equivale al 76,6%


- En ·rea de seguridad pertenecen 27 personas que equivale al 5,7%
- En ·rea directiva pertenece 84 personas que equivale al 17,7%

Mientras que en la categoría de nivel académico tenemos que del 100% de las personas:

- El porcentaje más bajo siendo el 0,2%, representa al grupo de personas que tienen
21 años de estudio.
- El porcentaje más alto siendo el 40%, representa al grupo de personas que tienen
12 años de estudio.

DESCRIPTIVOS, VALORES ATÕPICOS Y PERCENTILES.

e) Por favor calcule los estadísticos del procedimiento “Explorar” utilizando la variable
“Experiencia previa” como dependiente y la variable “Sexo” como factor. Identifique:
descriptivos, valores atípicos y percentiles. Identifique: Descriptivos, valores atípicos y
percentiles.
En la tabla de resumen estadístico de las variables Experiencia Previa y la variable sexo
como factor, determinamos que el número de casos en Hombres de 258 que equivale al
100% y en mujeres el número de casos es menor con 216 que equivale al 100%.

En esta tabla estadística de comparación de las variables experiencia laboral y la variable


sexo como factor observamos que el promedio de la experiencia media de los hombres es
de 111,62 que es mayor a la experiencia de las mujeres en meses, ya que los promedios
de experiencia de las mujeres son de 77,04 y esto significa que tienen menor cantidad de
meses de experiencia laboral antes de empezar a trabajar en la institución, en cuanto a la
desviación estándar observamos que algunos hombres tienen más experiencia laboral que
algunos hombres y de igual manera son superiores en experiencia laboral de las mujeres.

Con respecto a la asimetría podemos observar que nuestros valores en ambos sexos son
positivos lo que nos indica que tenemos un alto nivel de experiencia laboral.

DIAGRAMA DE TUKEY

f) Represente el gráfico (diagrama de caja) para las variables “Salario inicial” y “Salario
actual” (dependientes) y la variable “Sexo” (factor). Marcar la opción “Dependientes
juntas” del recuadro “Diagramas de caja”
En este diagrama de caja de comparación de las variables Salario actual, Salario inicial
y la variable sexo como factor, se puede evidencias que existen valores atípicos en el
salario actual y salario inicial, siendo que en el grupo de los hombres el trabajador número
29 de nuestra base de datos es la persona que mayor salario actual tiene, mientras que el
de menor salario es el trabajador de la celda 277 en saldo actual y en salario inicial el de
menor rango es la persona de la celda 413 de nuestra base de datos.

TABLA DE CONTINGENCIAS (DOS VARIABLES)

g) Construya una “Tabla de contingencias” con la variable “Sexo” (fila) y la variable


“Categoría laboral” (columna). Represente las variables sexo y categoría laboral en un
único gráfico
En la tabla cruzada de resumen estadístico de las variables categoría laboral y la variable
de sexo, se evidencia que en ambas variables el número de casos es de 474 que equivale
al parámetro del 100%.

En la tabla cruzada de estadística de las variables categoría laboral y la variable de sexo,


se evidencia que el mayor número de personal son del sexo femenino con 206 y se
encuentran en el ·rea administrativa, mientras que el de menor rango de personal igual lo
ocupan las personas de sexo femenino con 0 en el ·rea de seguridad como se refleja en
nuestra base de datos.
En esta grafica estadística de comparación de las variables Salario actual, Salario Inicial
y la variable sexo como factor se evidencia que existen valores atípicos en el salario actual
y salario inicial, siendo que en el grupo de los hombres el trabajador número 29 de nuestra
base de datos es la persona que mayor salario actual tiene, mientras que el de menor
salario es el trabajador de la celda 277 en saldo actual y en salario inicial el de menor
rango es la persona de la celda 413 de nuestra base de datos.

TABLA DE CONTINGENCIAS (SEGMENTADA)

h) Obtenga una tabla de contingencias (segmentada) manteniendo “Sexo” y “Categoría


laboral” como variables fila y columna, respectivamente. Utilizar como variable de
segmentación “Clasificación de minorías”.

En la tabla cruzada de resumen estadística de las variables categoría laboral, variable sexo
y la variable Clasificación de minorías determinamos que en las 3 variables el número de
casos es de 474 que equivale al parámetro del 100%.

En la tabla cruzada de estadística de las variables categoría laboral, variable sexo y la


variable Clasificación de minorías se evidencia:

- Las personas que no tuvieron problemas para ingresar a trabajar fue el sexo hombre con
110 plazas ocupadas en el ·rea administrativa a comparación de las plazas de seguridad
del sexo femenino que fueron de 0.
- Las personas que si tuvieron problemas para ingresar a trabajar fueron las personas del
sexo masculino con 47 plazas en el ·rea administrativa y de igual manera no existen
personas del sexo femenino en ninguna plaza en el área de seguridad y tampoco en el área
de directivo como lo refleja el resultado estadístico de nuestra base de datos.

REGRESIÓN MULTIPLE
Por favor calcule e interprete los procedimientos correspondientes en el análisis de los
datos que se indican. Utilice los apuntes de la asignatura o lo que usted considere
necesario.

DETERMINACIÓN DE UNA MUESTRA ALEATORIA DE CASOS

a) “Seleccione casos” de una muestra aleatoria de la variable “Fecha de nacimiento”


(95% de todos los casos). Archivo de SPSS “Datos de empleados”, Datos,
Seleccionar casos.

Primero se ingresó a datos, después a la opción selección de casos, luego nos permite
seleccionar varios parámetros, seleccionando muestra aleatoria de casos.
Aquí se coloca el tamaño de la muestra de aproximadamente del 95 % de todos los casos
de la variable fecha de nacimiento. En selección de datos de una muestra aleatoria
podemos seleccionar una muestra en base a un porcentaje aproximado, el cual nos pide
en el ejercicio un aproximado del 95% o un número exacto de casos.

Al ser una muestra sin reposición, solo podemos tomar la misma muestra una sola vez.
En este caso, se evidencia una muestra aleatoria de 458 casos de un total de 474 casos.

ANALISIS DE REGRESIÓN LINEAL SIMPLE

b) Realice un análisis de regresión lineal simple (simple=una variable independiente)


con las especificaciones que el programa tiene establecidas por defecto (base la
opción Regresión lineal del menú˙ Analizar). Seleccionar la variable “Salario”
(dependiente) y “Salini” (independiente). Calcule la ecuación de regresión mediante
la determinación de los coeficientes de regresión parcial. Determine a través del
“Resumen del modelo” la variabilidad del “Salario actual” sabiendo que R2 es el
porcentaje de mejora en los pronósticos (R2 expresa la proporción de varianza de la
variable dependiente que está· explicada por la variable independiente; Coeficiente
de determinación). Considerar que en el ejemplo R (coeficiente de correlación
múltiple) toma un valor muy alto (su máximo es 1) y R2 indica que él % de la
variabilidad del “Salario actual” está explicada por depender de, o está asociada al
“Salario inicial”.
En el análisis de regresión entre la variable a pronosticar salario y la variable salini, se
determina que el coeficiente de determinación es 77.8%, esto significa que de cada 100
datos esta curva de regresión analiza el comportamiento de 78 datos.

La ecuación de regresión es la siguiente:

𝑺𝒂𝒍𝒂𝒓𝒊𝒐 𝒂𝒄𝒕𝒖𝒂𝒍 = 𝟏𝟖𝟕𝟐, 𝟖𝟓 + 𝟏, 𝟗𝟏 ∗ 𝒔𝒂𝒍𝒂𝒓𝒊𝒐 𝒊𝒏𝒊𝒄𝒊𝒂𝒍

Ejemplo: si el salario anual fuese de $30 000, ¿Cuál sería el salario a proyectar?

Salario actual = 1872.85 + (1.91 * 20000)

Salario actual = $ 59 172 salario a proyectar

CÁLCULO DE LA ECUACIÓN DE REGRESIÓN. VARIABILIDAD

c) En un análisis de regresión lineal múltiple (múltiple=más de una variable


independiente), la ecuación de regresión ya no define una recta en un plano, sino un
hiperplano en un espacio multidimensional. En un modelo con, por ejemplo, dos
variables independientes, el diagrama de dispersión adopta la forma de un plano en
un espacio tridimensional. Considerando lo anterior, por favor represente con
“Salario” como variable dependiente y “Salini” (salario inicial) y “Exprés”
(experiencia previa) como variables independientes, el diagrama de dispersión
aproximado (intuido) correspondiente (no utilice SPSS). ¿Se puede sacar algún
supuesto de la representación obtenida?

La bondad de ajuste es de 79,5%


DIAGRAMAS DE DIPERSIÓN

SPSS

EXCEL
Podemos observar en el presente grafico que, si se puede utilizar el programa de Excel
para un análisis de regresión lineal múltiple, Acorde a los resultados de la correlación
(ascenso) implican relación directa importante, entre las variables salarios y salarios
inicial.

ECUACIÓN DE REGRESIÓN

d) Lleve a cabo un análisis de regresión múltiple con Regresión lineal del menú˙ Analizar,
seleccionando la variable “Salario” (dependiente) y las variables “Salini, Exprés y Educo”
como independientes. Determine el “Resumen del modelo” y la ecuación de regresión
correspondiente. Considerando que el resumen del ANOVA ofrece el nivel crítico (Sig.;
si es <0,05 indicar· la existencia de relación lineal significativa), sabría indicar si el

hiperplano definido por la ecuación de regresión ofrece un buen ajuste a la nube de

puntos?, y si las tres variables utilizadas contribuyen de forma significativa al ajuste del

modelo? (Tabla de coeficientes de regresión parcial).


La proyección tiene un alto nivel de exactitud del 80,3%

El resultado de la significancia indica que la regresión si es apropiada para realizar un


pronóstico.

𝑺𝒂𝒍𝒂𝒓𝒊𝒐 𝒂𝒄𝒕𝒖𝒂𝒍

= 𝟑𝟖𝟖𝟏 + 𝟏, 𝟕𝟒 ∗ 𝒔𝒂𝒍𝒂𝒓𝒊𝒐 𝒊𝒏𝒊𝒄𝒊𝒂𝒍 − 𝟏𝟔, 𝟒𝟏𝟕 ∗ 𝒆𝒙𝒑𝒆𝒓𝒊𝒆𝒏𝒄𝒊𝒂 𝒑𝒓𝒆𝒗𝒊𝒂

+ 𝟕𝟓𝟕, 𝟐𝟕𝟎 ∗ 𝒏𝒊𝒗𝒆𝒍 𝒆𝒅𝒖𝒄𝒂𝒕𝒊𝒗𝒐

DISTRIBUCIÓN NORMAL
Por favor calcule e interprete los procedimientos correspondientes en el análisis de los
datos que se indican. Utilice los apuntes de la asignatura, el material de la plataforma
Moodle o lo que usted considere necesario. Preste especial atención a responder lo que se
solicita en las partes sin completar o texto subrayado.

Los modelos factoriales de análisis de varianza (factorial=más de un factor) sirven para


evaluar el efecto individual y conjunto de dos o más factores (variables independientes
categóricas) sobre una variable dependiente cuantitativa. En un modelo de dos factores,
los efectos de interés son tres: los dos efectos principales (uno por cada factor) y el efecto
de la interacción entre ambos factores. El procedimiento “univariante” incluye todos estos
modelos factoriales de ANOVA. Pero, además, ofrece la posibilidad de trabajar tanto con
factores de efectos fijos como con factores de efectos aleatorios. También permite llevar
a cabo análisis de covarianza y de regresión, y utilizar modelos aleatorizados en bloques
y modelos jerárquicos o con factores anidados.

En un análisis de varianza factorial existe una hipótesis nula por cada factor y por cada
posible combinación de factores. La hipótesis nula referida a un factor afirma que las
medias de las poblaciones definidas por los niveles del factor son iguales. La hipótesis
referida al efecto de una interacción afirma que tal efecto es nulo. Para contrastar esta
hipótesis, el ANOVA factorial se sirve de estadísticos F. Así pues, para cada efecto existe
una hipótesis y para cada hipótesis un estadístico F que permite contrastarla. El nivel
crítico asociado a cada estadístico F es el que permite decidir si se puede mantener o se
debe rechazar una hipótesis. En un ANOVA factorial se trabaja con tantas poblaciones
como casillas resultan de la combinación de todos los niveles de los factores involucrados.

ANÁLISIS DE VARIANZA

a) Por favor lleve a cabo un análisis de varianza de más de un factor. Seleccione la


opción “Modelo lineal general, univariante” del menú “Analizar”, utilizando el
archivo de SPSS “Datos de empleados”. Para obtener un ANOVA factorial emplee
las especificaciones que el procedimiento “univariante” tiene establecidas por
defecto. Estudie si los grupos definidos por la variable catlab (categoría laboral), por
un lado, y los grupos definidos por la variable minoría (clasificación Étnica), por otro,
difieren en la variable salario (salario actual). Para ello en el cuadro de diálogo
“univariante” seleccione la variable salario y trasládela al cuadro dependiente.

Seleccionar las variables catlab y minoría y trasládelas a la lista Factores fijos.

El resumen del ANOVA muestra en la fila Modelo corregido el nivel crítico asociado al
estadístico F (p= 0,000 < 0,05) indicando que el modelo explica una parte significativa
de la variación observada en la variable dependiente (salario). El valor R2 indica que los
tres efectos incluidos en el modelo (catlab, minoría y catlab*minoría) están explicando el
65,1% de la varianza de la variable dependiente salario. La fila intersección se refiere a
la constante del modelo. Las dos filas siguientes recogen los efectos principales. Los
niveles críticos (Sig.) indican que, mientras los grupos definidos por la variable catlab
poseen salarios medios significativamente diferentes (iguales/diferentes) (Sig.= 0,000 <
0,05), los salarios medios de los grupos definidos por la variable minoría no difieren (Sig.
= 0,127 > 0,05).

La siguiente fila contiene información sobre el efecto de la interacción catlab*minoría.


El estadístico F correspondiente a este efecto tiene asociado un nivel crítico de 3,9%, lo
que indica que el efecto de la interacción es significativo. Solo con este dato, ya se puede
anticipar que las diferencias salariales que se dan entre las distintas categorías laborales
no son las mismas en los dos grupos Étnicos considerados.

La fila error ofrece información referida a la fuente de variación error o residual.

PRUEBA POSTHOC

b) Si alguno de los estadísticos F asociados a los efectos principales resulta significativo,


puede interesar efectuar compasiones post hoc. Los estadísticos F del ANOVA solo
permiten contrastar la hipótesis general de que los promedios comparados son
iguales. Al rechazar esa hipótesis se sabe que existen diferencias, pero no se sabe
dónde están. Para averiguar qué media en concreto difiere de qué otra es necesario
utilizar un tipo particular de contrastes denominados comparaciones múltiples post
hoc o comparaciones a posteriori. Estas comparaciones permiten controlar la tasa de
error al efectuar varias comparaciones utilizando las mismas medias, es decir,
permiten controlar la probabilidad de cometer errores tipo I al tomar varias
decisiones. Pulse el botón Post hoc del cuadro de diálogo Univariante para acceder
al su cuadro de diálogo Univariante: Comparaciones múltiples post hoc. Aunque no
todos los métodos disponibles se basan en la misma lógica, todos ellos se obtienen e
interpretan de la misma forma; de modo que basta con marcar uno o dos para estudiar
los resultados que genera.

En el cuadro de diálogo Univariante, trasladar la variable salario al cuadro Dependiente


y las variables catlab y minoría a la lista Factores fijos. Seleccionar la variable catlab en
la lista Factores y trasladarla a la lista Contrastes post hoc para. Marcar la opción Tukey
del recuadro Asumiendo varianzas iguales y la opción Games- Howell del recuadro No
asumiendo varianzas iguales. En el cuadro comparaciones múltiples post hoc se puede
observar el resultado obtenido con los dos métodos solicitados y que las conclusiones a
las que se llega con ambos procedimientos son idénticas.

La tabla Subgrupos homogéneos (basado en el método Tukey) ofrece un resumen en el


que los grupos cuyas medias no difieren entre sí están agrupados en el mismo
subconjunto. ¿Cuántos subconjuntos existen? Existen dos subconjuntos. Uno de
administración y seguridad, y el otro de directivos.

¿podría interpretarlos según su significación?

En el primer subconjunto tienen sueldos muy semejantes, en cambio en el segundo


subconjunto tiene un sueldo mayor.

Señalar que la clasificación en subgrupos homogéneos no está· disponible con todas las
pruebas post hoc, sino solo con algunas; y a pesar de que no es posible asumir varianzas
poblacionales iguales la clasificación en subgrupos homogéneos se ha realizado
utilizando el método de Tukey en lugar del de GamesHowell.

COMPARACIONES M⁄LTIPLES POST HOC O COMPARACIONES A


POSTERIOR

c) Las comparaciones múltiples post hoc suelen proporcionar toda la información


necesaria para poder interpretar correctamente un efecto principal significativo. Pero
no ocurre lo mismo con los efectos de las interacciones. La interpretación correcta de
una interacción suele requerir la ayuda de un gráfico de líneas, también llamado
gráfico de perfil. En un gráfico de perfil sobre la interacción entre dos factores, en el
eje de ordenadas se representa la escala de las medias de la variable dependiente; en
el eje de abscisas se representan los niveles del primer factor; y las líneas del gráfico
representan los niveles del segundo factor. Por favor obtenga un gráfico de perfil para
el efecto de la interacción entre dos factores: catlab y minoría. En el cuadro de diálogo
Univariante, trasladar la variable salario al cuadro Dependiente y las variables catlab
y minoría a la lista Factores fijos. Trasladar la variable catlab al cuadro Eje horizontal
y la variable minoría al cuadro Líneas distintas.

Un servidor se atrevería a decir que una rápida inspección de las líneas aclararía el
significado de esta interacción: en principio, tanto en el grupo de blancos (minoría=no)
como en el de no blancos (minoría=sí), el salario medio parece mayor en los agentes de
seguridad que en los administrativos, y mayor todavía en los directivos que en los agentes
de seguridad; sin embargo, mientras en los grupos de administrativos y de agentes de
seguridad parecen existir diferencias entre los dos grupos de clasificación Étnica, en el
grupo directivos las diferencias entre los dos grupos de clasificación Étnica parecen
evidentes. Por tanto, las diferencias en salario entre los dos grupos de clasificación Étnica
parecen no ser la misma a lo largo de todas las categorías laborales.

También podría gustarte