0% encontró este documento útil (0 votos)
20 vistas14 páginas

Introducción al Análisis de Datos Criminológicos

El documento presenta una introducción al análisis de datos en criminología, enfatizando la importancia de la investigación empírica y el diseño de investigación para abordar preguntas sobre conducta antisocial y delito. Se describen los procesos de recogida, organización, análisis e interpretación de datos, así como las funciones del análisis estadístico en la investigación. Además, se abordan conceptos clave como la unidad de análisis, tipos de variables y la preparación de datos para el análisis estadístico.

Cargado por

Clàudia Aracil
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
20 vistas14 páginas

Introducción al Análisis de Datos Criminológicos

El documento presenta una introducción al análisis de datos en criminología, enfatizando la importancia de la investigación empírica y el diseño de investigación para abordar preguntas sobre conducta antisocial y delito. Se describen los procesos de recogida, organización, análisis e interpretación de datos, así como las funciones del análisis estadístico en la investigación. Además, se abordan conceptos clave como la unidad de análisis, tipos de variables y la preparación de datos para el análisis estadístico.

Cargado por

Clàudia Aracil
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Introduccion-al-analisis-de-dato...

dehyraasr

Tècniques d'Investigació en Criminologia II

3º Grado en Criminología

Facultad de Derecho
Universitat de Barcelona

Reservados todos los derechos.


No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-9882211

Técnicas de Investigación II Dehyra Sans Reina

Introducción al análisis de datos


Introducción
● La Criminología es el estudio empírico y sistemático de la distribución y los determinantes de la conducta
antisocial y el delito en poblaciones especí cas, y la aplicación de este estudio a la gestión de los problemas de
delincuencia y violencia.
● La investigación empírica (que obtiene datos de la realidad) es una pieza fundamental de la Criminología.
● Toda investigación criminológica se basa en una pregunta de investigación, un diseño especí co y un conjunto
de datos.

Diseño de la investigación
● Consiste en la elección de una determinada forma de afrontar el estudio.
● Es una guía en el proceso de recoger, analizar e interpretar datos u observaciones.

Plan, estructura, lógica general del estudio cuya función es garantizar que los datos recogidos permiten dar respuesta a
las preguntas de investigación de mono no ambiguo.

Datos
● Los datos son piezas de información sobre la realidad.
● Se generan a partir del registro, a través de un instrumento de recogida de datos, de nuestra observación de la
realidad.
● Los datos, su análisis e interpretación, nos permiten dar respuesta a una pregunta de investigación.

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-9882211

Técnicas de Investigación II Dehyra Sans Reina

- Ontología → La realidad es objetiva o es una construcción. Cada uno tiene una naturaleza, por eso mismo
existen unas normas y leyes, nos regula lo que podemos consensuar. La realidad social es una construcción.
- Epistemología → Como yo construyo y género el conocimiento. Como se hace la teoría. La realidad es

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
construida de sujeto a sujeto.
- Metodología → Se relaciona con el diseño de investigación y las decisiones. Cuantitativa (realidad subjetiva) y
cualitativa (realidad construida). Poder obtener información de la realidad particular.

Tratamiento de los datos


1. Recogida de datos. Proceso por el que se recopilan y registran, a partir de la aplicación de alguna técnica de
recogida de datos a una muestra o población, en función de un diseño de investigación determinado, los datos
que deben permitir responder a la pregunta de investigación.
2. Organización de los datos. Proceso por el que los datos recogidos son preparados para el análisis.
3. Análisis de datos. Es el proceso por el que se examinan los datos recogidos. Es una fase fundamental cuando
los datos se han recogido, pero se debe tener en cuenta durante la fase de diseño, y se completa durante la fase
de redacción del informe y evaluación.
4. Interpretación de los datos. Fase en la que se profundiza en el signi cado de los resultados, en aquellos
aspectos que son más relevantes, en sus implicaciones para la pregunta de investigación.

Funciones del análisis estadístico en los diseños de investigación


● Resumir los datos. Resumir una gran cantidad de datos procedentes de numerosas observaciones sobre una
muestra de casos grande (mayor que 30). Esto permite escribir las variables analizadas.
○ Por ejemplo, ¿En qué hora del día se producen más robos? ¿Qué porcentaje de alumnos ha sido
víctima de abuso escolar?
● Identi cación de relaciones de covariación o asociación. El análisis estadístico nos va a permitir analizar las
relaciones de correlación existentes entre dos o más variables (si existe o no covariación, su fuerza, su
signi cación estadística). El análisis multivariable tendrá por objetivo el análisis simultáneo de dos o más
variables medidas para un conjunto de objetos. El objetivo es explicar las causas de la variación de una
variable, ver qué variables están asociadas a su variación.
○ Por ejemplo, ¿Qué relación hay entre tener un padre en prisión y la probabilidad de cumplir una
condena de prisión?
● Inferencia estadística. Al tratar con muestras, toda medida (sea una media, una proporción o un coe ciente de
correlación) es una estimación, está sujeta a cierto grado de error. El análisis estadístico nos proporciona
procedimientos para conocer el grado de con anza en la precisión de la medida que hacemos en nuestra
muestra.

Tipos de análisis de datos estadísticos comunes en diseños de investigación

Abre tu Cuenta NoCuenta con el código WUOLAH10 y llévate 10 € al hacer tu primer pago
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-9882211

Técnicas de Investigación II Dehyra Sans Reina

Elementos esenciales en el análisis de datos cuantitativo


● Unidad de análisis. La unidad de análisis es la entidad social objeto de estudio de la que registramos
determinadas variables (atributos). Las unidades de análisis pueden ser: individuos, grupos, productos,
unidades geográ cas. La unidad de análisis suele coincidir con la unidad de registro, pero también podemos
trabajar con unidades de análisis de un nivel superior y variables agregadas.
○ Denominamos casos a cada uno de los elementos de la unidad de análisis que son objeto de

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
observación y que, por tanto, han sido incorporados en la muestra estudiada.
● Variables. Toda característica o propiedad de la unidad de análisis puede adoptar dos o más valores (o
categorías) diferentes.

Tipos de variables (en función del papel en la investigación)


● Variables dependientes. Variable cuya variación queremos explicar.
● Variables independientes. Variables que tienen efectos (causales) sobre la variable dependiente.
● Variables de control, perturbadoras. Variables que pueden incidir en la relación entre la variable independiente
y la variable dependiente. Su no consideración en el estudio puede producir sesgos en la estimación de los
efectos causales.

Tipos de variables (en función del nivel de medida)


● Cualitativas o categóricas.
○ Nominales. Tan solo permiten clasi car las unidades en categorías no ordenables. Por ejemplo, haber
reincidido o no, el sexo, ser psicópata o no. Las variables nominales se cuanti can a través de
recuentos y proporciones o porcentajes.
○ Ordinales. Permiten ordenar las observaciones de menor o mayor. Por ejemplo, la peligrosidad (baja,
media o alta).
● Cuantitativas o de escala.
○ Cuasi-cuantitativas. Variables ordinales con más de 4 categorías que tratamos, a efectos de análisis
estadístico, como variables cuantitativas o de escala.
○ De razón. Son las variables numéricas puras. Permiten todas las operaciones. Por ejemplo, la edad de
comparecencia ante la justicia.

Organización de los datos


Antes de proceder con el análisis estadístico de los datos derivados de un diseño cuantitativo, se debe proceder a la
preparación y organización de la matriz de datos. Implica:
- Creación de la matriz de datos.
- Codi cación de variables categóricas.
- Depuración de errores e incoherencias.
- Transformación y cálculo de nuevas variables.

Matriz de datos y codi cación (tratamiento de datos)


La matriz de datos es una forma de sistematizar la información recogida de la realidad para investigar un problema
empírico. En las las se sitúan los casos objeto de estudio. En las columnas se sitúan las variables. La información se
recoge en una estructura matricial resultado de cruzar las variables y las unidades de análisis.

La codi cación de la matriz de datos es una asignación de un número a cada categoría del documento de observación
(matriz). Cada respuesta del cuadro de observación es traducida y representada por indicaciones numéricas o códigos.
El objetivo es facilitar el estudio al pasar categorías de respuesta a números. La nalidad es facilitar la agrupación de

Abre tu Cuenta NoCuenta con el código WUOLAH10 y llévate 10 € al hacer tu primer pago
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-9882211

Técnicas de Investigación II Dehyra Sans Reina

datos, hechos o respuestas. Para codi car la matriz utilizamos el manual de codi cación: guía que informa sobre cómo
se codi can los datos.

La codi cación de los datos implica transformar las categorías de respuesta de las variables categóricas en números. El
objetivo es que la matriz solo contenga números que permitan realizar las operaciones pertinentes.
Por ejemplo, no tratado = 0, tratado = 1.

Presentación ordenada de datos


Las tablas de frecuencias y las representaciones grá cas son dos maneras equivalentes de presentar la información. Las
dos exponen ordenadamente la información recogida en una muestra.

Datos desordenados y ordenados en tablas

Tratamiento de datos
● Análisis de datos:
○ Es el proceso por el que se examinan los datos recogidos.
○ Tipos de análisis: Estadísticos y cualitativos.
● Análisis estadístico:
○ Conjunto de procedimientos y técnicas que permiten describir, explicar y analizar los datos
cuantitativos y obtenidos.
○ Se realiza en diseños de investigación experimental, cuasi-experimental y observacional, donde los
datos son cuantitativos.
○ Permite resumir gran cantidad de datos procedentes de muchas observaciones sobre una muestra
grande casos (>30).
○ Identi ca relaciones de covariación o asociación entre variables donde el aumento o disminución de
una se traduce en aumento o disminución de la otra.
○ Proporciona métodos para conocer el grado de con anza en la precisión de la medida que hacemos
en la muestra.

Tratamiento de datos
● Tipos de análisis de datos estadísticos:

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-9882211

Técnicas de Investigación II Dehyra Sans Reina

○ Univariable → Describe la distribución de una variable o conjunto de variables por separado (por
ejemplo, el sexo).
○ Bivariable → Compara la distribución de una variable en las categorías de otra variable. Estudia la
covriación entre dos variables permitiendo el análisis conjunto de dos características para detectar
relaciones entre ellas (por ejemplo, sexo/voto).
○ Multivariable → Estudia el grado de covariación neto entre cada una de las variables independientes

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
y una variable dependiente medidas simultáneamente (por ejemplo, sexo, situación
económica/voto).

Los posibles valores de una variable suelen denominarse modalidades. Las modalidades pueden agruparse en clases
(intervalos).
● Edades:
○ Menos de 20 años, de 20 a 50 años, más de 50 años.
● Hijos:
○ Menos de 3 hijos, de 3 a 5 hijos, 6 o más hijos.

Las modalidades/clases deben formar un sistema exhaustivo y excluyente.


● Exhaustivo: No podemos olvidar ningún posible valor de la variable.
○ Mal: ¿Cuál es su color de pelo (rubio, moreno)?
○ Bien: ¿Cuál es su grupo sanguíneo?
● Excluyente: Nadie puede presentar dos valores simultáneos de la variable.
○ Estudio sobre el ocio.
■ Mal: De los siguientes, ¿qué le gusta? (deporte, cine).
■ Bien: ¿Le gusta el deporte? (Sí/No).
■ Bien: ¿Le gusta el cine? (Sí/No).
■ Mal: ¿Cuántos hijos tiene? (ninguno, menos de 5, más de 2).

Errores y base de respuesta


● Se trata de examinar la matriz de datos para detectar posibles errores en la introducción de los datos. Dos
tipos:
○ Valores fuera de rango o no permitidos. Datos que no entran dentro de los valores permitidos de
una determinada variable.
■ Por ejemplo, si de nimos no tratado = 1 y tratado = 2, no deberíamos encontrar ningún
valor 3 en esa variable.
○ Incoherencias. Valores no admisibles en una variable teniendo en cuenta el valor observado en
alguna otra variable.
● Determinación de la base de respuesta. El objetivo es veri car que existen datos en todas las variables de
interés para los n elementos de la muestra. Se trata de detectar casos perdidos o missing (casillas en blanco),
que indican ausencia de respuesta en una variable para un determinado caso. Es necesario determinar si se
trata de casos perdidos aleatorios o sistemáticos (indican algún problema que puede afectar a la capacidad de
generalización).

Transformación de variables
● Combinar categorías o reordenar las categorías de las variables. Las categorías de una variable se pueden
reducir con el objetivo de facilitar el análisis o la interpretación (por ejemplo, el número de delitos). Las
variables cuantitativas se pueden transformar y recodi car en variables categóricas.

Abre tu Cuenta NoCuenta con el código WUOLAH10 y llévate 10 € al hacer tu primer pago
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-9882211

Técnicas de Investigación II Dehyra Sans Reina

○ Por ejemplo, convertir una escala de agresión en agresiva y no agresiva.


● Crear nuevas variables a partir de variables existentes. Un ejemplo es el desarrollo de escalas a partir de
múltiples ítems.

Análisis descriptivo univariable

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
1. Introducción .

● El análisis descriptivo univariable es el primer paso en el análisis de datos cuantitativos.


○ Se denomina descriptivo porque su objetivo es describir la distribución de las variables medidas en
un estudio.
○ Es univariable porque el análisis se realiza para cada una de las variables del estudio de modo
separado, de una en una.
● Este análisis permite resumir un conjunto de datos cuantitativos. Es la forma más simple de análisis
estadísticos.
● El análisis descriptivo se basa en un conjunto de estadísticas o medidas descriptivas (de centralidad y de
dispersión) y un conjunto de procedimientos grá cos.

Estadística descriptiva
Incluye la tabulación, representación y descripción de conjuntos de datos. A partir de ellos se puede organizar,
simpli car y resumir información básica. Los datos pueden ser de variables cuantitativas o categóricas.

¿Para qué sirve la estadística?


La ciencia se ocupa en general de fenómenos observables. La ciencia se desarrolla observando hechos, formulando leyes
que los explican y realizando experimentos para validar o rechazar dichas leyes. Los modelos que crea la ciencia son de
tipo determinista o aleatorio (estocástico).

La estadística se utiliza como tecnología al servicio de las ciencias donde la variabilidad y la incertidumbre forman parte
de su naturaleza.

‘’Rama de matemáticas que se encarga de la recopilación, análisis e interpretación de datos referentes a la


criminalidad en un cierto lugar, a los individuos que delinquen y las instituciones destinadas al castigo y
rehabilitación de los delincuentes convictos’’.

De nición de estadística
La estadística es la ciencia de los datos y técnica que tiene que ver con la recolección, procesamiento, análisis e
interpretación de datos. Puede ser descriptiva e inferencial.

La estadística es la ciencia:
● Descriptiva → Sistematización, recogida, ordenación y presentación de los datos referentes a un fenómeno
que presenta variabilidad o incertidumbre para su estudio metódico, con objeto de…
● Probabilidad → … deducir las leyes que rigen los fenómenos,
● Inferencia → y poder de esa forma hacer previsiones sobre los mismos, tomar decisiones u obtener
conclusiones.

Abre tu Cuenta NoCuenta con el código WUOLAH10 y llévate 10 € al hacer tu primer pago
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-9882211

Técnicas de Investigación II Dehyra Sans Reina

Estadística inferencial
Proporciona métodos para estimar las características de un grupo (población) basándose en los datos
de un conjunto pequeño (muestra).

Población y muestra
● Población (‘’population’’) → Conjunto sobre el que estamos interesados en obtener
conclusiones (hacer inferencia).
○ Normalmente es demasiado grande para poder abarcarlo.
● Muestra (‘’sample’’) → Subconjunto suyo al que tenemos acceso y sobre el que realmente hacemos las
observaciones (mediciones).
○ Debería ser ‘’representativo’’.
○ Está formado por miembros ‘’seleccionados’’ de la población (individuos, unidades experimentales).

Procesos de análisis descriptivo

2. Estadísticos para variables categóricas .

Procedimientos estadísticos para variables cualitativas


● El análisis de variables cualitativas se reduce al análisis de su distribución de frecuencias. Es decir, (1) al
recuento de cada categoría de la variable en la muestra y (2) a su transformación en una proporción
dividiendo la frecuencia de cada categoría por la frecuencia total.
● La tabla de frecuencias consistiría, por tanto, en proporcionar:
○ Frecuencias absolutas. El recuento de cada categoría. El número de observaciones en esa categoría.
○ Frecuencias relativas. El cociente entre la frecuencia de una categoría y el número total de
casos/observaciones.

Procedimiento de visualización (grá cos) para variables cualitativas


● Grá co de sectores. Permite analizar la importancia relativa de cada categoría con respecto al total. Se expresa
en porcentajes.
● Grá co de barras. Permite comparar la frecuencia absoluta de cada categoría de la variable. Se puede expresar
en frecuencias absolutas o relativas.

2.1. Tablas de frecuencias .

Exponen la información recogida en la muestra, de forma que no se pierde nada de información (o poca).
● Frecuencias absolutas → Contabilizan el número de individuos de cada modalidad.

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-9882211

Técnicas de Investigación II Dehyra Sans Reina

● Frecuencias relativas (porcentajes) → Idem, pero dividido por el total.


● Frecuencias acumuladas → Sólo tienen sentido para variables ordinales y numéricas.
○ Muy útiles para calcular cuantiles (ver más adelante).
■ ¿Qué porcentaje de individuos tiene menos de 3 hijos? Sol: 83,8%.
■ ¿Entre 4 y 6 hijos? Sol: 1ª: 8,4%+3,6%+1,6% = 13,6%. Sol: 2ª 97,3% - 83,8% = 13,5%.

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Creación de escalas
● Conjunto de procedimientos creados en la investigación social para cuanti car actitudes, sentimientos,
percepciones.
● Se desarrollaron para obtener niveles de medida ordinales o de razón sobre las actitudes.

3. Estadísticos para variables cuantitativas .

Procedimientos estadísticos para variables cuantitativas


● Medidas de centralidad (permiten resumir una variable cuantitativa).
○ Moda.
○ Media.
○ Mediana.
● Medidas de dispersión (en qué medida varían los valores en una variable determinada).
○ Rango.
○ Desviación típica.
○ Coe ciente de variación.
● Medidas de distribución (cómo se distribuyen los valores en una variable.
○ Coe ciente de asimetría.
○ Curtosis.

3.1. Estadísticos de centralidad .

Medidas de centralidad
● Moda. Es el valor más frecuente en una distribución. Es simple de calcular e intuitiva. Su desventaja es que se
pierde información, por lo que puede dar una impresión errónea sobre los datos. Se puede utilizar, también,
en variables nominales.
● Media aritmética. Nos proporciona el valor más representativo de una distribución. Es el promedio simple de
todos los valores: la suma de los valores observados dividida por el número total de observaciones.
○ Ventajas:
■ Todos los valores están incluidos en el cálculo. Tiene todos los valores en cuenta.
■ Medida útil para comparar dos poblaciones.

Abre tu Cuenta NoCuenta con el código WUOLAH10 y llévate 10 € al hacer tu primer pago
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-9882211

Técnicas de Investigación II Dehyra Sans Reina

○ Limitaciones:
■ Es sensible a la in uencia de observaciones extremas.
● Mediana. Valor central que divide a la población en dos subpoblaciones iguales. Es la posición central en una
distribución ordenada.
○ Ventaja:
■ No es tan sensible a la in uencia de valores extremos o atípicos.

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
○ Desventajas:
■ No utiliza todos los datos.
■ Es más insensible a los valores de una distribución

Mediana
Es un valor del conjunto de datos que mide el elemento central. La mitad de elementos se encuentran por arriba y la
otra mitad por debajo de él.

Moda
Es el valor que se repite más dentro de un conjunto de datos.

Media, mediana y moda


● La media, la mediana y la moda son idénticas en una distribución simétrica.
● La mediana puede ser la idónea en distribuciones sesgadas, ya que no se afecta tanto por valores extremos.
● Sin embargo, no se cuenta con un criterio único para aplicar alguna de las tres medidas.

Cuartiles
Los cuartiles dividen en cuatro partes las observaciones. El primer cuartil Q1 es un valor que deje por debajo de él 25%
de las y por encima 75% de las observaciones. El Q2 es la mediana (50%) y Q3 deja por debajo 75% y por encima 25% de
las observaciones.

Percentiles
Los percentiles dividen en dos partes las observaciones. Por ejemplo, el percentil 20, P20, es el valor que deja por debajo
un 20% y por encima un 80% de las observaciones.

Abre tu Cuenta NoCuenta con el código WUOLAH10 y llévate 10 € al hacer tu primer pago
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-9882211

Técnicas de Investigación II Dehyra Sans Reina

3.2. Estadísticos de dispersión .

Medidas de dispersión
● Proporcionan una medida de la dispersión en los valores de una variable, es decir, del grado en que los casos
son o no homogéneos.
● Rango. La diferencia entre el valor máximo y el valor mínimo de la distribución.
● Desviación típica. Mide la distancia de las observaciones respecto a la media. Se expresa en las unidades de la
variable. Se proporciona el valor de una desviación típica. Por ejemplo, una desviación típica de 5 (S = 5) en la
variable edad quiere decir que el 68% de los casos está entre más o menos 5 años respecto de la media (si la
distribución se ajusta a una distancia normal). Se calcula a partir de la varianza, es decir, de las desviaciones al
cuadrado de las observaciones con respecto a la media. Como mínimo, el % de observaciones comprendido en
el intervalo media +-kSx es de (1-1/k2) * 100. Propiedades:
○ Mide la dispersión con respecto a la media. Debe solo emplearse cuando se escoge la media como
medida de centralidad.
○ Es igual a cero cuando no hay dispersión. Esto ocurre si todas las observaciones tienen el mismo
valor. Cuanto más dispersas están las observaciones, mayor es la S.
○ Se ve muy in uida por las observaciones extremas. Unas pocas observaciones atípicas pueden hacer
que la desviación típica sea muy grande.
● Coe ciente de variación. Resultado de dividir la desviación típica por la media y multiplicarlo por 100. Un 0%
indica mucha homogeneidad. Puede proporcionar valores superiores a 100% (mucha heterogeneidad).
Cuando el valor de la media es cercano a 0, el CV proporciona valores muy elevados y pierde signi cado.
Permite comparar la dispersión de dos variables con escalas diferentes.

3.3. Estadísticos de distribución .

● Coe ciente de asimetría. Grado en que las observaciones se reparten proporcional y equitativamente a la
izquierda o a la derecha del punto central.
○ Decimos que la distribución de una variable es simétrica si se distribuye de forma uniforme
alrededor de la media. Media, moda y mediana coinciden. El índice de asimetría es 0.
■ La distribución simétrica perfecta es la ‘’distribución normal’’ (curva normal o bell curve).
Es una distribución teórica y muy pocas variables en el ámbito criminológico siguen una
distribución normal.
○ Decimos que hay asimetría positiva (o a la derecha) si la ‘’cola’’ a la derecha de la media es más larga
que la de la izquierda, es decir, si hay valores más separados de la media a la derecha.
○ Diremos que hay asimetría negativa (o a la izquierda) si la ‘’cola’’ a la izquierda de la media es más
larga que la de la derecha, es decir, si hay valores más separados de la media a la izquierda.
○ Una distribución puede también tener una distribución bimodal o no tener una distribución clara.

La curtosis es una medida de la forma de la distribución (del grupo de apuntamiento). Grado de concentración o
dispersión de los valores de una distribución en torno al cuerpo central de ésta.

10

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-9882211

Técnicas de Investigación II Dehyra Sans Reina

3.4. Gráficos .

Sirven para:
- Organizar los datos.
- Observar patrones.
- Observar agrupamientos.

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
- Observar relaciones.
- Comparar distribuciones.
- Visualizar rápidamente la distribución de los datos.
- Visualizar, obtener y comparar medidas estadísticas.

La calidad de un grá co estadístico consiste en comunicar ideas complejas con precisión, claridad y e ciencia, de tal
manera que:
- Induzca a pensar en el contenido más que en la apariencia.
- No distorsione la información proporcionada por los datos.
- Presente mucha información (números) en poco espacio.
- Favorezca la comparación de diferentes grupos de datos o de relaciones entre los mismos (por ejemplo, una
secuencia temporal).

Recomendaciones para un grá co


● Si es estético, fomenta la lectura y comprensión.
● Sencillez y claridad, el uso del color debe ser moderado y bien elegido.
● Usar líneas nas, eliminar las super uas.
● Usar grid si es necesario.
● Balance entre el espacio en blanco y datos.
● Idealmente no hay que acudir al texto.
● Balance entre texto, tablas e imágenes.
● Combinar texto y tablas insertas.

Procedimientos de visualización
● Histograma de frecuencias. Sirve para representar la distribución de las frecuencias de una variable
cuasi-cuantitativa o de razón. Nos muestra la frecuencia absoluta o relativa (en el eje de las x) de cada valor
posible de la variable (en el eje de las y). Los datos son agrupados en un número de intervalos.
● Diagrama de caja. Proporciona información sobre el valor mínimo, el máximo, los cuartiles y la amplitud
intercuartílica (el interior de la caja contiene el 50% de los datos centrales) y la mediana. Proporciona
información sobre medidas de posición, tendencia central, variabilidad, distribución.

Grá cos diferenciales para variables numéricas


Son diferentes en función de que las variables sean discretas o continuas. Valen con frecuencias absolutas o relativas.
● Diagrama de barras para v. discretas. Dejan un hueco entre barras para indicar los valores que no son posibles.
● Histogramas para v. continuas. El área que hay bajo el histograma entre dos puntos cualesquiera indica la
cantidad (porcentaje o frecuencia) de individuos en el intervalo.

11

Abre tu Cuenta NoCuenta con el código WUOLAH10 y llévate 10 € al hacer tu primer pago
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-9882211

Técnicas de Investigación II Dehyra Sans Reina

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Diagrama de pastel

4. Estimación por intervalos .

● Dado que los estadísticos descriptivos (la media o una proporción) proceden de muestras, están sujetos a un
margen de error (si analizamos toda la población no habrá error en el estadístico; tampoco si la muestra es
muy grande).
● Por ello, en ocasiones se opta por proporcionar el valor del estadístico (la media o una proporción) y un
Intervalo de Con anza (IC) o rango de valores asociado, que nos indica en torno a qué valores se espera que
varíe ese estadístico. Por ejemplo, p = 40 (38%-42%) o M = 3,5 (2,5-4,5).
● Por lo general se adopta un IC del 95%. Esto nos indica que en un 95% de las muestras, el valor del estadístico
estará entre el valor mínimo y el máximo del intervalo. El IC viene dado por el valor del estadístico más-menos
2 errores estándar (EE) (en 2 desviaciones típicas se encuentra el 95% de la población en una distribución
normal).
● El EE para la media es DE/vn y para una proporción es vp(1-p)/vn.
● El problema es que para que el IC tenga sentido, se asume que la distribución de la variable en la población
sigue una distribución normal. Si la muestra es elevada y la distribución no es muy asimétrica, este problema
puede ser menor. Cuando no hay una distribución normal, también se puede optar por estimar en varias
muestras dentro de la muestra.

12

Abre tu Cuenta NoCuenta con el código WUOLAH10 y llévate 10 € al hacer tu primer pago

También podría gustarte