INVESTIGACIÓN DE MERCADOS
3. FASES DE LA INVESTIGACIÓN COMERCIAL.
La realización de una investigación de mercados supone llevar a cabo una
serie de fases secuenciales, que pueden agruparse en las seis siguientes.
3.1 INVESTIGACIÓN PRELIMINAR.
Comprende al conjunto de actividades previas a la investigación de mercado y
llega hasta identificar el problema. Incluye las etapas siguientes:
3.1.1 ACTIVIDAD EXPLORATORIA.
En este sentido, la Investigación Exploratoria será la primera fase que cumpla
un investigador, sobre un objeto de estudio que resulte desconocido para él, o
incluso también para el resto de la comunidad profesional del campo en el que
se realice la investigación, careciendo entonces de antecedentes que puedan
orientar la investigación emprendida.
De esta manera, algunos profesionales describen la Investigación Exploratoria
como la primera aproximación que realiza un investigador sobre su objeto de
estudio, a fin de poder asirse con información general, sobre su aspecto,
comportamiento y características, por lo cual este tipo de investigación es
catalogada también como un estudio de tipo aproximativo, pues se basa en las
observaciones y cálculos aproximados que puede establecer el investigador en
su primer contacto con aquello sobre lo cual pretende establecer una
investigación.
3.1.2 IDENTIFICACIÓN DEL PROBLEMA U OPORTUNIDAD A INVESTIGAR
La identificación y argumentación de la oportunidad o del problema cuya
solución requiere de la elaboración de un proyecto, se realiza en el proceso de
conformación del plan estratégico y su fuente son los resultados a que se llegó
en el análisis estratégico.
La tarea de identificar de forma objetiva lo problemas a resolver a través de un
proyecto es generalmente mucho más compleja de lo que pudiera parecer ya
que encierra una fuerte carga de subjetividad de cada uno de los actores y
participantes en el proyecto, lo que conduce a cometer muchos errores.
3.1.3. PLANTEAMIENTO DEL PROBLEMA:
Plantear el problema no es sino ajinar y estructurar más Normalmente 10 idea
de investigando. EI paso de la idea al planteamiento del problema en ocasiones
puede ser inmediato, casi automático, 0 bien llevar una considerable cantidad
de tiempo; ella depende de cuan familiarizado este el investigador con el tema
a tratar, la complejidad misma de la idea, la existencia de estudios
antecedentes, el imperio del investigador y sus habilidades personales.
Seleccionar un tema 0 una idea no 10 coloca inmediatamente en la posición de
considerar que información habrá de recolectar, con curúes métodos y como
analizará los datos que obtenga. Antes necesita formular el problema
específico en términos concretos y explícitos, de
Manera que sea susceptible de investigarse con procedimientos científicos.
Delimitar es la esencia de los planteamientos cuantitativos.
Ahora bien, como señala Ackoff (1967), un problema correctamente planteado
esta parcialmente resuelto; a mayor exactitud corresponden más posibilidades
de obtener una solución satisfactoria. EI investigador debe ser capaz no solo
de conceptuar el
Problema, sino también de escribirlo en forma clara, precisa y accesible. En
algunas ocasiones sabe 10 que desea hacer, pero no como comunicarlo a los
demás y es necesario que realice un mayor esfuerzo por traducir su
pensamiento a términos comprensibles, pues en la actualidad la mayoría de las
investigaciones requieren la colaboración de muchas personas.
3.2. DISEÑO DE LA INVESTIGACIÓN COMERCIAL.
Comprenden un conjunto de actividades que parten de la formulación del
problema hasta llegar a la definición, clasificación y medida de las variables. En
concreto, incluye las etapas siguientes:
3.2.1 FORMULACIÓN DEL PROBLEMA.
El primer paso, siempre que se desea realizar una investigación, es la elección
del tema, definiéndolo con claridad y precisión.
La formulación del problema de investigación es la etapa donde
se estructura formalmente la idea de investigación, es este el primer paso,
donde se define qué hacer.
Para González (1997) el investigador debe plantearse las siguientes
interrogantes:
- ¿Es este un problema realmente importante?
- ¿Supondrá esta investigación algo importante?
- ¿Será interesante y tendrá alguna utilidad inmediata el resultado de la
investigación?
Una buena formulación del problema implica necesariamente la delimitación del
campo de investigación, establece claramente los límites dentro de los cuales
se desarrollará el proyecto. Cuando esto ocurre las probabilidades de <<no
perderse>> en la investigación tienden a maximizarse.
Lo anterior se aclara con lo siguiente: investigar sobre "la delincuencia" es de
tal envergadura que hace complejo el proceso, si nos referimos a la
"delincuencia juvenil" acotamos, pero sigue siendo vago. Debemos delimitar al
máximo nuestro problema para clarificar el qué y para qué.
Los criterios para un planteamiento adecuado son:
-El problema debe expresar una relación entre dos o más variables.
-El problema debe estar formulado claramente y como pregunta.
-El planteamiento implica la posibilidad de prueba empírica, es decir
debe poder observarse en la realidad.
3.2.2. FORMULACIÓN DE LOS OBJETIVOS
Los objetivos se refieren al para qué de la actividad que se está realizando o se
desea realizar. Tienen relación con la finalidad, con los logros finales del
trabajo o acción, los cuales orientan el devenir del mismo. Los objetivos tienen
como requisitos los siguientes:
- La formulación del objetivo debe comenzar con un verbo en infinitivo.
- Los objetivos deben ser alcanzables para el final de la actividad.
- Deben estar formulados con claridad, pues ellos constituyen el criterio de
evaluación de efectividad del trabajo realizado.
- Los objetivos se diferencian del "hacer" (de la actividad) porque contienen un
resultado o un logro.
En el caso de los objetivos de investigación:
- Su logro debe generar conocimiento nuevo.
- Su logro debe dar respuesta a la pregunta de investigación.
- No deben confundirse con actividades metodológicas como elaborar
instrumentos o elaborar la fundamentación teórica.
De acuerdo a su amplitud, los objetivos se clasifican en:
3.2.2.1. OBJETIVO GENERAL.
Precisa la finalidad del trabajo o proyecto, en cuanto a sus aspiraciones más
ampliasdentro de consideraciones de factibilidad. El objetivo general orienta y
permite mantener una constante de referencia en el trabajo a ejecutarse.
Representan el logro final de la investigación.
3.2.2.2.OBJETIVOS ESPECÍFICOS.
Están más delimitados y propician el cumplimiento del objetivo general.
Constituyen los logros previos para llegar al objetivo general. En investigación
implican estadios de conocimiento, tales que el resultado de los anteriores se
requiere para avanzar con los siguientes.
Los objetivos pueden ser de diferentes niveles, de acuerdo a su complejidad o
profundidad. Los objetivos tienen cuatro niveles: perceptual,
aprehensivo, comprensivo e integrativo, de menor a mayor profundidad
respectivamente. Por ejemplo, explorar y describir son objetivos de nivel
perceptual, analizar y comparar son de nivel aprehensivo, mientras que
explicar, predecir y proponer son objetivos de nivel comprensivo. Modificar,
verificar y evaluar son objetivos de nivel integrativo. Para plantearse un objetivo
de mayor profundidad se requiere antes haber logrado los objetivos
respectivos de menor profundidad, por ejemplo, para explicar es necesario
antes haber explorado, descrito, analizado y comparado.
3.2.3. DETERMINACIÓN DEL TIPO DE DISEÑO DE INVESTIGACIÓN.
3.2.3.1 DISEÑOS EXPLORATORIOS.
Se usan cuando la información que tiene el investigador para llevar a cabo su
tarea es escasa. Este tipo de diseño no permite plantear hipótesis de un modo
claro y explícito.
La investigación exploratoria es necesaria para que el investigador:
- Reúna info. sobre problemas prácticos
- Se familiarice con el problema,
- Clarifique conceptos,
- Identifique las variables más importantes, y en una etapa posterior
- Establezca prioridades para una investigación futura,
- Reconozca y aplique otros cursos de acción y
- Desarrolle las hipótesis.
Las técnicas más usadas en este tipo de diseño es la búsqueda
de bibliografía, focus group y a los análisis de casos seleccionados. El estudio
deja de ser exploratorio cuando se establecen hipótesis lo suficientemente
claras para su contrastación, es por eso que los diseños exploratorios no san
conclusiones.
3.2.3.2. DISEÑOS DESCRIPTIVOS
Usamos este tipo de diseño cuando el objetivo de investigación y también es
una de las ppales diferencias con el diseño exploratorio es que se apunta
justamente a obtener una descripción más completa y precisa de una
determinada situación.
Este tipo de estudio debe tener el problema bien delimitado y objetivos
claramente definidos para evitar la mera recopilación de datos.
Dentro de los diseños descriptivos podemos diferenciar entre:
- Diseños longitudinales o diacrónicos: aquí el investigador estudia
la evolución de una variable /s a lo largo del tiempo.
- Diseños transversales o sincrónicos: se apunta al estudio en un
momento del tiempo, que desde este punto de vista puede ser
considerado más acotado, pero que es más apropiado para algunos
casos.
3.2.3.3. DISEÑOS CORRELACIÓNALES
Estudian las relaciones entre variables dependientes e independientes, ósea se
estudia la correlación entre dos variables.
3.2.3.4. DISEÑOS CAUSALES.
La meta de este tipo de investigación, es bastante sencilla, descubrir la
relación, si es que la hay, entre las variables existentes. Para los mercadólogos
es muy importante tener en cuenta este tipo de investigación, ya que los
elementos causales pueden generar cambios muy importantes en una
investigación de mercados.
3.2.3.4. FORMULACIÓN DE LAS HIPÓTESIS
Ya hemos planteado el problema de investigación, revisado la literatura y
contextualizado dicho problema mediante la construcción del marco teórico (el
cual puede tener mayor o menor información, según cuanto se haya estudiado
el problema o tema específico de investigación). Asimismo, hemos visto que
nuestro estudio puede iniciarse como exploratorio, descriptivo, correlacional o
explicativo, y que como investigadores decidimos hasta dónde queremos y
podemos llegar (es decir, si finalmente el estudio terminará como descriptivo,
correlacional o explicativo). Ahora, el siguiente paso consiste en establecer
guías precisos hacia el problema de investigación o fenómeno que estamos
estudiando. Estas guías son las hipótesis. En una investigación podernos tener
una, dos o varias hipótesis; y como se explicará más adelante, a veces no se
tienen hipótesis.
Las hipótesis nos indican lo que estarnos buscando o tratando de probar y
pueden definirse corno explicaciones tentativas del fenómeno investigado
formuladas a manera de proposiciones. De hecho, en nuestra vida cotidiana
constantemente elaboramos hipótesis acerca de muchas “cosas” y luego
indagamos (investigamos) si son o no ciertas. Por ejemplo, establecemos una
pregunta de investigación: ¿Le gustaré a Ana? y una hipótesis: “Yo le resulto
atractivo a Ana”. Esta hipótesis es una explicación tentativa (porque no
estamos seguros que sea cierta) y está formulada como proposición (propone o
afirma algo). Después investigamos si la hipótesis es aceptada o rechazada
cortejando a Ana.
Las hipótesis no necesariamente son verdaderas;pueden o no serlo, pueden o
no comprobarse con hechos. Son explicaciones tentativas, no los hechos en sí.
El investigador al formularlas no puede asegurar que vayan a comprobarse.
Como mencionan y ejemplifican Black y Champion (1976), una hipótesis es
diferente de una afirmación de hecho. Alguien puede hipotetizar que, en un
país determinado, las familias que viven en zonas urbanas tienen menor
número de hijos que las familias que viven en zonas rurales; y esta hipótesis
puede ser o no comprobada. En cambio, si alguien afirma lo anterior
basándose en información de un censo poblacional recientemente efectuado
en ese país, no establece una hipótesis sino que afirma un hecho. Es decir, el
investigador al establecer sus hipótesis desconoce si serán o no verdaderas.
Dentro de la investigación científica, las hipótesis son proposiciones tentativas
acerca de las relaciones entre dos o mas variables y se apoyan en
conocimientos organizados y sistematizados.
3.2.3.5. DEFINICIÓN, CLASIFICACIÓN Y MEDIDA DE LAS VARIABLES DE
LA INVESTIGACIÓN
DEFINICIÓN DE LAS VARIABLES
Existen diversas definiciones referentes a las variables, sin embargo
resaltaremos de Hernández, Fernández y Baptista (2010). Señalan que una
variable es una propiedad que puede variar y cuya variación es susceptible de
medirse u observarse[1]. De manera que entendemos como cualesquiera
característica, propiedad o cualidad que presenta un fenómeno que varía, en
efecto puede ser medido o evaluado.
CLASIFICACIÓN DE LAS VARIABLES
Otra percepción importante es de Ander (1982) agrupa teniendo en cuenta a su
naturaleza y características en: cualitativas y cuantitativas; continuas y
descontinuas; dependientes e independientes; exploratorias o externas y
generales; intermedias y empíricas[2].
a) Según su naturaleza
Se clasifican en variables cuantitativas y cualitativas.
- Variables cuantitativas: son aquellas que cuyos valores al ser medidos
pueden expresarse numéricamente y en diversos grados.
- Variables cualitativos: Estas son llamadas con este nombre porque son
susceptible a la variación cualitativa, en efecto su medición no puede ser
expresada numéricamente. Ejemplos: Género: masculino y femenino;
calidad de producto: Excelente, bueno malo; actividades preferidas:
lectura, tv, cine, futbol etcétera.
- Consecuentemente las variables cuantitativas se subdividen en dos:
- Variables continuas
Estos tienen la particularidad de asumir cualquier valor numérico y que pueden
cambiar en cualquier cantidad. Ejemplo: el tiempo, la distancia, el peso, etc. Se
nos ocurre que “x las tallas de las niñas”. Supongamos que la niña A mide 1.60
m y la niña B mide 1.54 m. ¿Cuántos valores posibles de x hay entre 1.54 y
1.60? Aquí puede verse intuitivamente que cuando se toma dos valores
posibles cualquiera por más cercanos que estos sean, supongamos 1.56 y
1.57, se aprecia que entre ambos siempre hay valores posibles de diferencia.
Puede ser 1.561; 1.562; 1.563; etcétera. Entonces la cuestión es que no
hallamos ruptura, sino una continuidad.
- Variables discontinuas
Desde luego otros investigadores denominan discretas, que según Pick y
López (2002) sus valores se interrumpen o separan [3]. Por ejemplo. Sea x el
número de buses del Metropolitano. Aquí no se admite hablar de ½ o ¼ de bus.
La variable discontinua representa valores enteros.
b. Según a su dominio
Variables Independientes: tiene el dominio causal, es la variable que se presume
que es la que causa o afecta a la otra en los resultados. Que según Pino (2010)
variable independiente es aquella que el experimentador modifica a voluntad para
averiguar si sus modificaciones provocan o no cambios en las otras variables.
Recuerde que la variable dependiente es la que toma valores diferentes en función
de las modificaciones que sufre la variable independiente[4]. En consecuencia, la
variable independiente ejerce influencia o causan efecto en otras variables
llamadas dependientes, y son las que permiten explicar a éstas. Además son
aquellas que dentro de la relación causal que propone una hipótesis, se
determinan como causas. Estas variables en un experimento, son manipuladas por
el experimentador: la finalidad de este control directo es ver si genera cambios en
la otra variable relacionada.
Variables Dependientes: actúa como efecto de una causa que ejerce coerción.
Cabe precisar que éstas designan las variables a explicar, los efectos o resultados
respecto a los cuales hay que buscar un motivo o razón de ser. De manera
podemos denominar variable efecto o condicionada, es aquella que es afectada
por la presencia o acción de la variable independiente en los resultados. Son las
que el estudioso observa o mide, el propósito de esta observación es determinar si
la variable independiente ha generado o no los cambios anunciados en las
hipótesis.
Variable interviniente: Es aquella que participa con la variable independiente
condicionando a la dependiente. Se interpone entre la independiente y
dependiente; esta variable no es objeto de estudio y de exploración, pero que
al presentarse puede efectuar, de ahí que se llama también variable
interviniente o interferente.
c. Según su amplitu
Variables Individuales: las unidades de observación son los individuos
Variables Colectivos: las unidades de observación son colectivos, conjunto o
grupos (Estados, universidades, empresas entre otros).
d. Según su nivel de abstracción
Variables generales
Son las que componen el problema y la hipótesis de investigación y presentan
características complejas, dicho de otra forma, tienen aspectos, dimensiones,
áreas, antes de los indicadores. Por esta razón no son medibles directamente,
sino luego de descomponerlas en sus respectivo niveles.
Variables intermedias
Como hemos visto hasta ahora estas variables se refieren a aquellos que se
aproximan más a la realidad fáctica y presentan aspectos parciales de las
variables generales.
Variables empíricas
Es importante destacar que estos tipos de variables tienen la particularidad de
ser medibles directamente, es decir son observables mediante los instrumentos
técnicos diseñados por el investigador.
e. Según carácter de las escalas
Variables Nominales: comprenden la distención de diversas categorías ningún
orden ni jerarquía entre ellas.
Variables Ordinales: estos tipos de variables implican orden entre sus
categorías. Ejemplo: calidad de desempeño (Excelente, bueno malo, regular,
malo, pésimo).
Variables Cardinales: entre las cuales, a su vez, pueden distinguir entre:
a. Variable de Intervalo: supone a la vez orden y grado de distancia iguales entre
las diversas categorías cuantitativas. Ejemplos: temperatura, intensidad de
sismo. El inicio (cero) es arbitrario.
b. Variables de Razón: comprende a la vez todos estos aspectos: distención,
orden, distancia y origen único natural. Ejemplo: edad, peso de la persona
etcétera.
3.3. OBTENCIÓN DE LA INFORMACIÓN.
Supone en primer lugar, la delimitación de las fuentes de información, lo que
determinare los procedimientos para capturar los datos.
Abarca las siguientes etapas:
3.3.1. FUENTES DE INFORMACIÓN COMERCIAL.
La obtención de información comienza por la selección de las fuentes
utilizables, es decir, los lugares de los que pueden obtenerse datos útiles para
llevar a cabo un estudio de mercado. Podemos hablar de dos tipos de fuentes,
las fuentes internas, es decir, propias de la empresa o fuentes externas a la
empresa. A su vez, dentro de cada una podemos encontrar:
3.3.1.1. FUENTES SECUNDARIOS.
Obtenidas de estadísticas y documentos ya publicados, proporcionan
información de tipo general ya elaborada. Es recomendable empezar la
investigación acudiendo a ellas. Son fuentes secundarias externas las
publicaciones de organismos oficiales, bancos, INE...
3.3.1.2. FUENTES PRIMARIAS.
Obtenidas mediante investigación directa bien de la propia empresa o por
encargo a empresas dedicadas a la elaboración de este tipo de información.
3.3.2. DETERMINACIÓN DE LAS FORMAS DE OBTENER LA
INFORMACIÓN PRIMARIA.
Se obtiene mediante métodos diversos a partir de una muestra representativa
de la población para proyectar los resultados y conclusiones a toda la
población. Los métodos más utilizados son:
3.3.2.1 LA OBSERVACIÓN.
La observación es la técnica de investigación básica, sobre las que se
sustentan todas las demás, ya que establece la relación básica entre el sujeto
que observa y el objeto que es observado que es el inicio de toda comprensión
de la realidad.
Según Bunge (727) la observación en cuanto es un procedimiento científico se
caracteriza por ser:
Intencionada: porque coloca las metas y los objetivos que los seres humanos
se proponen en relación con los hechos, para someterlos a una perspectiva
teleológica. Ilustrada: porque cualquier observación para ser tal está dentro de
un cuerpo de conocimientos que le permite ser tal; solo se observa desde una
perspectiva teórica. Selectiva: porque necesitamos a cada paso discriminar
aquello que nos interesa conocer y separarlo del cúmulo de sensaciones que
nos invade a cada momento. Interpretativa: en la medida en que tratamos de
describir y de explicar aquello que estamos observando. Al final de una
observación científica nos dotamos de algún tipo de explicación acerca de lo
que hemos captado, al colocarlo en relación con otros datos y con otros
conocimientos previos. En el proceso de observación, siempre según Bunge
(729) se distinguen cinco elementos:
Sujeto u observador, en el que se incluyen los elementos constituyentes de
este, tanto los sociológicos como los culturales, además de las experiencias
específicas del investigador.
Objeto de la observación: que es la realidad, pero en donde se han introducido
procedimientos de selección y de discriminación, para separarlo de otras
sensaciones. Los hechos en bruto de la realidad se han transformado en datos
de un proceso de conocimiento concreto.
Circunstancias de la observación: son las condiciones concretas que rodean al
hecho de observar y que terminan por formar parte de la propia observación.
Los medios de la observación: son los sentidos y los instrumentos
desarrollados por los seres humanos para extender los sentidos o inventar
nuevas formas y campos para la observación.
Cuerpo de conocimientos: es el conjunto de saberes debidamente
estructurados en campos científicos que permiten que haya una observación y
que los resultados de esta se integren a un cuerpo más amplio de
conocimientos.
Con estos aspectos, podemos entrar a los aspectos propiamente técnicos de la
observación.
Tipos de observación:
Observación estructurada: se la realiza a través del establecimiento de un
sistema que guíe la observación, paso a paso, y relacionándola con el conjunto
de la investigación que se lleva a cabo.
Observación abierta: carece de un sistema organizado y se la realiza
libremente; es utilizada cuando se quiere captar el movimiento espontáneo de
un determinado grupo humano, por ejemplo, en los estudios antropológicos.
Observación semiestructurada: este tipo de observación parte de una pauta
estructurada, pero la aplica de modo flexible de acuerdo a la forma que adopta
el proceso de observación.
Observación participante: en las anteriores formas de observación, ha quedado
implícito que el observador se comporta de la manera más neutral posible
respecto de los acontecimientos que está observando. En el caso de la
observación participante, el sujeto que observa es aceptado como miembro del
grupo humano que se observa, aunque sea provisionalmente.
La observación participante tiene el mérito no solo de intentar explicarse los
fenómenos sociales sino de tratar de comprenderlos desde dentro, lo que
implica sacar a la luz los procesos racionales que estén ocultos detrás de
conductas que aparentemente pueden carecer de significado para un
observador externo.
Desde luego que esta técnica tiene el peligro de producción información
sesgada, en el caso de que el investigador privilegiara su papel como miembro
de la comunidad antes que como observador integrado a una determinada
investigación, que trata parcialmente de tomar distancia de su objeto.
Ventajas de la observación:
Hernández et al. (315) señalan las siguientes ventajas de la observación:
Técnica natural: en cuanto no interviene sobre el objeto de investigación, este
puede ser percibido en su ambiente natural y en sus formas de comportamiento
independiente de cualquier participación externa.
Útiles para trabajar con materiales poco estructurados, porque la información
fluye de la proximidad directa con el objeto de investigación.
Se puede trabajar con grandes grupos y con información abundante.
Aspectos técnicos:
Un buen proceso de observación requiere que se tome en cuenta:
Definir el punto de vista o el marco conceptual desde el que se realizará la
observación.
Elaborar una guía de observación lo más detenida y detallada posible.
Registrar lo observado lo más pronto lo más fielmente que sea posible.
Interpretar lo observado a la luz de otras observaciones y de
Conocimiento previamente dado.
3.3.2.2 LA ENTREVISTA.
La entrevista es una técnica cuyo objetivo es obtener información de forma oral
y personalizada, sobre acontecimientos vividos y aspectos subjetivos de la
persona como las creencias, las actitudes, las opiniones, los valores, en
relación con la situación que se esté estudiando.
La entrevista es una técnica de recogida de información con identidad propia y
a la vez complementaria de otras técnicas propias de la investigación
cualitativa como la observación participante y los grupos de discusión.
TIPOS DE ENTREVISTA
Existen distintos tipos de entrevistas. Según el aspecto que queramos
destacar, podemos distinguir entre entrevistas según su estructura y diseño y
entrevistas según el momento de realización.
Las entrevistas en cuanto a su estructura y diseño se clasifican en:
Entrevistas estructuradas
El investigador lleva a cabo una planificación previa de las preguntas que
quiere formular, coordinadas por un guión preestablecido de forma
secuenciada y dirigida. Las preguntas serán de tipo cerrado y el entrevistado
sólo podrá afirmar, negar o responder una respuesta concreta y exacta sobre lo
que se le pregunta.
Entrevistas semiestructuradas
Parten de un guión elaborado que determine aquella información relevante que
se quiere obtener.
Las preguntas que se realizan son abiertas. Se permite al entrevistado la
realización de matices en sus respuestas, lo que hace que éstas adquieran un
valor añadido en torno a la información que den. Durante el transcurso de la
entrevista se relacionan temas y se construye un conocimiento generalista y
comprensivo de la realidad del entrevistado. Esto hace que el investigador
deba mantener un alto grado de atención en las respuestas del entrevistado
para poder interrelacionar los temas y establecer las conexiones.
Entrevistas no estructuradas o abiertas
Este tipo de entrevistas no requiere la realización de ningún tipo de guión
previo, por lo que el investigador se guía por los temas o ámbitos informativos
de los que quiere obtener información. Esta información es el resultado de la
construcción simultánea a partir de las respuestas del entrevistado.
Para esta modalidad de entrevista, es necesaria una gran documentación y
preparación por parte del entrevistador para poder avanzar y concretar cada
vez más en las preguntas al entrevistado. Además debe preparar estrategias
que le permitan reconducir a entrevista si el entrevistado se desvía del tema
que se está tratando.
Las entrevistas en cuanto al momento de realización se clasifican en:
Entrevistas iniciales, exploratorias o de diagnóstico
Tienen por objetivo la identificación de aspectos relevantes y característicos de
una situación para poder tener una primera impresión y visualización de la
misma.
Tienen gran valor en los primeros momentos, cuando se accede al escenario a
estudiar. Más aún si, además, el investigador no está familiarizado con el
mismo.
Da la oportunidad de elaborar un marco de actuaciones futuras. Se pueden
desarrollar de forma muy estructurada o con un formato no estructurado, según
las intenciones del investigador.
Entrevistas de desarrollo o de seguimiento
Los objetivos de este tipo de entrevistas son dos: describir la evolución o el
proceso de una situación, o de un aspecto determinado dentro del contexto de
estudio y profundizar y conocer más exhaustivamente la forma de vida,
relaciones, acontecimientos y percepciones.
Entrevista final
Se lleva a cabo cuando el objetivo es contrastar información, concluir aspectos
de la investigación, o informar sobre determinados asuntos con el fin de
continuar el proceso de investigación. La estructura en que se realice variará
en función de los objetivos generales de la investigación.
3.3.2.3. EL CUESTIONARIO.
El cuestionario es un conjunto de preguntas diseñadas para generar los datos
necesarios para alcanzar los objetivos propuestos del proyecto de
investigación. El cuestionario permite estandarizar e integrar el proceso de
recopilación de datos. Un diseño mal construido e inadecuado conlleva a
recoger información incompleta, datos no precisos de esta manera genera
información nada confiable. Por esta razón el cuestionario es en definitiva un
conjunto de preguntas respecto a una o más variables que se van a medir.
El cuestionario puede aplicarse a grupos o individuos estando presente el
investigador o el responsable de recoger la información o puede enviarse por
correo a los destinatarios seleccionados en la muestra.
Debido a su administración se pueden presentar problemas relacionados con la
cantidad y la calidad de los datos que se pretenda obtener para el estudio.
Algún problema asociado con el envío de los cuestionarios podría ser que no
fuesen devueltos, los consultados pueden evadir la respuesta y algunas
preguntas. O no darle la importancia necesaria a las preguntas proporcionadas.
Por ello y otros factores más el instrumento que se use para la recolección de
datos debe ser objeto de una cuidadosa elaboración.
Algunas ventajas del cuestionario son: su costo relativamente bajo, su
capacidad para proporcionar información sobre un mayor número de personas
en un período bastante breve y la facilidad de obtener, cuantificar, analizar e
interpretar los datos.
Si el investigador decide utilizar la observación regulada, la entrevista o el
cuestionario y otra fuente de información secundaria como método de
recolección de datos, debe elaborar un instrumento para obtener la información
que requiere, siendo el formulario el que se emplea más frecuentemente.
Para diseñar correctamente un formulario es necesario tomar en consideración
algunos criterios relacionados con su organización, las preguntas a plantear
según los objetivos propuestos en la investigación y las características físicas
de los formularios.
Para elaborar las preguntas del cuestionario es importante tener encueta lo
siguiente:
Las preguntas deben ser claras y sencillas en el sentido que tiene que ser
comprendidas por las personas del estudio.
Deben evitarse frases y palabras ambiguas, las preguntas deben formularse
del tal modo que no obliguen a las personas a colocarse a la defensiva.
La redacción de las preguntas no debe dirigir el sentido de la respuesta.
Hay que elaborar las preguntas adaptando el lenguaje de los encuestados.
Evaluar la pertinencia de la pregunta.
Tener en cuenta si el encuestado puede y quiere aportar la información que se
le pide.
Iniciar con preguntas sencillas.
Formular primero preguntas de tipo general.
Clasificar las preguntas por temas a fines de modo que el encuestado se
concentre en un solo tema.
Hacer una pre-prueba antes de implementar el cuestionario para determinar las
pregunta ambiguas y que no le aporten al objetivo buscado.
Elaborar el cuestionario definitivo teniendo en cuenta las observaciones de la
pre-prueba.
Los tipos de preguntas a utilizar en el cuestionario pueden ser de tipo abierto
que son las que le piden a la encuestado contestar con sus propias palabras o
de tipo cerrado que son las que le permiten a la persona que elija la respuesta
de una lista de opciones y pueden tomar la forma de alternativas dicotómicas,
tricotómicas o elección múltiple.
3.3.2.4. LA ENCUESTA
Una encuesta es una técnica o método de recolección de información en
donprocede se interroga de manera verbal o escrita a un grupo de personas
con el fin de obtener determinada información necesaria para una
investigación.
Cuando la interrogación que comprende la encuesta es verbal, esta suele
apoyarse en una entrevista en donde la persona encargada de realizar la
encuesta (encuestador) le formula a la persona a encuestar (encuestado) las
preguntas que permitan obtener la información requerida, ya sea siguiendo un
cuestionario formal con preguntas que se les formulan a todos por igual
(encuesta estructurada), o modificando las preguntas en base a las respuestas
que vaya dando el encuestado (encuesta no estructurada).
Mientras que cuando la interrogación que comprende la encuesta es escrita,
esta suele basarse en un cuestionario previamente diseñado con las preguntas
que permitan obtener la información requerida, el cual el encuestador le
entrega al encuestado para que lo llene.
La encuesta es la técnica de recolección de información más utilizada al
momento de hacer una investigación debido a las diferentes ventajas que
presenta ante otras técnicas como la entrevista, la observación, la prueba de
mercado y el focus group.
A continuación las principales ventajas de la técnica de la encuesta:
permite reunir en poco tiempo una gran cantidad de información debido
a la gran cantidad de personas que puede abarcar y la variedad de
preguntas que puede incluir el cuestionario.
permite obtener datos confiables y precisos debido a que las respuestas
se pueden limitar solamente a las alternativas planteadas.
permite obtener casi cualquier tipo de información, incluyendo
información sobre hechos pasados.
una vez confeccionado el cuestionario, no requiere de personal
calificado para su aplicación.
la recolección, contabilización, procesamiento y análisis de la
información es relativamente fácil de realizar.
La encuesta presenta diferentes ventajas ante otras técnicas de recolección de
información; sin embargo, como toda técnica también presenta algunas
desventajas, entre las que podemos destacar:
en algunos casos puede llegar a ser costosa; por ejemplo, cuando es
necesario capacitar a los encuestadores, trasladarlos y pagarles un
sueldo o una bonificación.
existe la posibilidad de que los encuestados den respuestas falsas, no
recuerden algo o no sean capaces de dar respuestas precisas; por
ejemplo, cuando desconocen sus verdaderos motivos para elegir una
marca o un producto.
existe la posibilidad de que los encuestadores recurran a atajos.
no permite analizar con profundidad temas complejos.
redactar las preguntas del cuestionario de manera apropiada no es una
tarea sencilla.
El proceso para realizar una encuesta empieza por la planificación de esta, lo
cual incluye el establecimiento de los objetivos que se buscarán alcanzar con la
encuesta, la determinación de la población o universo a estudiar, la
identificación de la información que se requerirá de esta, el diseño del
cuestionario y el cálculo de la muestra.
La población o universo de una encuesta es el conjunto total de personas con
características similares de las cuales se desea obtener información necesaria
para una investigación; por ejemplo, en el caso de una encuesta realizada por
una empresa, la población suele estar conformada por los consumidores que
conforman su mercado objetivo, mientras que la información que se requiere de
estos suele estar conformada por sus gustos, preferencias, deseos, hábitos de
consumo, etc.
Una población suele estar conformada por un gran número de personas, por lo
que para no tener que encuestar a todas estas, y así ahorrar tiempo y dinero,
se suele encuestar solamente a un número de personas representativo de la
población, el cual suele obtenerse a través de una fórmula estadística y
conocerse como muestra.
Una vez planificada la encuesta se procede a hacerla efectiva, lo cual incluye la
selección, contratación y capacitación de los encuestadores, la recolección de
la información requerida, la contabilización, procesamiento y análisis de esta, y
la elaboración del informe correspondiente de ser el caso.
A continuación un resumen con los pasos necesarios para realizar una
encuesta:
Establecimiento de los objetivos de la encuesta: en primer lugar se
establecen claramente los objetivos que se buscarán alcanzar con la
encuesta que se va a realizar.
Determinación de la población o universo: se determina la población o
universo a estudiar (el conjunto total de personas de las cuales se desea
obtener información).
Identificación de la información a recolectar: se identifica la información
que se va a recolectar (aquella información procedente de la población
que, una vez analizada, permitirá alcanzar los objetivos).
Diseño del cuestionario: se diseña el cuestionario de la encuesta (el
listado con las preguntas que permitirán obtener la información
requerida).
Cálculo de la muestra: se calcula la muestra (el número de personas
representativo de la población) a la que se va a encuestar.
Selección, contratación y capacitación de los encuestadores: se
selecciona, contrata y capacita a los encuestadores para que recolecten
de manera adecuada la información.
Recolección de la información: se recolecta la información requerida (los
encuestadores les formulan las preguntas del cuestionario a los
encuestados y anotan las respuestas).
Contabilización, procesamiento y análisis de la información: se
contabiliza, procesa y analiza la información recolectada.
Elaboración del informe: se elabora el informe con los resultados
obtenidos, así como las conclusiones y recomendaciones para resolver
el problema que motivó la encuesta.
En el ámbito de los negocios el tipo de encuesta más conocido al momento de
hacer una investigación es la encuesta personal, que es aquella en donde el
encuestador interroga de manera directa o personal al encuestado; sin
embargo, también existen otros tipos de encuesta en base al medio utilizado
para recolectar la información que una empresa suele utilizar, tales como la
encuesta telefónica, la encuesta postal y la encuesta por Internet.
A continuación un resumen de cada uno de estos tipos de encuesta:
Encuesta personal
En la encuesta personal el encuestador aborda de manera directa o personal al
potencial encuestado, ya sea en la calle (por ejemplo, en un centro comercial o
en los alrededores de un negocio) o en su domicilio u oficina, le pide hacerle
una encuesta y, en caso de que este acepte, le formula las preguntas de un
cuestionario previamente diseñado a la vez que va registrando sus respuestas.
Las ventajas de la encuesta personal ante otros tipos de encuesta son:
los cuestionarios presentan un menor número de errores u omisiones
debido a que el encuestador guía y asesora al encuestado en el llenado
de los mismos.
el encuestador puede controlar el grado de sinceridad de las respuestas
del encuestado.
permite obtener más información ya que el cuestionario puede tener
varias preguntas, incluyendo preguntas abiertas.
permite mostrar material auxiliar; por ejemplo, el producto sobre el cual
se desea conocer la opinión de los encuestados.
Mientras que sus desventajas ante otros tipos de encuesta son:
es lenta debido al tiempo que toma capacitar a los encuestadores,
trasladarse a donde están los encuestados (sobre todo cuando estos se
encuentran dispersos geográficamente), llenar los cuestionarios, y
contabilizar y procesar los datos.
es la más costosa debido a los gastos incurridos en capacitación,
traslados y sueldos o bonificaciones de los encuestadores.
la presencia del encuestador podría coartar o cohibir al encuestado
reduciendo su nivel de sinceridad en las respuestas; por ejemplo, en
temas personales.
la apariencia, actitud y forma de hacer las preguntas del encuestador
podrían influir en las respuestas del encuestado.
Encuesta telefónica
En la encuesta telefónica el encuestador se comunica por teléfono con el
potencial encuestado, le pide hacerle una encuesta y, en caso de que este
acepte, le formula las preguntas de un cuestionario previamente diseñado a la
vez que va registrando sus respuestas.
Las principales ventajas de la encuesta telefónica son:
puede abarcar un gran número de personas en menos tiempo que la
encuesta personal.
es más rápida que la encuesta personal ya que el contacto con el
encuestado, la recolección de la información (siempre y cuando el
cuestionario no sea muy extenso), la contabilización y el procesamiento
de esta pueden darse de manera inmediata.
es menos costosa que la encuesta personal ya que requiere de menos
encuestadores, los cuales a su vez requieren de menos capacitación y
supervisión, y no necesitan ser trasladados.
el proceso de selección, capacitación y control de los encuestadores es
más fácil de realizar.
Mientras que sus principales desventajas son:
el encuestador tiene un menor control sobre la encuesta que en la
encuesta personal.
el cuestionario debe ser corto, sencillo y sin preguntas abiertas para que
la encuesta sea breve y así el encuestado esté más dispuesto a
participar.
no permite mostrar material auxiliar.
Encuesta postal
La encuesta postal es un tipo de encuesta cada vez menos utilizado debido a
su bajo índice de respuesta. En esta el encuestador le envía un cuestionario
vía correo postal al potencial encuestado junto con una carta en donde le pide
que lo llene, y luego lo devuelva por el mismo medio sin que ello le signifique
algún costo.
Las principales ventajas de la encuesta postal son:
puede llegar a tener una amplia cobertura.
es menos costosa que la encuesta personal y la encuesta telefónica, ya
que requiere de menos encuestadores.
los encuestados suelen responder los cuestionarios con mayor
sinceridad y objetividad que en la encuesta personal y la encuesta
telefónica, al no sentirse presionados por la presencia del encuestador o
por el tiempo para llenarlos.
Mientras que sus principales desventajas son:
presenta un bajo índice de respuesta debido a que hoy en día son pocas
las personas dispuestas a llenar un cuestionario, introducirlo a un sobre
y depositarlo en un buzón de correo sin una compensación.
es la más lenta debido al tiempo que toma el cuestionario en llegar al
encuestado, ser llenado por este, y regresar al encuestador.
presenta un mayor porcentaje de cuestionarios erróneos o incompletos
debido a la ausencia de encuestador.
las respuestas del encuestado podrían ser influenciadas por otras
personas.
Encuesta por Internet
La encuesta por Internet es un tipo de encuesta cada vez más utilizado debido
principalmente a su rapidez y bajo costo. En esta el encuestador publica un
cuestionario en una página web o se lo envía a través de correo electrónico al
potencial encuestado a la vez que le pide que lo llene.
Las principales ventajas de la encuesta por Internet son:
es la que más cobertura puede llegar a tener, pudiendo llegar al mismo
tiempo a una gran cantidad de personas ubicadas en cualquier lugar del
mundo.
es la más rápida ya que el contacto con el encuestado, así como la
recolección, la contabilización y el procesamiento de la información
pueden darse de manera inmediata.
es la menos costosa debido entre otras cosas a que es la que menos
encuestadores requiere.
permite la utilización de imágenes y gráficos en los cuestionarios,
haciendo estos más atractivos y fáciles de llenar.
Mientras que sus principales desventajas son:
en ocasiones no es posible verificar la identidad del encuestado.
en ocasiones no es posible determinar si los encuestados realmente
corresponden a una muestra representativa de la población.
en ocasiones los encuestados dan respuestas falsas o responden más
de una vez el mismo cuestionario debido al mínimo control que tiene el
encuestador.
es necesario contar con conocimientos en diseño web al momento de
diseñar el cuestionario.
3.3.3. DISEÑO, TAMAÑO Y SELECCIÓN DE LA MUESTRA.
3.3.3.1. DETERMINACIÓN LA POBLACIÓN OBJETO DE ESTUDIO
La población o universo se refiere al conjunto para el cual serán válidas las
conclusiones que se obtengan. En una investigación puede considerarse varias
poblaciones o sub- poblaciones. Se debe incluir una breve descripción de las
características más sobresalientes de la población., en términos de su
importancia para el estudio.
De la población es inconveniente, por razones prácticas, extraer muestras las
cuales pueden ser o no estadísticamente representativas. En el diseño se debe
definir y justificar el tipo de muestra, el método de selección que se va a
emplear y el tamaño de la muestra.
En esta parte de la investigación, el interés consiste en definir quienes y qué
características deberán tener los sujetos.
El proceso de definición de esa población en estudio, en la mayoría de los
casos, y dependiendo de algunos criterios, es necesario escoger una parte de
ese universo para llevar a cabo el estudio.
3.3.3.1. IDENTIFICAR EL MARCO MUESTRAL (LISTAS, DIRECTORES, UNA
MAPA, ETC.)
Una vez definido el universo, se debe recabar información, lo más exacta
posible, de sus dimensiones y distribución espacial y temporal, para con ello
poder construir el marco muestral, que es la base para hacer el diseño de
muestreo. El marco muestral es la información que ubica y dimensiona al
universo y puede consistir de censos de vivienda y mapas agrupados por
localidades, barrios, repartos, etc.; mapas de cobertura forestal con
agrupamientos por tipos de vegetación o usos del suelo; listados de viviendas
en localidades pequeñas, etc. La construcción del marco muestral se detalla en
los apartados referentes a las variables generales de la demanda, oferta y
abastecimiento
3.3.3.3. ESPECIFICAR LA UNIDAD MUESTRAL.
Un concepto básico en la teoría del muestreo, que debe definirse claramente
para construir el marco muestral, es la unidad de muestreo, que es la unidad
mínima de observación de la que se obtendrá información de las variables
útiles. Por convención estadística, se usará "N" para referirnos al número de
unidades de muestreo que integran el Universo y "n" para el número de
unidades de muestreo en la muestra. Para cada sector la unidad de muestreo
más conveniente se indica en la Tabla 3.1. Otras unidades de muestreo
pueden ser definidas de acuerdo a los objetivos de los estudios.
Tabla 3.1 Unidad de muestreo según el grupo temático y sector o ramo de
estudio.
Grupo Sector o ramo Unidad de muestreo
Residencial Vivienda
- urbana
Demanda - rural
Industrial
Comercial Establecimiento
Institucional
Directa Parcela
Oferta
Indirecta Establecimiento
Productores
Abastecimiento Transportistas Productores individuales, empresas
Comercializadores
Después de haber definido el universo y la unidad muestral, y de contar con
un marco muestral, el diseño del muestreo consiste de dos grandes etapas:
definición del tipo de muestreo y determinación del tamaño de muestra.
3.3.3.4. SELECCIÓN DE MÉTODO DE MUESTREO
Es el proceso por el cual se seleccionan los individuos que formarán una
muestra.
Para que se puedan obtener conclusiones fiables para la población a partir de
la muestra, es importante tanto su tamaño como el modo en que han sido
seleccionados los individuos que la componen.
El tamaño de la muestra depende de la precisión que se quiera conseguir en la
estimación que se realice a partir de ella. Para su determinación se requieren
técnicas estadísticas superiores, pero resulta sorprendente cómo, con
muestras notablemente pequeñas, se pueden conseguir resultados
suficientemente precisos. Por ejemplo, con muestras de unos pocos miles de
personas se pueden estimar con muchísima precisión los resultados de unas
votaciones en las que participarán decenas de millones de votantes.
Para seleccionar los individuos de la muestra es fundamental proceder
aleatoriamente, es decir, decidir al azar qué individuos de entre toda la
población forman parte de la muestra.
Si se procede como si de un sorteo se tratara, eligiendo directamente de la
población sin ningún otro condicionante, el muestreo se llama aleatorio simple
o irrestrictamente aleatorio.
Cuando la población se puede subdividir en clases (estratos) con
características especiales, se puede muestrear de modo que el número de
individuos de cada estrato en la muestra mantenga la proporción que existía en
la población. Una vez fijado el número que corresponde a cada estrato, los
individuos se designan aleatoriamente. Este tipo de muestreo se denomina
aleatorio estratificado con asignación proporcional.
Las inferencias realizadas mediante muestras seleccionadas aleatoriamente
están sujetas a errores, llamados errores de muestreo, que están controlados.
1) MUESTREO PROBALISTICO
El muestreo probabilístico es una técnica de muestreo en virtud de la cual las
muestras son recogidas en un proceso que brinda a todos los individuos de la
población las mismas oportunidades de ser seleccionados.
En esta técnica de muestreo, el investigador debe garantizar que cada
individuo tenga las mismas oportunidades de ser seleccionado y esto se puede
lograr si el investigador utiliza la aleatorización.
La ventaja de utilizar una muestra aleatoria es la ausencia de sesgos de
muestreo y sistemáticos. Si la selección aleatoria se hace correctamente, la
muestra será representativa de toda la población.
El efecto de esto es un sesgo sistemático ausente o mínimo que es la
diferencia entre los resultados de la muestra y los resultados de la población. El
sesgo de muestreo también se elimina ya que los sujetos son elegidos al azar.
MUESTREO ALEATORIO SIMPLE:
Es el prototipo de muestro probabilístico, y en referencia al cual se llevan a
cabo las fórmulas básicas del error muestral y el tamaño muestral.
A cada unidad del marco muestral se le asigna un número y se les elige de
forma aleatoria hasta completar la muestra.
Se necesita un listado de números aleatorios.
MUESTREO SISTEMÁTICO:
Es una derivación del Muestreo Aleatorio Simple.
Se calcula el coeficiente de elevación (k), que se calcula dividiendo el tamaño
del universo (N) por el tamaño de la muestra (n): k=N/n
En el universo (N) se elige el primer elemento al azar, con la condición de que
el número escogido sea inferior al coeficiente de elevación.
Luego los demás se escogen cada cierto intervalo (k), hasta completar el
tamaño muestral (n).
MUESTREO ESTRATIFICADO:
Busca asegurar la representación de la heterogeneidad de la población dentro
de una muestra, agrupando a las unidades por estratos homogéneos
internamente y heterogéneos entre sí.
Para la definición de cada estrato se requiere elegir por parte del investigador
el tipo de afijación, esto es, cómo se distribuyen lso sujetos encada estrato. Los
principales tipos de afijación son los siguientes:
Simple: se asigna el mismo tamaño de la muestra a cada estrato.
Proporcional: el tamaño de la muestra asignado está en función del peso
relativo de cada estrato en el conjunto de la población.
Óptima: Al peso relativo de cada estrato se añade la varianza del estrato
respecto a la variable considerada en la estratificación.
Procedimiento en el muestreo aleatorio estratificado:
1. Se establecen las variables para formar los estratos
2. Se divide a la población en estratos exclusivos.
3. Selección de la muestra a través del más.
MUESTREO POR CONGLOMERADOS:
La unidad muestral ya no son los individuos, sino un conjunto de individuos que
bajo determinados aspectos, se considera que forman una unidad.
Busca, al contrario que el estratificado, heterogeneidad dentro de los estratos y
homogeneidad entre estratos. En pequeña escala, cada conglomerado es una
representación del universo.
2) MUESTREO NO PROBALISTICO
El muestreo no probabilístico es una técnica de muestreo donde las muestras
se recogen en un proceso que no brinda a todos los individuos de la población
iguales oportunidades de ser seleccionados.
En cualquier tipo de investigación es difícil lograr un muestreo
aleatorio auténtico.
La mayoría de los investigadores tienen limitaciones temporales, monetarias y
de mano de obra y, gracias a ellas, es casi imposible tomar una muestra
aleatoria de toda la población. Generalmente, es necesario emplear otra
técnica de muestreo, la técnica de muestreo no probabilístico.
A diferencia del muestreo probabilístico, la muestra no probabilística no es un
producto de un proceso de selección aleatoria. Los sujetos en una muestra no
probabilística generalmente son seleccionados en función de su accesibilidad o
a criterio personal e intencional del investigador.
La desventaja del método de muestreo no probabilístico es que no se toman
pruebas de una porción desconocida de la población. Esto implica que la
muestra puede representar a toda la población con precisión o no. Por lo tanto,
los resultados de la investigación no pueden ser utilizados en generalizaciones
respecto de toda la población.
MUESTREO POR CONVENECIA
El muestreo por conveniencia es probablemente la técnica de muestreo más
común. En el muestreo por conveniencia, las muestras son seleccionadas
porque son accesibles para el investigador. Los sujetos son elegidos
simplemente porque son fáciles de reclutar. Esta técnica es considerada la más
fácil, la más barata y la que menos tiempo lleva.
MUESTREO POR JUICIO
El método de muestreo discrecional (o muestreo por juicio) es un método de
muestreo no probabilístico. Los sujetos se seleccionan a base del conocimiento
y juicio del investigador.
El investigador selecciona a los individuos a través de su criterio profesional.
Puede basarse en la experiencia de otros estudios anteriores o en su
conocimiento sobre la población y el comportamiento de ésta frente a las
características que se estudian.
MUESTREO POR CUOTAS
El muestreo por cuotas es una técnica de muestreo no probabilístico en donde
el investigador asegura una representación equitativa y proporcionada de los
sujetos, en función de qué rasgo es considerado base de la cuota.
Por ejemplo, si la base de la cuota es de nivel de año en la universidad y el
investigador necesita una representación igual, con un tamaño de muestra de
100, debe seleccionar 25 estudiantes de 1º año, 25 de 2° año, 25 de 3º año y
25 de 4º año. Las bases de la cuota generalmente son la edad, el género, la
educación, la etnia, la religión y el nivel socioeconómico.
MUESTREO POR BOLA DE NIEVE
El muestreo de bola de nieve se lleva a cabo generalmente cuando hay una
población muy pequeña. En este tipo de muestreo, el investigador le pide al
primer sujeto que identifique a otro sujeto potencial que también cumpla con los
criterios de la investigación. La desventaja de usar una muestra de bola de
nieve es que difícilmente sea representativa de la población.
3.3.3.5. CALCULO EL TAMAÑO DE LA MUESTRA
POBLACIÓN.- Llamado también universo o colectivo, es el conjunto de todos
los elementos que tienen una característica común. Una población puede ser
finita o infinita. Es población finita cuando está delimitada y conocemos el
número que la integran, así por ejemplo: Estudiantes de la Universidad UTN.
Es población infinita cuando a pesar de estar delimitada en el espacio, no se
conoce el número de elementos que la integran, así por ejemplo: Todos los
profesionales universitarios que están ejerciendo su carrera.
MUESTRA.- La muestra es un subconjunto de la población. Ejemplo:
Estudiantes de 2do Semestre de la Universidad UTN.
Sus principales características son:
Representativa.- Se refiere a que todos y cada uno de los elementos de la
población tengan la misma oportunidad de ser tomados en cuenta para formar
dicha muestra.
Adecuada y válida.- Se refiere a que la muestra debe ser obtenida de tal
manera que permita establecer un mínimo de error posible respecto de la
población.
Para que una muestra sea fiable, es necesario que su tamaño sea obtenido
mediante procesos matemáticos que eliminen la incidencia del error.
ELEMENTO O INDIVIDUO
Unidad mínima que compone una población. El elemento puede ser una
entidad simple (una persona) o una entidad compleja (una familia), y se
denomina unidad investigativa.
FÓRMULA PARA CALCULAR EL TAMAÑO DE LA MUESTRA
Para calcular el tamaño de la muestra suele utilizarse la siguiente fórmula:
Dónde:
n = el tamaño de la muestra.
N = tamaño de la población.
Desviación estándar de la población que, generalmente cuando no se tiene
su valor, suele utilizarse un valor constante de 0,5.
Z = Valor obtenido mediante niveles de confianza. Es un valor constante que, si
no se tiene su valor, se lo toma en relación al 95% de confianza equivale a 1,96
(como más usual) o en relación al 99% de confianza equivale 2,58, valor que
queda a criterio del investigador.
e = Límite aceptable de error muestral que, generalmente cuando no se tiene
su valor, suele utilizarse un valor que varía entre el 1% (0,01) y 9% (0,09), valor
que queda a criterio del encuestador.
La fórmula del tamaño de la muestra se obtiene de la fórmula para calcular la
estimación del intervalo de confianza para la media, la cual es:
De donde el error es:
De esta fórmula del error de la estimación del intervalo de confianza para la
media se despeja la n, para lo cual se sigue el siguiente proceso:
Elevando al cuadrado a ambos miembros de la fórmula se obtiene:
Multiplicando fracciones:
Eliminando denominadores:
Eliminando paréntesis:
Transponiendo n a la izquierda:
Factor común de n:
Despejando n:
Ordenando se obtiene la fórmula para calcular el tamaño de la muestra:
3.3.4. RECOGIDA DE LOS DATOS (TRABAJO DE CAMPO)
En un estudio de investigación, la validez de los resultados depende, entre
otros aspectos, de la calidad de los datos recogidos. Esta a su vez depende de:
Una buena definición de las variables, así como de sus escalas de
medida.
Las fuentes de información y los instrumentos de medida.
Las fuentes de información deben ser fiables y completas, por lo cual, aunque
será más costoso y requiera más esfuerzo, deberemos recoger siempre que
podamos los datos directamente (datos primarios), aunque en ocasiones no
nos quedara más remedio o nos resultara más rentable, aun con riesgo de
posibles sesgos, que utilizar fuentes de datos secundarios.
En cuanto a los instrumentos de medidas, deberemos utilizar instrumentos
conocidos que se sepa que generan medidas válidas y fiables (precisas). Si se
recoge información mediante cuestionarios, hay que extremar las medidas para
obtener buenos enunciados, orden de las preguntas, etc. Siempre que sea
posible recurrir a cuestionarios validados previamente. En si la validación de un
cuestionario constituye un proyecto de investigación de enorme complejidad:
validación del constructo, contenido y criterio.
También tendremos que definir los sistemas de control de calidad que se van a
realizar, antes, durante y después de la recogida de los datos. Para resaltar la
importancia de este aspecto, frecuentemente olvidado o considerado
secundario, se ha acuñado un término como GIGO, iníciales de Garbage In,
Garbage Out (Basura Entra, Basura Sale), para referirse al hecho de que si al
ordenador se le mete basura, no hay que esperar que los resultados de
cualquier análisis, por sofisticado que sea, sean otra cosa que basura.
El protocolo del proyecto de investigación debe recoger:
Listado de variables
Definición operativa de las variables y sus escalas de medida.
Fuente de los datos
Instrumentos de medida, calibración, sensibilidad, especificidad,
precisión, etc.
Descripción del trabajo de campo de recogida de ratos, instrucción de
las personas que los recogen, como se asegura la homogeneidad de la
recogida de datos, etc.
Descripción de los métodos que utilizaremos para asegurar la calidad de
los datos: antes, durante y después
3.4. TRATAMIENTO Y ANÁLISIS DE LOS DATOS:
Una vez obtenido los datos, y con el fin de convertirlos en información útil para
la toma de decisiones, procede llevar a cabo las actividades siguientes:
3.4.1. Edición, codificación y procesamiento de los datos
Proceso por el cual se revisan los datos puros en busca de errores cometidos
por el entrevistador o el entrevistado Proceso de codificación EDICIÓN Y
CODIFICACIÓN DE DATOS Revisión de áreas de interés:
Formulación de las preguntas apropiadas Registro apropiado de respuestas
Preguntas de selección apropiadas Respuestas a las preguntas abiertas
Formulación de las preguntas apropiadas Registro apropiado de respuestas
Preguntas de selección apropiadas Respuestas a las preguntas abiertas
Codificación consiste en la asignación de valores numéricos a la respuesta de
cada individuo a cada pregunta de la encuesta Uso de escalas como aplicación
de los procedimientos de codificación Forma de códigos maestros Generar una
lista del mayor número posible de respuestas potenciales La consolidación
Asignar valor numérico como código Asignar un valor codificado a cada
respuesta En un cuestionario los primeros reactivos son en realidad preguntas
de selección que determinan si el encuestado es elegible para completar la
entrevista.
3.4.2. TABULACIÓN DE LOS DATOS
Trás la recogida de datos, el siguiente paso en un trabajo estadístico consiste
en una representación de estos datos de manera directa, concisa y visualmente
atractiva. Esto se hace en Estadística mediante la tabulación de la variable
estadística o del atributo. Realizar una tabulación consiste en elaborar tablas
simples, fáciles de leer y que de manera general ofrezcan una acertada visión
de las características más importantes de la distribución estadística estudiada.
A) SIMPLE
La tabulación simple corresponde a la representación de una variable
estadística unidimensional. Está constituida por un cuadro de 2 columnas, la
primera de las cuales contiene las diferentes clases o niveles de la variable que
se describe, y la otra es la frecuencia, ya sea absoluta o relativa con que se
presentaron dichos niveles en la muestra.
Variable (Xi) Frecuencia (Fi ó fi)
Existen diferentes escalas de medidas de las variables:
·NOMINAL: distinción de categorías
·ORDINAL: ordenación por clases
·INTERVALOS: datos agrupados
·CARDINALES: ordenación por clases y distancias
a)Las escalas nominales: sólo implica distinción de categorías. La variable
tomará diferentes valores
b.) Las escalas ordinales: implican una ordenación de las clases. Los valores
de la variable aparecen ordenados, creciente o decrecientemente.
c.) Las escalas cardinales: implican una ordenación de las clases y distancia
entre las mismas (no sólo ordenación como en las escalas ordinales). En este
caso las clases son números.
d.) Las escalas por intervalos: podemos obtener los mismos parámetros que en
la escala cardinal, pero para datos ordenados.
B) CRUZADA
La tabulación cruzada es el proceso de creación de una tabla de
contingencia desde la distribución de frecuencias multivariada de las
variables estadísticas. Muy utilizada en la investigación de encuestas, la
tabulación cruzada (o tabla cruzada, de forma abreviada) se suelen producir
por una sería de paquetes estadísticos, entre ellos algunos que se especializan
en la tarea. Frecuentemente se suelen incorporar ponderaciones de encuesta.
Las tablas sin ponderar se pueden producir fácilmente por algunas hojas de
cálculo y otras herramientas de inteligencia empresarial, conocidas
comúnmente como tablas pivote (también conocidas como tablas dinámicas).
Una pantalla de la matriz de las categorías de dos variables de escala nominal,
que contiene recuentos de frecuencia del número de sujetos en cada categoría
bivariada se llama tabla de tabulación cruzada o tabla de contingencia. En la
tabla siguiente se muestran los géneros y el uso de las manos de una muestra
poblacional de 12 individuos:
Géner
Muestra # Uso de las manos
o
1 Mujer Diestra/o
2 Varón Zurda/o
3 Varón Diestra/o
4 Mujer Diestra/o
5 Mujer Diestra/o
6 Varón Diestra/o
7 Varón Zurda/o
8 Varón Diestra/o
9 Mujer Diestra/o
10 Mujer Zurda/o
11 Varón Diestra/o
12 Mujer Diestra/o
C) La tabulación cruzada conduce hacia la siguiente tabla de contingencia:
Diestra/o Zurda/o Total
Mujeres 5 1 6
Varones 4 2 6
Total 9 3 12
3.4.3. APLICACIÓN DE LAS TÉCNICAS DE ANÁLISIS ESTADÍSTICOS
a) TÉCNICAS DE ANÁLISIS ESTADÍSTICA UNIVARIABLES.
- DISTRIBUCIÓN DE FRECUENCIAS (TABULACIÓN SIMPLE)
Las distribuciones de frecuencias son tablas que resumen los datos originales
en frecuencias.
Los tipos de frecuencia pueden ser:
- Frecuencia Absoluta (f).- Es el número de veces que se repite el valor de cada
variable. La suma de frecuencias absolutas es siempre al total de datos
observados.
- Frecuencia Relativa (fr).- Indica la proporción con que se repite un valor. Es el
cociente entre la frecuencia absoluta y el número total de datos. La suma de las
frecuencias relativas es siempre 1
- Frecuencia Acumulada (fa).- Indica el número de valores que son menores o
iguales que el valor dado. Es la suma de la frecuencia absoluta primera con la
segunda, este valor con la tercera, y así sucesivamente.
- Frecuencia Porcentual (f%).- Llamada también frecuencia relativa porcentual.
Se obtiene multiplicando la frecuencia relativa por 100. La suma de las
frecuencias porcentuales es siempre 100%. Se calcula así:
- Frecuencia Relativa Acumulada (fra).- Es la suma de la frecuencia relativa
primera con la segunda, este valor con la tercera, y así sucesivamente.
- Frecuencia Relativa Acumulada Porcentual (fra%).- Indica el número de
valores que son menores o iguales que el valor dado. Se obtiene multiplicando
la frecuencia relativa acumulada por 100. Se calcula así:
REGLAS GENERALES PARA FORMAS DISTRIBUCIONES DE FRECUENCIAS PARA
DATOS AGRUPADOS EN INTERVALOS
Cuando los datos contienen una gran cantidad de elementos, para facilitar los
cálculos es necesario agruparlos, a estos grupos se los llama intervalos o
clases. Un intervalo es una serie de números incluidos entre dos extremos, así
por ejemplo, el intervalo 40 – 45 está formado por 40, 41, 42, 43, 44 y 45,
siendo 40 el límite inferior, 45 el límite superior, 39,5 límite real inferior (límite
inferior disminuido en 5 décimas) y 40,5 el límite real superior (límite superior
aumentado en 5 décimas).
Las reglas generales para formas distribuciones de frecuencias para datos
agrupados en intervalos son:
1) Calcule el Rango (R).- También se llama recorrido o amplitud total. Es la
diferencia entre el valor mayor y el menor de los datos.
2) Seleccione el Número de Intervalos de Clase (ni).- No debe ser menor de 5 y
mayor de 12, ya que un número mayor o menor de clases podría oscurecer
el comportamiento de los datos. Para calcular el número de intervalos se aplica
la regla de Sturges:
Siendo n el tamaño de la muestra.
3) Calcule el Ancho del Intervalo (i).- Se obtiene dividiendo el Rango para el
número de intervalos
Cuando el valor de i no es exacto, se debe redondear al valor superior más
cercano. Esto altera el valor de rango por lo que es necesario efectuar un
ajuste así:
Por ejemplo:
Si una distribución de 40 datos el valor mayor es 41 y el menor es 20 se tiene:
Calculando el Rango se obtiene:
Calculando el número de intervalos se obtiene:
Calculando el ancho se obtiene:
Redondeando se obtiene: i = 4
Calculando el nuevo rango se obtiene:
El exceso de 3 que se tiene en este caso se distribuye entre xmáx y xmín. Por
lo general se agrega al mayor y se quita al menor. Como por ejemplo, se podría
agregar 2 al valor mayor y quitar 1 al valor menor, obteniéndose los siguientes
nuevos valores:
O también se podría agregar 1 al valor mayor y quitar 2 al valor menor,
obteniéndose los siguientes nuevos valores:
4) Forme los Intervalos de Clase agregando i-1 al límite inferior de cada clase,
comenzando por el Xmín del rango.
5) Se realiza el Conteo de Datos que cae dentro de cada clase (frecuencia
absoluta)
6) Calcule la Marca de Clase (xm).- Es el valor medio de cada clase, se obtiene
sumando los límites superior (Ls) e inferior (Li) del intervalo y dividiendo ésta
suma entre 2
7) Calcule las Frecuencias
EJEMPLO ILUSTRATIVO
A 40 estudiantes se les pidió que estimen el número de horas que habrían
dedicado a estudiar la semana pasada (tanto en clase como fuera de ella),
obteniéndose los siguientes resultados:
36 30 47 60 32 35 40 50
54 35 45 52 48 58 60 38
32 35 56 48 30 55 49 39
58 50 65 35 56 47 37 56
58 50 47 58 55 39 58 45
Solución:
1) Calculando el Rango se obtiene:
2) Calculando el número de intervalos se obtiene:
3) Calculando el ancho se obtiene:
Redondeando se obtiene: i = 6, por lo que es necesario realizar un ajuste al
rango.
Los cálculos r
ealizados en Excel se muestran en la siguiente figura:
4) Calculando el nuevo rango se obtiene:
El exceso de 1 que se tiene en este caso se distribuye entre xmáx y xmín. En
este ejemplo, se podría agregar 1 al valor mayor y no quitar nada al valor
menor, o no agregar nada al mayor y quitar 1 al menor. Al elegir la primera
opción se obtiene:
5) Formando los intervalos de clase agregando i-1 (6-1=5) al límite inferior de
cada clase, comenzando por el Xmín del rango se obtiene:
30+5 = 35; 36+5 = 41; 42+5 = 47; 48+5 = 53; 54+5 = 59; 60+5 = 65
6) Realizando el conteo de datos que cae dentro de cada clase, calculando la
marca de clase y las frecuencias se obtiene:
Clases f xm fr fa f% fra fra%
(30+35)/2 =
30-35 8 0,2 8 20 0,2 20
32,5
(36+41)/2 =
36-41 6 0,15 14 15 0,35 35
38,5
(42+47)/2 =
42-47 5 0,125 19 12,5 0,475 47,5
44,5
(48+53)/2 =
48-53 7 0,175 26 17,5 0,65 65
50,5
(54+59)/2 =
54-59 11 0,275 37 27,5 0,925 92,5
56,5
(60+65)/2 =
60-65 3 0,075 40 7,5 1 100
62,5
Total 40 1 100
A continuación se presenta algunas interpretaciones de la tabla:
El valor de f =8: Significa que 8 estudiantes dedicaron a estudiar la semana
pasada entre 30 y 35 horas.
El valor de xm = 50,5: Significa que 7 estudiantes dedicaron en promedio a
estudiar la semana pasada 50,5 horas.
El valor de fr = 0,15 y f% = 15%: Significa que el 0,15 o el 15% de los
estudiantes dedicaron a estudiar la semana pasada entre 36 y 41 horas.
El valor de fa = 26: Significa que 26 estudiantes dedicaron a estudiar la semana
pasada entre 30 y 53 horas.
El valor de fra = 0,65 y fra% = 65%: Significa que el 0,65 o el 65% de los
estudiantes dedicaron a estudiar la semana pasado entre 30 y 53 horas.
Para realizar los cálculos de la frecuencia absoluta empleando Excel se
procede de la siguiente manera:
a) Digite los datos, las clases y límites superiores de las clases. Seleccione
C8:C13 donde las frecuencias absolutas deben ser calculadas. Escriba la
fórmula: =FRECUENCIA (A1:H5; B8:B13)
b) Presione CTRL+SHIFT+ENTER
Los cálculos de la marca de clase y de las otras frecuencias empleando Excel
se muestran en la siguiente figura:
- PROMEDIOS (MEDIA, MEDIANA, MODA, CUARTILES, PERCENTILES,
ECT)
Equivale al cálculo del promedio simple de un conjunto de datos. Para
diferenciar datos muestrales de datos poblacionales, la media aritmética se
representa con un símbolo para cada uno de ellos: si trabajamos con la
población, este indicador será µ; en el caso de que estemos trabajando con
una muestra, el símbolo será .
Hay que entender que existen dos formas distintas de trabajar con los datos
tanto poblacionales como muestrales: sin agruparlos o agrupándolos en tablas
de frecuencias. Esta apreciación nos sugiere dos formas de representar la
media aritmética.
4.1.1 MEDIA ARITMÉTICA PARA DATOS NO AGRUPADOS
Podemos diferenciar la fórmula del promedio simple para datos poblaciones y
muestrales:
Observe que la variación de ambas fórmulas radica en el tamaño de los datos
(N identifica el tamaño de la población, mientras que n el de la muestra).
4.1.2 Ejemplo: la media aritmética para datos no agrupados
El profesor de la materia de estadística desea conocer el promedio de las notas
finales de los 10 alumnos de la clase. Las notas de los alumnos son:
3,2 3,1 2,4 4,0 3,5
3,0 3,5 3,8 4,2 4,0
¿Cuál es el promedio de notas de los alumnos de la clase?
SOLUCIÓN
Aplicando la fórmula para datos no agrupados tenemos:
Cabe anotar que en el ejemplo estamos hablando de una población
correspondiente a todos los alumnos de la clase (10 alumnos en total). El
promedio de las notas es de 3,47.
Modifiquemos la primera nota por 0,0 y calculemos nuevamente la media
aritmética.
En este caso la media pasa de 3,47 a 3,15. Esta variación notoria se debió a
que la media aritmética es sensible a los valores extremos cuando tratamos
con pocos datos. El 0,0 es una nota atípica comparada con las demás, que
están ubicadas entre 3,0 y 4,2.
4.1.3 Media aritmética para datos agrupados
En el capitulo 2 explicábamos dos tipos de tablas de frecuencias (A y B).
Cuando los datos se agrupan en tablas tipo A, la media aritmética es igual a la
división de la sumatoria del producto de las clases por la frecuencia sobre el
número de datos.
La sumatoria parte desde el primer intervalo de clase (i = 1) hasta el último
(Nc), siendo Xi la clase del intervalo i.
Cuando los datos se agrupan en tablas de frecuencias tipo B, el cálculo de la
media varía un poco, ya que existe una pérdida de información en el momento
en que se trabaja con intervalos de frecuencia y no con los datos directamente
(los datos se agrupan por intervalo, desconociendo el valor exacto de cada uno
de ellos).
Las marcas de clases (Mc) cumple la función de representar los intervalos de
clase.
4.1.4 Ejemplo: media aritmética para datos agrupados en tablas tipo A
La siguiente tabla de frecuencia muestra el número de preguntas de 81
encuestados sobre un Test que consta de solo seis preguntas.
Preguntas Buenas Personas
1 15
2 13
3 8
4 19
5 21
6 5
SOLUCIÓN
PASO 1: Realizar la sumatoria del producto resultante de las clases por su
frecuencia absoluta. Para efectos del cálculo de la media, deberíamos sumar
15 veces el valor 1, 13 veces el valor 2, 8 veces el valor 3, hasta llegar a la
última clase:
PASO 2: Dividir la sumatoria sobre el número total de datos.
En promedio los encuestados contestaron aproximadamente 3 (el valor exacto
es 3,41) preguntas buenas.
4.1.5 Ejemplo: media aritmética para datos agrupados en tablas tipo B
Calcular la media para los datos distribuidos en la siguiente tabla de frecuencia:
Ni Lm Ls f Mc
1 40,0 48,1 3 44,1
2 48,1 56,1 8 52,1
3 56,1 64,1 11 60,1
4 64,1 72,1 32 68,1
5 72,1 80,1 21 76,1
6 80,1 88,1 18 84,1
7 88,1 96,1 14 92,1
8 96,1 104,0 1 100,1
SOLUCIÓN
Las marcas de clase representan a los intervalos de clase, por ejemplo,
suponemos que la marca de clase para el primer intervalo (44,1) se repite 3
veces, al desconocer los 3 valores exactos que están dentro de dicho intervalo.
PASO 1: Realizar la sumatoria del producto resultante entre las marcas de
clase por su frecuencia absoluta.
PASO 2: Dividir la sumatoria sobre el número total de datos.
4.1.6 Ejemplo: comparativa entre el cálculo de la media aritmética para datos
no agrupados y datos agrupados en tablas tipo B
Calcular la media aritmética a los siguientes datos sin agrupar y agrupándolos
en una tabla de frecuencia tipo B (suponga que los datos son poblacionales):
47,8 23,1 12,4 35,4 44,0 26,2
18,6 11,0 32,0 12,4 49,4 41,4
18,6 21,0 26,3 11,1 21,4 30,6
12,8 43,1 18,1 38,1 16,8 12,4
33,6 40,9 15,2 33,2 48,2 37,0
SOLUCIÓN
Calculemos la media para los datos sin agrupar:
Luego construyamos la tabla tipo B y calculemos su media aritmética con el fin
de comparar ambos resultados:
Ni Lm Ls f Mc
1 11,00 17,41 8 14,21
2 17,41 23,81 6 20,61
3 23,81 30,21 2 27,01
4 30,21 36,61 5 33,41
5 36,61 43,01 4 39,81
6 43,01 49,40 5 46,21
Total 30
PASO 1: Realizar la sumatoria del producto resultante entre las marcas de
clase por su frecuencia absoluta.
PASO 2: Dividir la sumatoria sobre el número total de datos.
Podemos ver claramente una diferencia entre ambas medias: 27,74 para los
datos no agrupados y 28,29 para los datos agrupados. Esta diferencia radica
que en la tabla tipo B existe una perdida de información, al agrupar los datos en
los intervalos de clase. El valor de la media exacta es el calculado para los
datos no agrupados, pero dada la proximidad de la media para los datos
agrupados, se tomar esta última como cierta.
LA MEDIANA
La definición de geométrica se refiere al punto que divide en dos partes a un
segmento. Por ejemplo, la mediana del segmento es el punto C.
Existen entonces dos segmentos iguales:
4.2.1 Ejemplo: mediana para datos no agrupados (cantidad de datos impar)
Encontrar la mediana para los siguientes datos:
41234221553
SOLUCIÓN
PASO 1: Ordenar los datos.
11222334455
PASO 2: Localizar el valor que divide en dos parte iguales el número de datos.
11222334455
La mediana es 3, dejando 5 datos a cada lado.
4.2.2 Ejemplo: mediana para datos no agrupados (cantidad de datos par)
Modifiquemos el ejemplo anterior, eliminando el último dato. Encontrar la
mediana:
4123422155
SOLUCIÓN
PASO 1: Ordenar los datos.
1122234455
PASO 2: Localizar el valor que divide en dos parte iguales el número de datos.
1122234455
El punto medio se encuentra entre dos valores: 2 y 3, por tanto, el valor de la
mediana será 2,5.
4.2.3 Ejemplo: mediana para datos agrupados en tablas tipo A
Calcular la mediana a partir de la siguiente tabla de frecuencia:
Ni Clase f F h H
1 10 5 5 10,4% 10,4%
2 20 7 12 14,6% 25,0%
3 30 10 22 20,8% 45,8%
4 40 13 35 27,1% 72,9%
5 50 10 45 20,8% 93,8%
6 60 2 47 4,2% 97,9%
7 70 1 48 2,1% 100,0%
Total 48 100,0%
SOLUCIÓN
PASO 1: Localizar entre que clases se encuentra la mediana. Observe que la
mediana se encuentra entre las clases 3 y 4, donde podremos encontrar una
frecuencia relativa acumulada del 50%.
Ni Clase f F h H
1 10 5 5 10,4% 10,4%
2 20 7 12 14,6% 25,0%
3 30 10 22 20,8% 45,8%
4 40 13 35 27,1% 72,9%
5 50 10 45 20,8% 93,8%
6 60 2 47 4,2% 97,9%
7 70 1 48 2,1% 100,0%
Total 48 100,0%
PASO 2: Interpolar los datos para encontrar la mediana.
En el paso anterior habíamos dicho que el punto que divide el 2 parte iguales
se encuentra entre 30 y 40.
Clase H
40 72,9%
30 45,8%
Diferencia 10 27,1%
La diferencia entre las frecuencias relativas nos indica que existe entre las
clases 27,1% de los datos. Para llegar al 50% de los datos, debemos
incrementar en 4,2% datos partiendo desde la clase 30.
Con una regla de tres sencilla hallaremos el incremento en unidades dada en la
clase para ese 4,2%.
10 27,1%
Incremento 4,2%
Para llegar al 50% de los datos, a la clase 30 debemos incrementarle 1,55.
4.2.4 Ejemplo: mediana para datos agrupados en tablas tipo B
Determinar la mediana de la siguiente tabla de frecuencia:
Ni Lm Ls f F h H Mc
1 21,20 29,21 5 5 12,50% 12,50% 25,21
2 29,21 37,21 2 7 5,00% 17,50% 33,21
3 37,21 45,21 10 17 25,00% 42,50% 41,21
4 45,21 53,21 7 24 17,50% 60,00% 49,21
5 53,21 61,21 12 36 30,00% 90,00% 57,21
6 61,21 69,21 3 39 7,50% 97,50% 65,21
7 69,21 77,20 1 40 2,50% 100,00% 73,21
Total 40 100,00%
SOLUCIÓN
PASO 1: Localizar entre que intervalos de clase se encuentra la mediana.
Podemos observar que el punto que divide el 50% de los datos esta entre el
intervalo de clase 3 y 5, para ser más preciso, entre los valores 45,21 y 53,21
(hasta 45,21 hay agrupados el 42,50% de los datos, y hasta 53,21 se resume el
60,00% de los datos).
Ni Lm Ls f F h H Mc
1 21,20 29,21 5 5 12,50% 12,50% 25,21
2 29,21 37,21 2 7 5,00% 17,50% 33,21
3 37,21 45,21 10 17 25,00% 42,50% 41,21
4 45,21 53,21 7 24 17,50% 60,00% 49,21
5 53,21 61,21 12 36 30,00% 90,00% 57,21
6 61,21 69,21 3 39 7,50% 97,50% 65,21
7 69,21 77,20 1 40 2,50% 100,00% 73,21
Total 40 100,00%
PASO 2: Interpolar los datos para encontrar la mediana. En resumen tenemos
que:
Límite H
Superior
53,21 (Ls4) 60,00% (H4)
45,21 (Ls3) 42,50% (H3)
Diferencia 8,00 17.50%
Entre los dos límites superiores abarcan un total de 17,50% de los datos. Se
debe aumentar en 7,50% los datos desde límite superior del tercer intervalo de
clase.
8,00 17,50%
Incremento 7,50%
Para llegar al 50% de los datos, 45,21 se aumenta en 3,43 unidades.
4.2.5 La fórmula para calcular la mediana
De este último ejemplo podemos determinar la fórmula para calcular la
mediana. Observe que la mediana parte del límite superior del intervalo de
clase anterior, la cual simbolizaremos por Lsi-1, siendo i igual a 4 (cuarto
intervalo de clase). A este valor se le suma el incremento para llegar al 50% de
los datos:
El incremento resulta de multiplicar el incremento para llevar la frecuencia al
50% (50% - Hi-1) por el ancho de la clase (A) sobre la diferencia porcentual
entre los límites superiores (Hi – Hi-1):
Simplificando aún más la fórmula, recordemos que Hi – Hi-1 es lo mismo la
frecuencia relativa del intervalo de clase i (hi).
Para expresar la fórmula en frecuencias absolutas tenemos que:
4.2.6 Ubicando la mediana en el gráfico de ojiva
En un gráfico de ojiva, la mediana corresponde a la proyección del punto en eje
horizontal que equivale al 50% de los datos. En la el gráfico de ojiva del
ejemplo 3.6.1, la mediana estaría ubicada en el sexto intervalo, entre 350 y
400:
LA MODA
Indica el valor que más se repite, o la clase que posee mayor frecuencia
Indicada.
En el caso de que dos valores presenten la misma frecuencia, decimos que
existe un conjunto de datos bimodal. Para más de dos modas hablaremos de
un conjunto de datos multimodal.
4.3.1 Ejemplo: moda para datos no agrupados
Los siguientes datos provienen del resultado de entrevistar a 30 personas
sobre la marca de gaseosa que más consume a la semana:
Marca 1 Marca 2 Marca 1 Marca 1 Marca 1 Marca 3
Marca 1 Marca 3 Marca 1 Marca 2 Marca 1 Marca 1
Marca 2 Marca 1 Marca 3 Marca 3 Marca 2 Marca 1
Marca 1 Marca 1 Marca 1 Marca 3 Marca 1 Marca 2
Marca 3 Marca 1 Marca 3 Marca 3 Marca 2 Marca 3
SOLUCIÓN
PASO 1: Determinar las frecuencias de cada valor de la variable.
La marca 1 se repite 15 veces
La marca 2 se repite 6 veces
La marca 3 se repite 9 veces
PASO 2: la moda representa el valor que más se repite. En este caso es la
marca 1.
4.3.2 Ejemplo: moda para datos agrupados
Calcular la moda a partir de la siguiente tabla de frecuencia:
Ni Lm Ls f Mc
1 [4 6) 2 5
2 [6 8) 4 7
3 [8 10 ) 4 9
4 [ 10 12 ) 5 11
5 [ 12 14 ] 5 13
Total 20
SOLUCIÓN
Las marcas de clase que más frecuencias tienen son 11 y 13, por tanto
decimos que es un caso donde aparecen dos modas (bimodal).
4.3.3 Calculo de la moda mediante fórmula
Algunos autores suelen aplicar una fórmula para determinar la moda para
tablas de frecuencia.
Donde LS-1 equivale al límite superior del intervalo anterior donde se encuentra
la moda.
4.3.4 Calculo de la mediana en Excel
Con la función MODA que provee Excel, podremos calcular el valor que posee
mayor frecuencia en datos no agrupados
Calcule la moda a partir de los siguientes datos copiados en una hoja nueva de
Excel:
Active la función MODA en la celda B9 y en el campo número1 selecciones los
datos del ejercicio.
La moda del ejercicio es 2.
Esta fórmula solo muestra una moda, correspondiente a la de menor valor. En
el caso de que no exista la moda aparecen los símbolos #N/A.
4.3.5 Ventajas
Es estable a los valores extremos.
Es recomendable para el tratamiento de variables cualitativas.
4.3.6 Desventajas
Pueda que no se presente.
Puede existir más de una moda.
En distribuciones muy asimétricas suele ser un dato muy poco
representativo.
Carece de rigor matemático.
CUARTILES
Distinguimos los casos en que los datos están agrupados en frecuencias y
los que no lo están. Los datos también pueden estar agrupados en intervalos
de valores.
Vayamos a datos no agrupados. Para el Q1 y Q3 hallaremos su posición
mediante los siguientes pasos:
(N+1)/4 y 3(N+1)/4 pueden resultar números decimales. Por ejemplo, si el
conjunto de datos es de 20 elementos, N=20, tendremos que el sujeto del
primer cuartil es el (N+1)/4=(20+1)/4=21/4=5,25. ¿Qué hacemos en el caso de
que nos de un número decimal?
Diferenciaremos dos casos:
Sin parte decimal: elegimos ese mismo sujeto. Por ejemplo, si el conjunto
tiene 19 elementos, (N+1)/4=(19+1)/4=20/4=5, por lo que el primer cuartil
será Q1=X5.
Con parte decimal: supongamos que el elemento es un número con parte
decimal entre el sujeto i y el i+1. Sea un número de la forma i,d donde i es
la parte entera y d la decimal. El cuartil será:
Podéis ver un ejemplo práctico en el siguiente apartado.
El cálculo del segundo cuartil depende de si el número de sujetos N es par o
impar. Al ser la mediana, se utiliza el procedimiento de cálculo de la mediana.
Ejemplo
Sea un conjunto de la edad de los veinte integrantes (N=20) de un club.
Supongamos que el conjunto está ordenado:
Primer cuartil
El primer cuartil será el sujeto (N+1)/4=21/4=5,25. Como es decimal, el cuartil
será un número entre el X5=28 y X6=29.
El número decimal es el 5,25, por lo que i=5 y d=0,25. El cuartil 1 es:
Segundo cuartil
El segundo cuartil es la mediana. Al ser un conjunto con un número par de
elementos, el cuartil es la media de los sujetos N/2=20/2=10
y N/2+1=20/2+1=11.
Es decir, será la media de X10=34 y X6=37.
Tercer cuartil
El tercer cuartil es el sujeto 3(N+1)/4=63/4=15,75. Como el número es decimal,
el cuartil estará entre X15=52 y X16=53.
El número decimal es el 15,75, por lo que i=15 y d=0,75. El cuartil 3 es:
Percentiles
Un percentil es una de las llamadas medidas de posición no central (cuartiles,
deciles, quintiles, percentiles, etc) que se puede describir como una forma
de comparación de resultados, por ello es un concepto ampliamente utilizado
en campos como la estadística o el análisis de datos. El percentil es un número
de 0 a 100 que está muy relacionado con el porcentaje pero que no es el
porcentaje en sí. Para un conjunto de datos, el percentil para un valor dado
indica el porcentaje de datos que son igual o menores que dicho valor; en otras
palabras, nos dice dónde se posiciona una muestra respecto al total.
El concepto es más sencillo de entender con unos ejemplos:
Ejemplo 1: Tenemos un conjunto de datos consistente en la nota de
cada uno de los alumnos de una clase. Si un alumno tiene un 9,5 y está
en el P85 (percentil 85), significa que el 85% de los alumnos tiene un 9,5
o menos.
Ejemplo 2: Tenemos unas muestra con los sueldos de 10.000
trabajadores. ¿Cuál sería el percentil 60? El P60 sería aquel sueldo por
debajo del cuál estaría el 60% de los trabajadores, es decir, si
ordenamos los trabajadores desde el que cobra menos hasta el cobra
más, el P60 sería el sueldo del trabajador número 6.000 (60% de
10.000).
Ejemplo 3: Si medimos el tiempo que tarda cada uno de los atletas de
una competición en recorrer una cierta distancia. ¿Cuánto tiempo tardan
en recorrer esta distancia el 45% de los corredores? La respuesta es el
percentil 45. La idea es simple, encontrar un porcentaje a partir del cuál
los valores son iguales o están por debajo.
Cálculo de percentiles
Para calcular los percentiles de un conjunto de datos, primero se han de
ordenar los datos en orden ascendente. Una vez ordenados, un determinado
percentil puede encontrarse restando 0,5 a la posición del dato en la secuencia,
dividiendo por el número total de datos y multiplicando luego por 100.
Fórmula general para calcular percentiles
Siendo P el percentil, Xn la posición en la secuencia de la muestra X y N el
número total de datos.
Ejemplo: Tenemos 47 datos, el valor mínimo que encontramos entre todos los
datos es 51 y el máximo es 99. Ordenamos los datos desde el que tiene valor
51 hasta el que tiene valor 99. Si queremos saber el percentil al que pertenece
el valor 63, miramos el dato cuyo valor es 63, supongamos que su posición en
la secuencia es 12. Para calcular su percentil, restamos 12 menos 0,5, el
resultado (11,5) lo dividimos entre 47 (el total de datos); nos da 0,2446;
multiplicamos por 100 y obtenemos 24,46: Este resultado indica que el valor 63
se encuentra en el percentil 24,46, o lo que es lo mismo, que el 24,46% de los
datos tiene un valor de 63 o menos, o que el P24,46 es 63.
Este tipo de cálculos tiene numerosas aplicaciones en cualquier cálculo
estadístico como datos de empleo o el análisis de muestras. Por ejemplo,
imagina que se está midiendo la concentración de un determinado
contaminante en el aire cuya concentración máxima segura es de 3 ppm. Para
ello se toman muchas muestras de aire y se va midiendo la concentración de
este contaminante. Imagina que los resultados concluyen que el 35% de las
muestras presentan una concentración de contaminante de 3 ppm o menos. Es
decir, el percentil 35 tiene concentraciones seguras y el percentil 65 tiene una
concentración superior a la segura. Este dato podría ser suficiente para
recomendar a las autoridades competentes que tomen medidas para su
reducción.
MEDIDAS D DISPERSION:
1. VARIANZA
Esta medida nos permite identificar la diferencia promedio que hay entre cada
uno de los valores respecto a su punto central (Media ). Este promedio es
calculado, elevando cada una de las diferencias al cuadrado (Con el fin de
eliminar los signos negativos), y calculando su promedio o media; es decir,
sumado todos los cuadrados de las diferencias de cada valor respecto a la
media y dividiendo este resultado por el número de observaciones que se
tengan. Si la varianza es calculada a una población (Total de componentes de
un conjunto), la ecuación sería:
Ecuación 5-6
Donde ( ) representa la varianza, (Xi) representa cada uno de los valores, (
) representa la media poblacional y (N) es el número de observaciones ó
tamaño de la población. En el caso que estemos trabajando con una muestra la
ecuación que se debe emplear es:
Ecuación 5-7
Donde (S2) representa la varianza, (Xi) representa cada uno de los valores, (
) representa la media de la muestra y (n) es el número de observaciones ó
tamaño de la muestra. Si nos fijamos en la ecuación, notaremos que se le resta
uno al tamaño de la muestra; esto se hace con el objetivo de aplicar una
pequeña medida de corrección a la varianza, intentando
hacerla más representativa para la población. Es necesario resaltar que la
varianza nos da como resultado el promedio de la desviación, pero este valor
se encuentra elevado al cuadrado.
2. Desviación estándar o Típica
Esta medida nos permite determinar el promedio aritmético de fluctuación de
los datos respecto a su punto central o media. La desviación estándar nos da
como resultado un valor numérico que representa el promedio de diferencia
que hay entre los datos y la media. Para calcular la desviación estándar basta
con hallar la raíz cuadrada de la varianza, por lo tanto su ecuación sería:
Ecuación 5-8
Para comprender el concepto de las medidas de distribución vamos a suponer
que el gerente de una empresa de alimentos desea saber que tanto varían los
pesos de los empaques (en gramos), de uno de sus productos; por lo que opta
por seleccionar al azar cinco unidades de ellos para pesarlos. Los productos
tienen los siguientes pesos (490, 500, 510, 515 y 520) gramos
respectivamente.
Por lo que su media es:
La varianza sería:
Por lo tanto la desviación estándar sería:
Con lo que concluiríamos que el peso promedio de los empaques es de 507
gramos, con una tendencia a variar por debajo o por encima de dicho peso en
12 gramos. Esta información le permite al gerente determinar cuanto es el
promedio de perdidas causado por el exceso de peso en los empaques y le da
las bases para tomar los correctivos necesarios en el proceso de empacado.
Coeficiente de variación
Las medidas de dispersión anteriores son todas medidas de variación
absolutas. Una medida de dispersión relativa de los datos, que toma en cuenta
su magnitud, está dada por el coeficiente de variación.
El Coeficiente de variación (CV) es una medida de la dispersión relativa de un
conjunto de datos, que se obtiene dividiendo la desviación estándar del
conjunto entre su media aritmética y se expresa como para una
muestra y para la población.
Los coeficientes de variación tienen las siguientes características:
Puesto que tanto la desviación estándar como la media se miden en las
unidades originales, el CV es una medida independiente de las unidades
de medición.
Debido a la propiedad anterior el CV es la cantidad más adecuada para
comparar la variabilidad de dos conjuntos de datos.
En áreas de investigación donde se tienen datos de experimentos
previos, el CV es muy usado para evaluar la precisión de un
experimento, comparando en CV del experimento en cuestión con los
valores del mismo en experiencias anteriores.
Ejemplo: En seis sábados consecutivos un operador de taxis recibió 9, 7, 11,
10, 13 y 7 llamadas a su sitio para su servicio. Calcule:
a. Amplitud.
b. Media.
c. Desviación media.
d. Desviación estándar.
e. Varianza.
f. Coeficiente de variación.
a) Para calcular la amplitud.
Valor máximo 13
Valor mínimo 7
A = 13 7 = 6
b) Para calcular la media.
c) Para calcular la desviación media
d) Para calcular la desviación estándar
Se puede utilizar la siguiente tabla:
9 -0.5 0.25
7 -2.5 6.25
11 1.5 2.25
10 0.5 0.25
13 3.5 12.25
7 -2.5 6.25
0.0 27.50
Al sustituir los valores se obtiene:
e) Para calcular la varianza:
f) Para calcular el coeficiente de variación:
Amplitud o recorrido
La medida de dispersión más simple recibe el nombre de Amplitud o recorrido y
es muy poco usada puesto que su única ventaja es la sencillez con que se
calcula. Es común que se use también el nombre de Rango para esta medida.
La amplitud (A) de un conjunto de datos es la diferencia entre las
observaciones que tienen el mayor y el menor valor numérico en el mismo.
Por ejemplo: Supóngase que en un hospital el pulso de cada paciente se mide
tres veces al día y que cierto día los registros de dos pacientes muestran:
Paciente 1: 73 77 74
Paciente 2: 64 90 73
¿Cuál es la Amplitud en pulsaciones para cada paciente?
Para calcular la amplitud de los datos necesario identificar el valor más grande
y el valor más pequeño del conjunto de datos de cada uno de los pacientes.
Para el Paciente 1:
A = 77 73 = 4
Para el Paciente 2:
A = 90 64 = 26
La amplitud es una medida de dispersión cuya ventaja es la facilidad con que
se calcula. Tiene en cambio las siguientes desventajas:
En su cálculo sólo intervienen dos elementos del conjunto.
Al aumentar el número de observaciones, puede esperarse que aumente
la variabilidad. Puesto que la amplitud no tiene en cuenta el tamaño del
conjunto, no es una medida adecuada para comparar la variabilidad de
dos grupos de observaciones, a menos que éstos sean del mismo
tamaño.
MEDIDAS DE ASIMETRÍA Y CURTOSIS
1. ASIMETRÍA
Esta medida nos permite identificar si los datos se distribuyen de forma
uniforme alrededor del punto central (Media aritmética). La asimetría presenta
tres estados diferentes [Fig.5-1], cada uno de los cuales define de forma
concisa como están distribuidos los datos respecto al eje de asimetría. Se dice
que la asimetría es positiva cuando la mayoría de los datos se encuentran por
encima del valor de la media aritmética, la curva es Simétrica cuando se
distribuyen aproximadamente la misma cantidad de valores en ambos lados de
la media y se conoce como asimetría negativa cuando la mayor cantidad
de datos se aglomeran en losvalores menores que la media.
Figura 5-1
El Coeficiente de asimetría, se representa mediante la ecuación matemática,
Ecuación 5-9
Donde (g1) representa el coeficiente de asimetría de Fisher, (Xi) cada uno de
los valores, ( ) la media de la muestra y (ni) la frecuencia de cada valor. Los
resultados de esta ecuación se interpretan:
(g1 = 0): Se acepta que la distribución es Simétrica, es decir,
existe aproximadamente la misma cantidad devalores a los dos lados de la
media. Este valor es difícil de conseguir por lo que se tiende a tomar
losvalores que son cercanos ya sean positivos o negativos (± 0.5).
(g1 > 0): La curva es asimétricamente positiva por lo que los valores se tienden
a reunir más en la parte izquierda que en la derecha de la media.
(g1 < 0): La curva es asimétricamente negativa por lo que los valores se
tienden a reunir más en la parte derecha de la media.
Desde luego entre mayor sea el número (Positivo o Negativo), mayor será la
distancia que separa la aglomeración de los valores con respecto a la media.
2. CURTOSIS
Esta medida determina el grado de concentración que presentan los valores en
la región central de la distribución. Por medio del Coeficiente de Curtosis,
podemos identificar si existe una gran concentración devalores (Leptocúrtica),
una concentración normal (Mesocúrtica) ó una baja concentración (Platicúrtica).
Figura 5-2
Para calcular el coeficiente de Curtosis se utiliza la ecuación:
Ecuacion 5-10
Donde (g2) representa el coeficiente de Curtosis, (Xi) cada uno de los valores, (
) la media de la muestra y (ni) la frecuencia de cada valor. Los resultados de
esta fórmula se interpretan:
(g2 = 0) la distribución es Mesocúrtica: Al igual que en la asimetría es bastante
difícil encontrar un coeficiente de Curtosis de cero (0), por lo que se
suelen aceptar los valores cercanos (± 0.5 aprox.).
(g2 > 0) la distribución es Leptocúrtica
(g2 < 0) la distribución es Platicúrtica
Cuando la distribución de los datos cuenta con un coeficiente de asimetría (g1
= ±0.5) y un coeficiente de Curtosis de (g2 = ±0.5), se le denomina Curva
Normal. Este criterio es de suma importancia ya que para la mayoría de los
procedimientos de la estadística de inferencia se requiere que los datos se
distribuyan normalmente.
La principal ventaja de la distribución normal radica en el supuesto que el 95%
de los valores se encuentra dentro de una distancia de dos desviaciones
estándar de la media aritmética (Fig.5-3); es decir, si tomamos la media y le
sumamos dos veces la desviación y después le restamos a la media dos
desviaciones, el 95% de los casos se encontraría dentro del rango que
compongan estos valores.
Figura 5-3
Desde luego, los conceptos vistos hasta aquí, son sólo una pequeña
introducción a las principales medidas de Estadística Descriptiva; es de gran
importancia que los lectores profundicen en estos temas ya que la principal
dificultad del paquete SPSS radica en el desconocimiento de los
conceptos estadísticos.
Las definiciones plasmadas en este capítulo han sido extraídas de los
libros Estadística para administradores escrito por Alan Wester de la
editorial McGraw-Hill y el libro Estadística y Muestreo escrito por Ciro
Martínez editorial Ecoe editores (Octava edición). No necesariamente tienes
que guiarte por estos libros ya que en las librerías encontraras una gran
variedad de textos que pueden ser de bastante utilidad en la introducción a
esta ciencia.
-TESTS ESTADISTICOS
Los tests estadísticos (o contrastes) son el instrumento para validar o rechazar
las hipótesis de modelación probabilistas. Ellos tratan de distinguir lo que es
plausible de lo que es muy poco verosímil, en el marco de un modelo dado.
Presentamos aquí lo esencial de los tests más clásicos. En un primer momento
estudiaremos los tests llamados ''omnibus'', en los cuales no se especifica una
alternativa. Presentaremos a continuación los tests no paramétricos clásicos
(cuantiles, Kolmogorov-Smirnov, chi-cuadrado, Wilcoxon, odds ratio), luego los
tests sobre muestras gaussianas (comparación de medias, modelo lineal,
análisis de varianza ...). Abordaremos algunos aspectos más teóricos en la
sección número cuatro. El punto de vista que se adopta aquí está orientado a
las aplicaciones médicas y se apoya considerablemente en el empleo de
sistemas de cálculo que permiten la experimentación sobre muestras
simuladas.
*NO PARAMÉTRICOS
La estadística no paramétrica es una rama de la estadística que estudia las
pruebas y modelos estadísticos cuya distribución subyacente no se ajusta a los
llamados criterios paramétricos. Su distribución no puede ser definida a priori,
pues son los datos observados los que la determinan. La utilización de estos
métodos se hace recomendable cuando no se puede asumir que los datos se
ajusten a una distribución conocida, cuando el nivel de medida empleado no
sea, como mínimo, de intervalo.
Las principales pruebas no paramétricas son las siguientes:
Prueba χ² de Pearson
Prueba binomial
Prueba de Anderson-Darling
Prueba de Cochran
Prueba de Cohen kappa
Prueba de Fisher
Prueba de Friedman
Prueba de Kendall
Prueba de Kolmogórov-Smirnov
Prueba de Kruskal-Wallis
Prueba de Kuiper
Prueba de Mann-Whitney o prueba de Wilcoxon
Prueba de McNemar
Prueba de la mediana
Prueba de Siegel-Tukey
Prueba de los signos
Coeficiente de correlación de Spearman
Tablas de contingencia
Prueba de Wald-Wolfowitz
Prueba de los rangos con signo de Wilcoxon
La mayoría de estos test estadísticos están programados en los paquetes
estadísticos más frecuentes, quedando para el investigador, simplemente, la
tarea de decidir por cuál de todos ellos guiarse o qué hacer en caso de que dos
test nos den resultados opuestos. Hay que decir que, para poder aplicar cada
uno existen diversas hipótesis nulas y condiciones que deben cumplir nuestros
datos para que los resultados de aplicar el test sean fiables. Esto es, no se
puede aplicar todos los test y quedarse con el que mejor convenga para la
investigación sin verificar si se cumplen las hipótesis y condiciones necesarias
pues, si se violan, invalidan cualquier resultado posterior y son una de las
causas más frecuentes de que un estudio sea estadísticamente incorrecto.
Esto ocurre sobre todo cuando el investigador desconoce la naturaleza interna
de los test y se limita a aplicarlos sistemáticamente.
Es importante mencionar que si la distribución de los datos se ajusta a un tipo
de distribución conocida, existen otras [pruebas] que, en la práctica, son más
aconsejables pero que así mismo requieren otros supuestos. En este caso, la
estadística a emplear es la estadística paramétrica, dentro de la cual muchas
veces podemos encontrar equivalencias entre pruebas pero con diferencias en
la potencia entre ambas siendo siempre la potencia de las pruebas no
paramétricas menor que la potencia de las pruebas paramétricas equivalentes.
Aun así, el uso adecuado de los tamaños muestrales disminuye la posibilidad
de cometer un [error tipo II], puesto que aumenta al mismo tiempo la eficacia de
la prueba . Es decir, a medida que se aumenta el tamaño de la muestra,
disminuye la posibilidad de cometer un error tipo II (un falso negativo: No
rechazar la hipótesis nula cuando ésta en realidad es falsa).
Paramétricos
La estadística paramétrica es una rama de la estadística que comprende los
procedimientosestadísticos y de decisión están basados en las distribuciones
de los datos reales. Estas sondeterminadas usando un número finito de
parámetros. Esto es, por ejemplo, si conocemos que laaltura de las personas
sigue una distribución normal, pero desconocemos cuál es la media y
ladesviación de dicha normal. La media y la desviación típica de la desviación
normal son los dosparámetros que queremos estimar. Cuando desconocemos
totalmente que distribución siguennuestros datos entonces deberemos aplicar
primero un test no paramétrico, que nos ayude aconocer primero la
distribución.La mayoría de procedimientos paramétricos requiere conocer la
forma de distribución para lasmediciones resultantes de la población estudiada.
Para la inferencia paramétrica es requeridacomo mínimo una escala de
intervalo, esto quiere decir que nuestros datos deben tener un ordeny una
numeración del intervalo. Es decir nuestros datos pueden estar categorizados
en: menoresde 20 años, de 20 a 40 años, de 40 a 60, de 60 a 80, etc, ya que
hay números con los cuales realizarcálculos estadísticos. Sin embargo, datos
categorizados en: niños, jóvenes, adultos y ancianos nopueden ser
interpretados mediante la estadística paramétrica ya que no se puede hallar
unparámetro numérico (como por ejemplo la media de edad) cuando los datos
no son numéricos.
D) TÉCNICAS DE ANÁLISIS ESTADÍSTICAS BIVARIABLES.
-TABLAS BIDIMENSIONALES Y DE CONTINGENCIAS
Es difícil que en una muestra pequeña de individuos coincidan varios con el
mismo peso y talla simultáneamente, pero si la muestra es grande sí es posible
que esto ocurra. En ese caso los puntos de la nube correspondiente
aparecerían superpuestos y no se distinguirían. Para el caso de distribuciones
bidimensionales con frecuencias suelen utilizarse gráficos tridimensionales o
bien aumentar el tamaño de los puntos de la nube de forma proporcional a su
frecuencia.
Por ejemplo: considera la siguiente distribución bidimensional donde se
incluyen en la última fila las frecuencias de cada pareja.
A B C D E F G H I J
X 2 3 4 5 6 6 7 7 8 10
Y 1 3 2 4 4 6 4 6 7 9
Fi 1 1 3 4 4 2 3 1 1 1
E) La nube de puntos asociada sería la que aparece inicialmente en la
escena:
Modifica los puntos arrastrándolos o variando los valores en la parte inferior y
modifica sus frecuencia para observar lo que ocurre.
F)
G) Para simplificar más los cálculos, se utilizan las tablas de doble entrada:
Tabla de doble entrada. Está formada por tantas filas y columnas como valores
tengamos de cada una de las variables, más una fila y una columna más para
indicar los totales. Está indicada para casos con bastantes datos, en los que
para cada valor de una variable, existen varios valores de la otra.
H)
Frecuenci
a absoluta
x1 x2 ... xi ... xm
de la
variable Y
y1 f11 f21 ... fi1 ... fm1 Σfi1
y2 f12 f22 ... fi2 ... fm2 Σfi2
... ... ... ... ... ... ... ...
yj f1j f2j ... fij ... fmj Σfij
... ... ... ... ... ... ... ...
yn f1n f2n ... fin ... fmn Σfin
Frecuenci
a absoluta
Σf1j Σf2j ... Σfij ... Σf1n N
de la
variable X
I)
Escogiendo la primera y la última fila, tenemos la tabla estadística
correspondiente a la primera variable unidimensional. Con la primera y última
columnas construimos la tabla correspondiente a la segunda variable
unidimensional. Estas dos distribuciones reciben el nombre de distribuciones
marginales. En la última celda aparecerá el total de la última fila y de la última
columna, es decir, el número total de elementos estudiados (N).
Además, en esta tabla puede resultar de interés estudiar distribuciones
unidimensionales correspondientes a un valor determinado de alguna de las
variables, llamadas distribuciones condicionadas.
-CORRELACIÓN ENTRE RANGOS DE SPERMAN
Este coeficiente se emplea cuando una o ambas escalas de medidas de las
variables son ordinales, es decir, cuando una o ambas escalas de medida son
posiciones. Ejemplo: Orden de llegada en una carrera y peso de los atletas.
Se calcula aplicando la siguiente ecuación:
Nota: Los datos hay que traducirlos u ordenarlos en rangos. A los puntajes más
elevados le asignamos el rango 1 al siguiente el rango 2 y así sucesivamente.
Si se repiten dos puntajes o más se calculan las medias aritméticas.
Ejemplo ilustrativo N° 1: La siguiente tabla muestra el rango u orden obtenido
en la primera evaluación (X) y el rango o puesto obtenido en la segunda
evaluación (Y) de 8 estudiantes universitarios en la asignatura de Estadística.
Calcular el coeficiente de correlación por rangos de Spearman.
Estudiante X Y
Dyana 1 3
Elizabeth 2 4
Mario 3 1
Orlando 4 5
Mathías 5 6
Josué 6 2
Anita 7 8
Lucía 8 7
Solución:
Para calcular el coeficiente de correlación por rangos de Spearman de se llena
la siguiente tabla:
Se aplica la fórmula:
Por lo tanto existe una correlación positiva moderada entre la primera y
segunda evaluación de los 8 estudiantes.
En Excel se calcula de la siguiente manera:
a) Se inserta la función COEF.DE.CORREL y pulsar en Aceptar. En el cuadro
de argumentos de la función, en el recuadro de la Matriz 1 seleccionar las
celdas de X, y en el recuadro de la Matriz 2 seleccionar las celdas de Y. Pulsar
en Aceptar.
Ejemplo ilustrativo N° 2
La siguiente tabla muestra las calificaciones de 8 estudiantes universitarios en
las asignaturas de Matemática y Estadística. Calcular el coeficiente de
correlación por rangos de Spearman y realizar el diagrama de dispersión.
Estudiant Matemátic Estadístic
N°
e a a
1 Dyana 10 8
2 Elizabeth 9 6
3 Mario 8 10
4 Orlando 7 9
5 Mathías 7 8
6 Josué 6 7
7 Anita 6 6
8 Lucía 4 9
Solución:
Para calcular el coeficiente de correlación por rangos de Spearman se procede
a clasificar u ordenar los datos en rangos (X para Matemática y Y para
Estadística) tomando en cuenta las siguientes observaciones:
En la asignatura de Matemática se observa:
- Dyana tiene la más alta calificación, ocupando el primer puesto, por lo que su
rango es 1
- Elizabeth ocupa el segundo puesto, por lo que su rango es 2
- Mario se encuentra ubicado en el tercer lugar, por lo que su rango es 3
- Orlando y Mathías ocupan el cuarto y quinto puesto, por lo que su rango es la
media aritmética de 4 y 5 que da por resultado 4,5
- Josué y Anita ocupan el sexto y séptimo lugar, por lo que su rango es la
media aritmética de 6 y 7 que da por resultado 6,5
- Lucía se encuentra ubicada en el octavo lugar, por lo que su rango es 8
En la asignatura de Estadística se observa:
- Mario tiene la más alta calificación, ocupando el primer puesto, por lo que su
rango es 1
- Orlando y Lucía ocupan el segundo y tercer puesto, por lo que su rango es la
media aritmética de 2 y 3 que da por resultado 2,5
- Dyana y Mathías ocupan el cuarto y quinto puesto, por lo que su rango es la
media aritmética de 4 y 5 que da por resultado 4,5
- Josué se encuentra ubicado en el sexto lugar, por lo que su rango es 6
- Elizabeth y Anita ocupan el séptimo y octavo lugar, por lo que su rango es la
media aritmética de 7 y 8 que da por resultado 7,5
Los rangos X y Y se presentan en la siguiente tabla:
N° Estudiante Matemática Estadística X Y
1 Dyana 10 8 1 4,5
2 Elizabeth 9 6 2 7,5
3 Mario 8 10 3 1
4 Orlando 7 9 4,5 2,5
5 Mathías 7 8 4,5 4,5
6 Josué 6 7 6,5 6
7 Anita 6 6 6,5 7,5
8 Lucía 4 9 8 2,5
Aplicando la fórmula se obtiene:
Por lo tanto existe una correlación positiva muy baja
El diagrama de dispersión hecho en Graph se muestra en la siguiente figura:
-CORRELACIÓN LINEAL
Bajo el concepto de correlación se recogen varios procedimientos e indicadores
estadísticos utilizados para determinar el grado de asociacoón entre
dos variables; el más sencillo de ellos es el de correlación lineal que está
basado en la comparación de la varianza asociada de dos variables
(covarianza) y las desviaciones estándar de cada uno a través del cálculo del
coeficiente r de Pearson.
-ANÁLISIS DE LA VARIANZA Y DE LA COVARIANZA
*ANÁLISIS DE COVARIANZA.
El análisis de la covarianza es una técnica estadística que, utilizando un
modelo de regresión lineal múltiple, busca comparar los resultados obtenidos
en diferentes grupos de una variable cuantitativa, pero "corrigiendo" las
posibles diferencias existentes entre los grupos en otras variables que
puedieran afectar también al resultado (covariantes).
Supongamos que se está comparando la presión arterial sistólica de un grupo
de mujeres diabéticas según su nivel de estudios, para lo que efectuamos un
análisis de la varianza cuyos resultados se resumen a continuación:
Estadísita Descriptiva PAS
Sin estudios 1º grado 2º y 3º grado
Media 141,16 140,93 131,27
Desv.Típ. 13,67 16,23 18,03
Tamaño 215 202 60
Análisis de la varianza
Fuente var. Suma cuadrados gl Varianza F p Nivel signif.
Factor 5020,04 2 2510,02 10,61 0,0000310 p < 0.001
Residual 112119,55 474 236,54
Total 117139,59 476 246,09
Vemos que hay diferencias estadísticamente significativas en cuanto a la media
de la PAS entre los diferentes niveles de estudios, siendo inferior la media de
PAS en el grupo de mujeres con estudios de 2º o 3º grado (del orden de 10
mmHg inferior). Ahora bien, sabemos que uno de los principales factores de
riesgo en la hipertensión es la edad, por lo que nos podemos plantear que al
tratarse de un estudio observacional, en el que las pacientes han sido
seleccionadas de forma aleatoria entre las que acuden a la consulta, si éstas
fueran representativas de la población, es de sospechar que las mujeres con
mayor nivel de estudios sean en promedio más jóvenes, debido a que en el
pasado las mujeres solían a menudo recibir como mucho una formación
elemental.
Si para comprobarlo efectuamos un análisis de la varianza para la edad según
el nivel de estudios, los resultados que obtenemos son
-ANÁLISIS DE REGRESIÓN SIMPLE
La regresión lineal simple examina la relación lineal entre dos variables
continuas: una respuesta (y) y un predictor (x). Cuando las dos variables están
relacionadas, es posible predecir un valor de respuesta a partir de un valor
predictor con mayor exactitud.
Regresión ofrece la línea que "mejor" se ajusta a los datos. Esta línea se puede
utilizar después para:
Examinar cómo cambia la variable de respuesta a medida que cambia la
variable predictora.
Predecir el valor de una variable de respuesta (y) para cualquier variable
predictora (x).
-TEST JI-CUADRADA
Del mismo modo que los estadísticos “z”, con su distribución normal y “t”, con
su distribución t de Student, nos han servido para someter a prueba hipótesis
que involucran a promedios y porcentajes, el estadístico ji-cuadrado (o chi
cuadrado), que tiene distribución de probabilidad del mismo nombre, nos
servirá para someter a prueba hipótesis referidas a distribuciones de
frecuencias.
En primer lugar usaremos el estadístico ji-cuadrado para probar la asociación
entre dos variables, y luego lo usaremos para evaluar en qué medida se ajusta
la distribución de frecuencias obtenida con los datos de una muestra, a una
distribución teórica o esperada.
En términos generales, esta prueba contrasta frecuencias observadas con las
frecuencias esperadas de acuerdo con la hipótesis nula. Al igual que en el caso
de las pruebas anteriormente presentadas, ilustraremos con ejemplos.
Ji- cuadrado como prueba de asociación
Supongamos que un investigador está interesado en evaluar la asociación
entre uso de cinturón de seguridad en vehículos particulares y el nivel
socioeconómico del conductor del vehículo. Con este objeto se toma una
muestra de conductores a quienes se clasifica en una tabla de asociación,
encontrando los siguientes resultados:
Uso de Nivel Nivel Nivel TOTAL
cinturón socioeconómico socioeconómic socioeconómic
bajo o medio o alto
SI 8 15 28 51
NO 13 16 14 43
TOTAL 21 31 42 94
Tabla I. Tabla de asociación, valores observados.
¿Permiten estos datos afirmar que el uso del cinturón de seguridad depende
del nivel socioeconómico? Usaremos un nivel de significación alfa=0,05.
Los pasos del análisis estadístico en este caso son los siguientes:
1. En primer lugar se debe plantear las hipótesis que someteremos a prueba
H0: “El uso de cinturón de seguridad es independiente del nivel
socioeconómico”.
H1: “El uso de cinturón de seguridad depende del nivel socioeconómico”.
En esta prueba estadística siempre la hipótesis nula plantea que las variables
analizadas son independientes.
2. En segundo lugar, obtener (calcular) las frecuencias esperadas
Estas son las frecuencias que debieran darse si las variables fueran
independientes, es decir, si fuera cierta la hipótesis nula.
Las frecuencias esperadas se obtendrán de la distribución de frecuencias del
total de los casos, 51 personas de un total de 94 usan el cinturón y 43 de 94 no
lo usan. Esa misma proporción se debería dar al interior de los tres grupos de
nivel socioeconómico, de manera que el cálculo responde al siguiente
razonamiento: si de 94 personas 51 usan cinturón; de 21 personas, ¿cuántas
debieran usarlo?
La respuesta a esta pregunta se obtiene aplicando la “regla de tres” y es 11,4.
Este procedimiento debe repetirse con todas las frecuencias del interior de la
tabla.
El detalle de los cálculos es el siguiente:
Nivel bajo: (21x51/94)=11,4-(21x43/94)=9,6
Nivel medio: (31x51/94)=16,8-(31x43/94)=14,2
Nivel alto: (42x51/94)=22,8-(42x43/94)=19,2
Estas son las frecuencias que debieran presentarse si la hipótesis nula fuera
verdadera y, por consiguiente, las variables fueran independientes.
Estos valores los anotamos en una tabla con las mismas celdas que la anterior;
así tendremos una tabla con los valores observados y una tabla con los valores
esperados, que anotaremos en cursiva, para identificarlos bien.
Uso de
Nivel bajo Nivel medio Nivel alto TOTAL
cinturón
SI 11,4 16,8 22,8 51
NO 9,6 14,2 19,2 43
TOTAL 21 31 42 94
Tabla II. Tabla de asociación, valores esperados.
3. En tercer lugar se debe calcular el estadístico de prueba
En este caso, el estadístico de prueba es Ji-cuadrado que, como dijimos al
comienzo, compara las frecuencias que entregan los datos de la muestra
(frecuencias observadas) con las frecuencias esperadas, y tiene la siguiente
fórmula cálculo:
donde oi representa a cada frecuencia observada y ei representa a cada
frecuencia esperada.
De este modo el valor del estadístico de prueba para este problema será:
Entonces Este es el valor de nuestro estadístico de prueba que ahora,
siguiendo el procedimiento de problemas anteriores (paso 4), debemos
comparar con un valor de la tabla de probabilidades para ji-cuadrado (x2). Esta
tabla es muy parecida a la tabla t de student, pero tiene sólo valores positivos
porque ji-cuadrado sólo da resultados positivos. Véase gráfico 1, que muestra
la forma de la curva, con valores desde 0 hasta infinito.
Gráfico 1.
Dado que el estadístico ji cuadrado sólo toma valores positivos, la zona de
rechazo de la hipótesis nula siempre estará del lado derecho de la curva.
Uso de tabla ji-cuadrado
La tabla de ji-cuadrado tiene en la primera columna los grados de libertad y en
la primera fila la probabilidad asociada a valores mayores a un determinado
valor del estadístico (véase gráfico de la tabla III).
Los grados de libertad dependen del número de celdas que tiene la tabla de
asociación donde están los datos del problema y su fórmula de cálculo es muy
sencilla:
Grados de libertad (gl)=(nº de filas–1)x(nº de columnas–1)
Así, en nuestro ejemplo, en que hay 2 filas y 3 columnas, los grados de libertad
serán:
gl=(2-1)x(3-1)=2
Nótese que no se consideran la fila ni la columna de los totales.
Tabla III. Tabla de ji-cuadrado.
Al comienzo elegimos un nivel de significación alfa=0,05. Entonces un valor de
tabla para x2 asociado a 2 grados de libertad y alfa 0,05 es 5,99.
Por lo tanto, como en el gráfico 2 vemos que 5,23 se encuentra a la izquierda
de 5,99, la probabilidad asociada a valores superiores a 5,23 es mayor que alfa
(0,05).
Gráfico 2.
Según esto, debemos aceptar la hipótesis nula que plantea que las variables
“uso de cinturón de seguridad” y “nivel socioeconómico” son independientes.
Limitación: como norma general, se exige que el 80% de las celdas en una
tabla de asociación tengan valores esperados mayores de 5.
Ji-cuadrado como prueba de bondad de ajuste
También se puede usar el estadístico ji-cuadrado para evaluar cuán buena
puede resultar una distribución teórica, cuando pretende representar la
distribución real de los datos de una muestra determinada. A esto se le
llama evaluar la bondad de un ajuste. Probar la bondad de un ajuste es ver en
qué medida se ajustan los datos observados a una distribución teórica o
esperada.
Tomemos como ejemplo la distribución esperada para los individuos de una
población que son clasificados según grupo sanguíneo. Según estudios
realizados en población, se espera que dicha distribución, en porcentajes, sea
la siguiente:
Frecuencia
Grupo
esperada
AB 2,0%
A 30,5%
B 9,3%
0 58,2%
Tabla IV. Ejemplo de distribución esperada.
En una muestra de 150 dadores de sangre se encontró la siguiente
distribución:
Frecuencia
Grupo
observada
AB 4
A 48
B 15
0 83
Tabla V. Ejemplo de distribución observada.
1. Las hipótesis del problema son:
H0: los datos se ajustan a la distribución teórica.
H1: los datos no se ajustan a la distribución teórica.
2. Siguiendo el esquema general de solución propuesto para las pruebas de
hipótesis, ahora corresponde elegir un nivel de significación
Elegimos entonces alfa=0,01. El estadístico de prueba será ji-cuadrado, cuya
fórmula es:
Debemos calcular las frecuencias esperadas en nuestro grupo. Si aplicamos
los porcentajes esperados a la muestra de 150 casos podemos obtener las
siguientes frecuencias esperadas (ei):
Grupo Frec. oi Frec. ei
AB 4 3,00
A 48 45,75
B 15 13,95
0 83 87,30
Total 150 150,00
Tabla VI. Ejemplo de frecuencias esperadas.
Los grados de libertad de esta tabla se obtienen restando 1 al número de filas,
en este caso: gl=4-1=3
Recordemos que la fila del total no se considera para los grados de libertad.
Si ya tenemos las frecuencias observadas y esperadas, podemos proceder a
evaluar la diferencia entre ellas utilizando el estadístico ji-cuadrado. Si la
diferencia entre frecuencias observadas y esperadas es grande, significará que
la hipótesis nula es falsa, o sea, esta distribución no se ajusta a la distribución
teórica y si, en cambio, resulta que la diferencia entre frecuencias observadas y
esperadas no es muy grande, significará que la hipótesis nula es verdadera;
por lo tanto, la distribución en la muestra se ajusta a la distribución teórica y
diremos que no hay significación estadística.
El valor del estadístico de prueba (x2) es una medida de la diferencia entre
frecuencias observadas y esperadas; por lo tanto, mientras mayor resulte ,
más fácil será rechazar la hipótesis nula.
3. Se calcula el estadístico de prueba con los datos del ejemplo
4. Se compara este valor con el valor de ji-cuadrado de la tabla
El valor de ji-cuadrado lo buscaremos con alfa=0,01 y 3 grados de libertad.
Según tabla, ese valor es 11,34.
Al comparar el valor del estadístico de prueba (0,73) con el valor de tabla
(11,34), vemos que 0,73 se encuentra a la izquierda de 11,34 desplazado hacia
el centro de la curva y que, por lo tanto, la probabilidad de valores mayores a él
es muy superior al nivel de significación alfa=0,01.
5. Conclusión
Dado que la probabilidad de es mayor que alfa, se acepta la
hipótesis nula. Esto significa que los datos observados se ajustan a la
distribución teórica, por lo tanto las diferencias observadas no son
estadísticamente significativas.
6. Gráfico
3.5. INTERPRETACIÓN DE LOS RESULTADOS.
La penúltima fase del proceso de investigación la constituye la interpretación de
los resultados obtenidos, tanto a partir de las tabulaciones simples y cruzadas,
como de las técnicas de análisis uni-bivariable utilizadas. Estos resultados
confirmaran o refutaran las hipótesis planteadas, permitirán llegar a unas
conclusiones determinadas.
3.6. PREPARACIÓN Y PRESENTACIÓN DEL INFORME.
Todo el proceso de investigación, desde la determinación del problema, la
formulación del diseño de investigación, el trabajo de campo, la presentación y
análisis de datos y conclusiones alcanzadas, se presentara en un informe
escrito.
Se concreta en las siguientes actividades:
3.6.1. ELABORACIÓN DEL INFORME FINAL
El Informe Final es el último paso en el proceso de investigación.
Es un documento escrito que tiene el propósito de dar a conocer
algo: presentando
hechos y datos obtenidos y elaborados, su análisis e interpretación,
indicando los
procedimientos utilizados y llegando a ciertas conclusiones y recomendaciones.
Su objetivo es el de comunicar los resultados de una investigación
El Informe Final es el último paso en el proceso de investigación.
Es un documento escrito que tiene el propósito de dar a conocer
algo: presentando
hechos y datos obtenidos y elaborados, su análisis e interpretación,
indicando los
procedimientos utilizados y llegando a ciertas conclusiones y recomendaciones.
Su objetivo es el de comunicar los resultados de una investigación
El Informe Final es el último paso en el proceso de investigación.
Es un documento escrito que tiene el propósito de dar a conocer
algo: presentando
hechos y datos obtenidos y elaborados, su análisis e interpretación,
indicando los
procedimientos utilizados y llegando a ciertas conclusiones y recomendaciones.
Su objetivo es el de comunicar los resultados de una investigación
El Informe Final es el último paso en el proceso de investigación.
Es un documento escrito que tiene el propósito de dar a conocer
algo: presentando
hechos y datos obtenidos y elaborados, su análisis e interpretación,
indicando los
procedimientos utilizados y llegando a ciertas conclusiones y recomendaciones.
Su objetivo es el de comunicar los resultados de una investigación
El Informe Final es el último paso en el proceso de investigación.
Es un documento escrito que tiene el propósito de dar a conocer
algo: presentando
hechos y datos obtenidos y elaborados, su análisis e interpretación,
indicando los
procedimientos utilizados y llegando a ciertas conclusiones y recomendaciones.
Su objetivo es el de comunicar los resultados de una investigación
El Informe Final es el último paso en el proceso de investigación.
Es un documento escrito que tiene el propósito de dar a conocer
algo: presentando
hechos y datos obtenidos y elaborados, su análisis e interpretación,
indicando los
procedimientos utilizados y llegando a ciertas conclusiones y recomendaciones.
Su objetivo es el de comunicar los resultados de una investigacióUn informe
técnico es una forma especializada de exposición, que tiene por finalidad la
comunicación de información práctica y útil a una determinada persona o grupo
de persona que lo han solicitado o a quienes se dirige con fines bien
específicoUn buen informe debe constituir la carta de presentación de un
profesional, es por ello que se debe tener especial esmero en la elaboración y
redacción del mismo.
Un aspecto básico que hay que tener en cuenta a la hora de redactar un
informe es plantearse:
Ø ¿Sobre qué se va a escribir?
Ø ¿Quién lo va a leer?
Ø ¿Qué uso se le dará?
3.6.2. PRESENTACIÓN
Muchas veces el informe no solamente debe presentarse en forma escrita, sino
que debe hacerse ante personas que ya sea que conozcan del tema o bien sea
la primera ocasión que lo escuchen.
En la presentación oral del informe, es importante considerar el tipo de público
que lo va a escuchar, a fin de prepararse suficientemente para realizar una
exposición consistente y para responder cualquier pregunta o para atender los
comentarios que se deriven de lo expresado.
Es necesario tener en cuenta el tiempo asignado para la presentación. No
siempre el expositor decide sobre cuánto tiempo va a tardar su exposición, sino
que otros son los que le indican los límites. De tal forma que el expositor
siempre ha de respetar el tiempo acordado, por consideración a quienes
escuchan, para dejar espacio al debate o para que otro expositor continúe con
la actividad. Se cae en el error de hacer las presentaciones con la atención
dirigida exclusivamente a las ayudas audiovisuales sin contacto visual con el
público.
El buen uso del tiempo requiere capacidad de síntesis y adecuado manejo de
las ayudas audiovisuales que se pudieran necesitar. La síntesis se refiere a
comunicar lo esencial del informe, sin perder la unidad de su mensaje. La
claridad de las ideas expuestas y la calidad de los argumentos, son elementos
básicos de una adecuada estructuración del mensaje oral. La firmeza del
contenido del mensaje, pasa por el dominio del tiempo asignado, la claridad de
exposición y la capacidad de síntesis.
Las ayudas audiovisuales, son precisamente solo eso: ayudas. En ningún caso
las ayudas sustituyen la argumentación. El expositor se debe concentrar más
en el contacto visual con el público, que en el apego al texto o la imagen de sus
ayudas audiovisuales.
Las ayudas audiovisuales tienen que ser muy concretas, cuidadosamente
presentadas y sin recargos excesivos. Las personas del auditorio tienen que
tener la oportunidad de verlas desde el lugar en donde están ubicadas.
En el momento de contestar las preguntas, la persona que expone debe ser
clara, firme, respetuosa y comprensiva. Como pueden haber reacciones
favorables con lo que se expone, también pueden surgir reacciones en
contrario. Para ello se debe mantener la ecuanimidad, la objetividad y el
razonamiento, a sabiendas de que de la discusión siempre se obtendrán
nuevos conocimientos. El expositor debe mostrar flexibilidad para aceptar
sugerencias, correcciones o nuevas interpretaciones.
Ante una audiencia, un buen informe escrito puede dar al traste con el
contenido del mensaje, si no es acompañado de una convincente exposición.
No todos quienes escuchan un informe lo han leído previamente, sino que sus
juicios parten de lo que en ese momento están escuchando.
La exposición convincente no es la de pose demagógico o la llena de gestos y
palabrería, o la que se realiza con aparataje tecnológico sofisticado, sino la que
se logra mediante una comunicación eficiente, por respetuosa y fundamentada.
Una exposición convincente es la que lleva claridad en el mensaje.
3.6.3. SUSTENTACIÓN
Todos los avances y el trabajo final se deben sustentar.
Cada grupo debe preparar las estrategias de la presentación de la
sustentación, especialmente la entrega final donde se "vende el producto".
BIBLIOGRAFÍA
Shilshere (2012). fuentes de información comercial(internet) 12 de noviembre de 2016.
Disponible en: http://e-ducativa.catedu.es/44700165/aula/archivos/repositorio/2750/2775/
html/36_fuentes_de_informacin_comercial.html
Salgadoanoni (2010). observación (internet) 12 de noviembre de 2016. Disponible en:
http://www.salgadoanoni.cl/wordpressjs/wp-content/uploads/2010/03/la-observacion.pdf
Explo (2009). Metodología de la investigación educativa (internet). 12 de noviembre 2016.
Disponible en:
https://www.uam.es/personal_pdi/stmaria/jmurillo/InvestigacionEE/Presentaciones/
Entrevista_doc.pdf
Fitec (2009). El cuestionario en la investigacion(internet). 12 de noviembre 2016. Disponible
en: http://manuelgalan.blogspot.com/2009/04/el-cuestionario-en-la-investigacion.html
El rincón del vago. Métodos de muestreo(internet). 12 de noviembre de 2016. Disponible en:
http://html.rincondelvago.com/metodos-de-muestreo.html
ficha tecnica del estudio (2011). tipos de muestreo probabilísticos(internet). 12 de noviembre
del 2016. disponible en:
https://personal.ua.es/es/francisco-frances/materiales/tema3/tipos_de_muestreo_probabilsti
co.html
explorable. No probalistico(internet). 12 de noviembre del 2016. Disponible en:
https://explorable.com/es/muestreo-no-probabilistico
explorable. Probabilístico y aleotorizacion(internet). 12 de noviembre del 2016. Disponible en:
https://explorable.com/es/muestreo-probabilistico
monografías.com. calculo del tamaño de la muestra(internet). 12 de noviembre del 2016.
Disponible en: http://www.monografias.com/trabajos87/calculo-del-tamano-muestra/calculo-
del-tamano-muestra.shtml
universo formulas. Muestreom discrecional o por juicio(internet). 12 de noviembre del 2016.
Disponible en: http://www.universoformulas.com/estadistica/inferencia/muestreo-
discrecional/
el blog de de Ricardo Ruiz de Adan Perez. 2015. Recogida de datos en un estudio de
investigación(internet). 12 de noviembre del 2016. Disponible en:
http://ricardoruizdeadana.blogspot.com/2011/02/unidad-vi-recogida-de-datos.html
proyectodescartes. Tabulación de los datos(internet). 12 de noviembre del 2016. Disponible
en:
http://proyectodescartes.org/iCartesiLibri/materiales_didacticos/IntroduccionEstadisticaProba
bilidad/3ESO/3TabulacionDatos.html
eumed.net. la media aritmética (internet). 12 se noviembre del 2016. Disponible en:
http://www.eumed.net/libros-gratis/2007a/239/4a.htm
eumed.net. la media aritmética (internet). 12 se noviembre del 2016. Disponible en:
http://www.eumed.net/libros-gratis/2007a/239/4b.htm
eumed.net. la media aritmética (internet). 12 se noviembre del 2016. Disponible en:
http://www.eumed.net/libros-gratis/2007a/239/4c.htm
Universo formulas. Cuartiles (internet). 12 de noviembre del 2016. Disponible en:
http://www.universoformulas.com/estadistica/descriptiva/cuartiles/
Curiosoando. Que son los percentiles (internet). 12 de noviembre del 2016. Disponible en:
https://curiosoando.com/que-son-los-percentiles
Spss free. Medidas de dispersión varianza y desviación (internet). 12 de noviembre. Disponible
en: http://www.spssfree.com/curso-de-spss/analisis-descriptivo/varianza-desviacion-medidas-
de-dispersion.html
Spss free Medidas de Distibución - Asimetría y Curtosis (internet). 12 de noviembre del
2016. Disponible
en:http://www.spssfree.com/curso-de-spss/analisis-descriptivo/medidas-de-
distribucion-curtosis-asimetria.html
colposfesz.galeon.com. Medidas de dispersión (internet). 12 de noviembre del 2016.
Disponible en: http://colposfesz.galeon.com/est501/distfrec/meddisp/meddisp.htm
tests estaditicos (internet). 12 de noviembre del 2016. Disponible en:
http://ljk.imag.fr/membres/Bernard.Ycart/emel/cours/ts/ts.html
monografías.com. metodología de la investigación (internet). 12 de noviembre del 2016.
Disponible en:
http://www.monografias.com/trabajos59/metodologia-investigacion/metodologia-
investigacion2.shtml
Formulación de objetivos en investigación (internet). 12 de noviembre del 2016. Disponible en:
http://investigacionholistica.blogspot.com/2011/04/formulacion-de-objetivos-en.html
Monografías.com. investigación de mercado (internet). 12 de noviembre 2016. Disponible en:
http://www.monografias.com/trabajos22/investigacion-mercado/investigacion-
mercado.shtml#dise%C3%B1o
El rincón del vago. Tipos de investigación de mercado (internet). 12 de noviembre del 2016.
Disponible en: http://html.rincondelvago.com/conceptos-basicos-en-la-investigacion-de-
mercados.html
Técnicas de estudio. (Internet). 12 de noviembre del 2016. Disponible en:
http://www.tecnicas-de-estudio.org/investigacion/investigacion28.htm
Monografías.com. distribución de frecuencias para datos agrupados en intervalos (internet).
12 de noviembre del 2016. Disponible en:
http://www.monografias.com/trabajos87/distribucion-frecuencias-datos-agrupados-
intervalos/distribucion-frecuencias-datos-agrupados-intervalos.shtml
Wikipedia. Estadística no paramétrica (internet). 12 de noviembre del 2016. Disponible en:
https://es.wikipedia.org/wiki/Estad%C3%ADstica_no_param%C3%A9trica
Scrid.estadistica paramétrica. (Internet). 12 de noviembre del 2016. Disponible en:
https://es.scribd.com/doc/48078353/La-estadistica-parametrica-y-no-parametrica
Monografías.com.coeficiente de correlación de rangos de spearman (internet). 12 de
noviembre del 2016. Disponible en: http://www.monografias.com/trabajos85/coeficiente-
correlacion-rangos-spearman/coeficiente-correlacion-rangos-spearman.shtml
Ecured. Correlacion lineal (internet). 12 de noviembre del 2016. Disponible en:
https://www.ecured.cu/Correlaci%C3%B3n_lineal
SHE. Analisis de la covarianza y la varianza (internet). 12 de noviembre del 2016. Disponible en:
http://www.seh-lelha.org/ancova.htm
Soporte de minitab 17. Tipos de análisis de regresión (internet). 12 de noviembre del 2016.
Disponible en: http://support.minitab.com/es-mx/minitab/17/topic-library/modeling-
statistics/regression-and-correlation/basics/types-of-regression-analyses/
Medwave.ji-cudrada (internet). 12 de noviembre del 2016. Disponible en:
http://www.medwave.cl/link.cgi/Medwave/Series/MBE04/5266
Otro blog más de UCA Blogs. Metodología de la investigación (internet). 12 de noviembre
del 2016. Disponible en: http://blog.uca.edu.ni/jmedina/elaboracion-del-informe/
Shildesahre. Identificación de un problema (internet). 12 de noviembre del 2016. Disponible
en: http://es.slideshare.net/ptardilaq/identificacin-de-un-problema
El pensante. Investigación exploratoria (internet). 13 de noviembre del 2016. Disponible en:
https://educacion.elpensante.com/la-investigacion-exploratoria-que-es-y-en-que-consiste/
Manuel Galán Amador. Metodología de la investigación (internet). 13 de noviembre del 2016.
Disponible en: http://manuelgalan.blogspot.com/2010/12/determinar-la-poblacion-y-la-
muestra.html
Capítulo 3 diseños de muestreo (internet). 13 de noviembre del 2016. Disponible en:
http://www.fao.org/docrep/005/y3779s/y3779s08.htm
Prezi. Edición y codificación de los datos (internet). 13 de noviembre del 2016. Disponible en:
https://prezi.com/z2aavh7ro3ac/codificacion-edicion-y-preparacion-de-los-datos-para-su-
analisis/