CAPITULO 6:

Ministerio de Planificación Nacional y Política Económica

CAPITULO 6: LEVANTAMIENTO Y ANALISIS DE DATOS

1

MATERIAL DE APOYO PARA EL DISEÑO Y EJECUCIÓN DE EVALUACIONES ESTRATÉGICAS DE GOBIERNO

Apartado 6.1: Consideraciones previas al levantamiento de datos Material 6.1.1: La Medición: Variables, Indicadores e Índices LA MEDICIÓN: VARIABLES, INDICADORES, INDICES Cualquier evaluación implica de algún modo una tarea de medición de los conceptos que intervienen en la misma. Cuando se enfoquen variables aparentemente no observables (como por ejemplo la felicidad, actitudes), o complejas (pobreza, competitividad) se está ante la obligación de describir sus características o de relacionar estas variables con otras con las que pueden estar conectadas. En todo caso se tendría que utilizar determinadas variables que definan el comportamiento de estudio y se tendrá que encontrar el valor que éstas asumen en el caso estudiado. En eso consiste, desde el punto de vista lógico más general, la tarea de medir. La idea de medición o de medida, es intrínsecamente comparativa. Medir algo, en el caso más sencillo, es determinar cuántas veces una cierta unidad o patrón de medida, cabe en el objeto a medir. Para medir la longitud de un objeto físico, se desplaza una regla o cinta graduada sobre el mismo, observando cuantas unidades (en este caso centímetros o metros) abarca el objeto en cuestión. Es decir que comparamos el objeto con nuestro patrón de medición para determinar cuántas unidades y fracciones del mismo incluye.

1. Variables y Escalas de Medición En estadística, cuando se hace referencia al concepto de “variable”, se está hablando del carácter o fenómeno que se está estudiando en la realidad. Los “datos” son el producto de la medición de las variables del estudio. Una variable es aquello que varía o puede variar. Se trata de algo inestable, inconstante y mudable. En otras palabras, una variable es un símbolo que representa un elemento no especificado de un conjunto dado. Este conjunto es denominado conjunto universal de la variable o universo de la variable, y cada elemento del conjunto es un valor de la variable, por ejemplo: x es una variable del universo {2, 4, 6, 8}. Por lo tanto, X puede tener cualquiera de dichos valores, es decir que puede ser reemplazada por cualquier número par menor a nueve. Una variable es un elemento de una fórmula, proposición o algoritmo, que puede ser sustituido o puede adquirir un valor cualquiera dentro de su universo. Los valores de una variable pueden definirse dentro de un rango o estar limitados por condiciones de pertenencia. En términos generales, las variables pueden clasificarse en variables cualitativas, dependiendo si los valores presentados tienen o no un orden de magnitud natural (cuantitativas), o simplemente un atributo no sometido a la cuantificación (cualitativa). La diferencia entre varibales cualitativas y cuantitativas está relacionada con las escalas de medición las cuales son una sucesión de medidas que permiten organizar los datos.

2

SISTEMA NACIONAL DE EVALUACIÓN SINE – COSTA RICA


Las variables cualitativas, pueden agruparse en variables nominales u ordinales: Nominal: Cuando la información dada se puede clasificar en categorías no numéricas mutuamente excluyentes, entre las cuales no se puede establecer ninguna relación de orden, por tanto, no se puede fijar ningún origen que sirva de referencia (por ejemplo Sexo, Estado Civil, Nacionalidad) Ordinal: Este tipo de medidas es igual a la escala nominal, pero se diferencian de éstas ya que en este tipo de escalas si se puede establecer algún tipo de orden (de más a menos, de mayor a menor), existiendo algún punto de referencia para tal ordenación, por ejemplo Nivel de Estudios, Edad por tramos, Situación Económica). Para las variables cuantitativas se pueden distinguir dos niveles de escala, las de intervalo, y las de razón: De intervalo: La escala de intervalo mide las variables de manera numérica. Aunque a las categorías de variables cualitativas también se les asignen números, esto se hace solamente para etiquetarlos sin interpretar la cifra como una magnitud natural. En el caso de la escala de intervalo, por el otro lado, los números de la escala permiten establecer “distancias” exactas entre dos objetos de medición (por ejemplo, la temperatura en grados Celsius o Fahrenheit, donde para aumentar la temperatura en un grado es siempre la misma “distancia”). Es importante notar que en la escala de intervalo, el cero es un valor que no indica ausencia de la característica o variable medida (por ejemplo, ni cero grados Celsuis ni Fahrenheit es la total ausencia de energía térmica). Este repercute en que las operaciones aritméticas de suma y resta son perfectamente realizables, pero no así la multiplicación y división. De razón: La escala de razón tiene las mismas características que la escala de intervalo, pero adicionalmente se define un valor cero “natural” (no arbitrario) donde el cero es un valor que indica una ausencia total de la característica que se está midiendo (por ejemplo, salario en Colones, peso en kg). Esto es una diferencia importante, dado que ahora sí se permiten las operaciones aritméticas de multiplicación y división. Por ende, la escala de razón, es el nivel de escala más alto. Para las variables cuantitativas, sean de intervalo o de razón, además se pueden distinguir variables discretas y continuas: Discretas: La variables se denomina discreta cuando el número o valores potenciales que la variable puede asumir dentro de un intervalo determinado es contable, o finita. Esto es el caso, por ejemplo, para la variable “Número de habitantes de una comunidad X” dado que no existen fracciones de la unidad “habitante” (“medio habitante”, por ejemplo). Continuas: En el caso de las variables continuas, los valores pueden asumir cualquier valor dentro de un intervalo, por lo cual el número de valores potenciales es infinito. Por ejemplo, la variable “peso en kg” puede generar valores con cualquier fracción de 1kg (gramos, miligramos, microgramos), limitado solamente por la capacidad del instrumento de medición. En lo anterior, ya se ha mencionado que las operaciones matemáticas permitidas dependen del nivel de escala, donde un nivel de escala más alto permite siempre todas las operaciones de los niveles más bajos, más algunos que requieren un determinado nivel de escala mínimo. La siguiente tabla resume los más frecuentes cálculos estadísticos y su relación con los niveles de escala:

3


Tabla 1: Cálculos estadísticos descriptivos de acuerdo a la escala de medición Tipo de operación

Nivel de escala (o asosciación entre variables)

Técnica estadística

Variables individuales (Análisis univariado)

Nominales

-‐ Frecuencias -‐ Proporciones -‐ Porcentajes

Variables individuales (Análisis univariado)

Ordinales

-‐ Frecuencias acumuladas -‐ Cuartiles, Percentiles -‐ Mediana

Variables individuales (Análisis univariado

Numéricas (intervalo o razón)

-‐ Media aritmética -‐ Desviación estándar -‐ Curtosis y oblicuidad

Asociación entre variables

Categóricas (nominales u ordinales) con categóricas

-‐ Tablas de contingencia -‐ Medidas de asociación: Kendall, Kramer, Spearman y otros


Categórica con numérica

-‐ Comparación de medias -‐ Análisis de varianza -‐ Medida de asociación: Eta


Numérica con numérica

-‐ Coeficiente de correlación (r) -‐ Análisis de regresión

2. Indicadores. El término de indicador se puede definir como las unidades de medida que deben informar acerca de un estado de las cosas definidas, las cuales no pueden ser medidas directamente o es difícil su medición ya sea cuantitativamente o cualitativamente. Esto implica la tarea de establecer una conexión lógica entre un concepto teórico, como por ejemplo “pobreza” y sus dimensiones y las respectivas variables que permiten la determinación de una regla para clasificar una persona como “pobre” o “no pobre” (al tratarse de crear categorías) o determinar el grado exacto de pobreza (al tratar de lograr una medición métrica del concepto). Dentro del marco de una Evaluación, se toman los valores medidos empíricamente por medio de un Indicador, comparados con valores de comparación (valor antes de iniciar la intervención, valor de una meta, entre otros), como base para efectuar las valoraciones. En otras variables, la utilidad del indicador consiste en contribuir información para dar respuesta a las interrogantes de la evaluación. Por lo tanto, en el proceso de la operacionalización del indicador se debe definir teóricamente qué es lo que en realidad interesa: ¿Cuál es el objetivo de la medición? ¿Qué conceptos forman parte de la teoría de cambio de la intervención a evaluar? ¿Y a través de qué variables se pueden hacer accesibles a la medición? Identificados dichos conceptos y posibles variables de medición (indicadores), es de suma importancia justificar explícitamente cuál es la relación entre el indicador medible y el concepto subyacente que es el objetivo de la medición: ¿Por qué suponemos que el indicador efectivamente mide dicho objeto o concepto. Finalmente, como para toda variable de estudio, se debe operacionalizar metodológicamente la medición

4



del indicador, es decir, determinar las escalas de medición: en caso de variables cuantitativas, la unidad de medida; en caso de variables cualitativas las diferentes categorías de clasificación para las unidades de investigación. Finalmente se debe definir la forma de determinar empíricamente la medida en que el indicador efectivamente cumple el objetivo de la medición (regla de falsificación para la correspondencia entre el indicador a el objetivo de medición). Resumen del proceso de operacionalización (Meyer, en Stockmann, 2010). El proceso de la Operacionalización Paso 1: Determinación del objeto teórico a observar y de un Indicador potencial (¿Qué se pretende operacionalizar y de qué manera?) Paso 2: Definición de una regla de correspondencia lógicamente derivada y que no sea afectada por la medición (¿Por qué mide el Indicador el objeto?) Paso 3: Determinación de las escalas y unidades/categorías para la medición (¿Con qué exactitud debe medir el Indicador?) Paso 4: Determinación de falsificadores de la regla de correspondencia (¿Cuándo esta clasificación entre el Indicador y el Objeto es insuficiente)

A diferencia de las ciencias naturales, en las ciencias sociales en general -‐ y la evaluación de intervenciones públicas en particular -‐ la conceptualización del indicador y la medición son un proceso social, que inicia con la comunicación de las características a medir, continúa con discusiones acerca de la operacionalización en indicadores y ciertas formas de escalas e índices y finalmente, termina en discusiones acerca de la interpretación de los resultados y la calidad de las mediciones efectuadas. La complejidad de este proceso conlleva que los indicadores, para contribuir al objetivo de la evaluación, deben cumplir con varios requerimientos de calidad los cuales según Meyer (2010) se pueden resumir en cuatro categorías principales: • Desde la perspectiva teórica, deben cumplir con la calidad de la operacionalización, de acuerdo a los pasos arriba especificados. Si no se cuenta con una suficiente correspondencia entre el indicador y el objetivo de la medición, el indicador puede generar mediciones técnicamente precisas y sin embargo, no válidas para los fines de la evaluación. • Desde la perspectiva metodológica, deben cumplir con la calidad de la medición. El indicador debe medir aquello para lo cual fue creado (validez) y al realizarse mediciones repetitivas bajo circunstancias iguales, siempre debe generar el mismo resultado (confiabilidad). Este requiere una definición precisa de las herramientas y procedimientos de medición. •

Desde la perspectiva práctica, deben cumplir con la calidad de la ejecución (viabilidad), con frecuencia los limitados recursos disponibles en cuanto a tiempo, personal y recursos financieros, impiden la aplicación de los mejores instrumentos de medición aunque estas respondan a todos los

5


•

requerimientos teóricos y metodológicos. Por ende, se requiere de cierto pragmatismo en la construcción y selección de los indicadores. En comparación con otros contextos de investigación aplicada, en las evaluaciones de intervenciones públicas las limitaciones prácticas suelen ser significativamente más grandes. Desde una perspectiva de enfoque político, deben cumplir con el requerimiento en lo que se refiere a la calidad del reconocimiento o aceptación de un indicador por parte de los participantes. La medida en que los resultados de las mediciones son aceptados por los involucrados para la toma de decisiones y en que el indicador se interpreta de manera uniforme, no depende solamente de criterios conceptuales y metodológicos sino del grado en que se ha logrado un consenso entre todos los involucrados. En la intervención de intervenciones públicos es muy común que existan intereses políticos relacionados con la selección de determinados indicadores, de manera que la misma operacionalización llega a ser una tarea política al igual que conceptual/técnica.

3. Índices 3.1. Definición y aplicación de índices Los índices son indicadores para medir objetos de medición altamente complejos. Un índice combina, a su vez, una serie de otros indicadores más sencillos y al hacerlo enlaza diferentes dimensiones de una estructura teórica en una sola escala de medición. De esta manera, un índice se puede definir como un número que engloba un amplio contenido de información, la cual se expresa de manera simple en una sola cifra. Por lo mismo, para entender el mensaje que arroja el valor de un índice es importante tener un entendimiento, al menos general, de las variables que lo conforman. Los números índices se caracterizan por ser valores relativos (no absolutos), ya que ellos son resultado de un procesamiento matemático que combina variables con distintas unidades de medición, y a veces, distintos niveles de escala. Por lo tanto, no puede producirse una magnitud “natural”. La importancia de los números índices reside en que logran representar una realidad compleja a través de un valor sencillo, el cual sin embargo es sustentado por un amplio espectro de información. Este permite que un solo índice pueda mostrar claramente la evolución en el tiempo de un objeto complejo de medición. Sus resultados, por estar basados convierten a los números índices en bases concretas para la toma de decisiones, la evaluación de situaciones y la predicción de situaciones futuras. Los números índices son muy versátiles, lo que los hace aplicables a cualquier ciencia o campo de estudio. Como todo indicador, esencialmente se usan para hacer comparaciones (entre distintas unidades de investigación, entre distintos momentos en el tiempo). Tres ejemplos: • Un psicólogo usa los números índices para comparar la inteligencia relativa de estudiantes en sitios diferentes, en años diferentes, con trasfondo social diferente, etc. • Un asesor de capital observa el comportamiento de Indice Dow Jones para estar al tanto de las tendencias en la bolsa de acciones.

6



•

Funcionarios de la Caja de Seguro Social observan el índice de natalidad para elaborar pronósticos acerca de la sostenibilidad del contrato generacional que sostiene el sistema del seguro social.

Con base a estos tipos de índices se realizan valoraciones acerca del estado de objetos sumamente complejos, y sin embargo, una sola cifra puede dar indicaciones válidas con respecto a la toma de decisiones.

3.2.

Ventajas y desventajas de índices

Por un lado una de las ventajas de trabajar con índices es que con una sola cifra, pueden representar complejas interrelaciones y desarrollos, permitiendo la realización de las correspondientes valoraciones, también facilita comparar los cambios en diferentes tipos de información. La elaboración de números índices tiene sentido en variables de naturaleza cuantitativa. El índice, por estar definido por un cociente, es independiente de las unidades de medida en las que venga expresada la variable, con lo que se puedan efectuar agregaciones de distintos índices, construyéndose indicadores de evolución general de todo tipo de fenómeno. Por el otro lado, una de las desventajas de utilizar índices es que son muy abstractos, por lo que resulta muy difícil comprender lo que la cifra representa. Si un índice se utiliza como única orientación para actuar, puede conducir por un camino equivocado ya que siempre se está ante la presencia de aspectos que no se toman en cuenta lo suficientemente y no son abarcados por los índices, que en muchos casos, puede llevar a feroces discusiones acerca de la adecuada interpretación de un índice. Para entender eso, uno debe tan solo imaginarse como del crecimiento del BIP, la cuota del desempleo, y la tasa de inflación se suele extrapolar a “estado de la nación” y como, en el debate político, cada parte termina dando una lectura distinta a los valores de los índices aunque estos estén matemáticamente precisos.

3.3.

Tipos de números índices

3.3.1

Índices simples y compuestos

Indices simples Un índice simple es cuando la operación matemática que lo conforma se realiza en base a una sola magnitud. En cambio, cuando se trabaja con más de una magnitud a la vez, se conforman índices complejos. En cualquiera de los dos casos se compara siempre dos situaciones, una de las cuales se considera de referencia. Cuando, por ejemplo, las comparaciones son temporales, el índice se calcula en base a un momento o período base, frente al momento o periodo actual con el que se realiza la comparación: En este caso se le asigna al período de referencia el valor 100, lo cual implica que el número índice simple que resulta de esta operación no es otra cosa que un porcentaje. Se trata de los porcentajes de cada valor de la magnitud con respecto al valor de referencia o base. Este tipo de índice, al ser un porcentaje definidos sobre los propios valores de la variable, hace que sean adimensionales (es decir no tienen una unidad de medida como kg, unidades monetarias, etc.), lo que permite la comparación de las variaciones de distintas variables aunque estas se midan en unidades diferentes.

7


Ejemplos: En la Economía, como uno de los campos de mayor aplicación de los números índices, los números índices más habituales utilizados hacen referencia a precios (basándose en variables medidas en unidades monetarias por unidad física), cantidades (medidos en unidades físicas) y valor (medidos en unidades monetarias). • El índice de precios es el de mayor uso, compara los cambios en el precio entre dos períodos. El índice de precios al consumidor mide los cambios globales de precio de varios bienes de consumo y también de los servicios y se utiliza para definir el costo de vida. Uno de los ejemplos más simples de un número índice es una relación de precios, que no es sino el cociente entre el precio de un artículo en un período dado y su precio en otro período, conocido como período base o período de referencia. • Por su lado el índice de cantidad, mide cuánto cambia en el tiempo el número o cantidad de una variable, en vez de comparar los precios de un artículo, lo que interesa es comparar las cantidades (o volúmenes) de producción, consumo o exportación. En tales casos se habla de relaciones de cantidad o relaciones de volumen. • En cuanto al Índice de valor, este mide los cambios del valor monetario total, mide los cambios en el valor monetario de una variable. En efecto, combina los cambios de precio y cantidad para presentar un índice más informativo, por ejemplo si “p” es el precio de un artículo durante un periodo y “q” es la cantidad (o volumen) producida, vendida, etc. Durante ese periodo, entonces “pq” se llama el valor total. Indices compuestos Este tipo de índice puede consistir: a) en la agregación de distintos índices simples elaborados. Retomando uno de los ejemplos anteriores, esto podría darse combinando los índices de precios para diversos bienes y uniéndolos en un índice agregado. Todas las variables empleadas todavía se basarían en la misma unidad de medida. b) En otros casos, también se agregan índices basados en variables con distintas unidades de medición y que incluso pueden estar midiendo objetos aparentemente no relacionados uno con el otro. Por ejemplo, el Indice de Desarrollo Humano (IDH) agrega índices basados en variables tan dinstintas como las expectativas media de vida, la permanencia media en la educación escolar, y el Producto Bruto Interior per cápita de la población en una zona determinada. Nótese que la situación referencial en que se basa dicho índice no es una comparación temporal, sino cociente basado en los máximos y mínimos de las zonas estudiadas. Lo anterior evidencia que la agregación de un índice puede realizarse según muy diversos métodos o procedimientos, siguiendo algunas propiedades, tales como que el resultado sea un número índice sencillo y que en el mismo se reúna gran cantidad de información.

8



En la medida en que se el índice contempla más de una variable, se plantea la pregunta ¿cuánto peso deberá tener el valor de cada componente para determinar el valor del número índice final?. Según cual sea la respuesta, se tienen dos categorías de índices compuestos distintas: • En los índices compuestos no ponderados prevalece el criterio de la sencillez frente al de la información y cada componente tendrá el mismo peso. • En los índices compuestos ponderados se prima la información frente a la sencillez y se busca ponderar el peso de cada componente de acuerdo a la importancia relativa que tiene, ante los otros componentes, para determinar las variaciones del objeto de medición en la “realidad”.

3.3.1

Índices de agregados ponderados y no ponderados

Índices no ponderados Los precios de varios artículos o mercancías sencillamente podrían sumarse tanto para el caso del período dado como para el del período base, respectivamente y después compararse y la forma más sencilla de un índice compuesto es el índice no ponderado de agregados. No ponderado significa que todos los valores incluidos al calcular el índice tienen igual importancia. Agregado significa que se suman todos los valores. La principal ventaja de este índice es su simplicidad. El índice no ponderado de agregados se obtiene sumando todos los elementos del compuesto durante cierto periodo y dividiendo después el resultado entre la suma de los mismos elementos durante el periodo base. Dentro de esta categoría, el más sencillo es el que define el índice compuesto como la media aritmética simple de los índices simples. Al mismo se le conoce como Índice de Sauerbeck, utilizado para precios y cantidades, respectivamente, otro índice compuesto no ponderado utilizado es el que se conoce como el de la media agregativa simple o de Bradstreet-‐Dutot. Este consiste en sumar, cuando se trata de un índice de precios, los precios de todos los bienes para un periodo y obtener la media de esos precios. Con la serie resultante se obtendría un índice simple que es, de hecho, compuesto, pues en el mismo se han reunido los precios de más de un bien. Este procedimiento tiene el inconveniente, frente al anterior, de que suma inicialmente magnitudes que puede que no sean homogéneas, lo que lleva a que el índice resultante pierda precisión. Índices ponderados Con el fin de evitar las desventajas del índice no ponderado de agregados, en el caso del índice de precios se asigna un peso al precio de cada artículo, en general la cantidad (o volumen) vendida durante el año base, durante el año dado. Por lo general, se tiene que atribuir mayor importancia a los cambios de algunas variables que a los de otras al calcular un índice. Considerar este hecho mediante las respectivas ponderaciones permite incluir más información al índice sin que este pierda su precisión.

9


BIBLIOGRAFÍA

CANSADO, Enrique. (1975). Curso de estadística general. Centro interamericano de enseñanza de estadística (CIENES), Santiago de Chile. KASMIER, Leonard J. (2000). Estadística aplicada a la administración y a la economía. 3era edición. México, Mcgraw-‐Hill. LEVIN, Richard. (1996). Estadística para administradores. Sexta edición. Pearson educación. MURRAY, Spiegel. (1991). Estadística. 2da edición. México, Mcgraw-‐Hill. ROSENBAUM, Roberta S. Y HIGHLAND, Esther H. (1987). Matemáticas Financieras, 3era edición. Prentice Hall. YAMANE, Taro, Ed. Harla. ESTADISTICA, México DF. 1979. SÁNCHEZ FERNÁNDEZ, Jesús Introducción a la Estadística Empresarial. Capítulo 5.-‐ Números índices.

10



Material 6.1.2: Muestreo Texto: Casal, J. & Mateu, E. (2003): Tipos de Muestreo, en: Riv. Epidem. Med. Prev., No. 1, 2003, pp. 3-‐ 7. Accesible en línea en: http://minnie.uab.es/~veteri/21216/TiposMuestreo1.pdf Tipos de muestreo

Rev. Epidem. Med. Prev. (2003), 1: 3-7

TIPOS DE MUESTREO Jordi Casal1, Enric Mateu CReSA. Centre de Recerca en Sanitat Animal / Dep. Sanitat i Anatomia Animals, Universitat Autònoma de Barcelona, 08193-Bellaterra, Barcelona

RESUMEN Se discute la utilidad del muestreo y se describen los distintos tipos de muestreo que se pueden aplicar para tomar una muestra de la población. La selección intencionada o muestreo por conveniencia consiste en un muestreo no aleatorio, por lo que suele presentar sesgos. El muestreo aleatorio puede realizar se varias maneras. El muestreo aleatorio simple consiste en elegir cada uno de los individuos al azar mediante números aleatorios. El muestreo sistemático consiste en elegir el primer individuo al azar y el resto de manera sistemática. El muestreo aleatorio estratificado consiste en dividir la población en grupos en función de una característica determinada y realizar a continuación el muestreo proporcionalmente. Finalmente el muestreo por conglomerados consiste en definir grupos de características semejantes e incluir en la muestra varios de estos grupos. Para cada método se discuten las ventajas e inconvenientes.

INTRODUCCIÓN En sanidad animal podemos necesitar información sobre una población para determinar la prevalencia de una enfermedad o infección subclínica, para determinar simplemente la presencia o la ausencia de una enfermedad o bien puede interesarnos conocer posibles causas o factores de riesgo mediante estudios epidemiológicos. En cualquiera de estos casos, podemos analizar toda la población, es decir, realizar un censo, o bien examinar sólo una parte de ella mediante un muestreo. Si examinamos toda la población, podemos conocer exactamente la distribución que presenta la variable o las variables estudiadas en dicha población. Sin embargo, en la mayoría de los casos, los censos son inviables o como mínimo innecesarios. Los censos son lentos y caros (hay que examinar una gran cantidad de individuos, lo cual requiere tiempo y dinero) y poco flexibles (debido a su complejidad, es muy difícil modificarlos cuando se han puesto en marcha). Tratar una gran cantidad de individuos requiere disponer de personal entrenado, instalaciones (laboratorios, centros de tratamientos de datos,...) que no siempre están disponibles, en estos casos un censo puede ser irrealizable, o bien puede realizarse sin los recursos necesarios, de modo que, los datos obtenidos pueden contener errores y por

1

[email protected]

3

11


Tipos de muestreo


tanto, en contra de lo que parece inicialmente, no necesariamente van a proporcionar una buena información. Una alternativa a los censos será la medición de estas variables en una parte de la población, es decir, en una muestra. Trabajar con una muestra de la población tiene la ventaja de que es más rápido, más barato y los resultados obtenidos pueden ser más precisos, de modo que, si la muestra se elige correctamente, la información que obtenemos permite una estimación razonable de la situación de la población. Cuando nos planteamos tomar una muestra, surgen dos preguntas: ¿Qué individuos debo incluir en la muestra? ¿Cuántos individuos debo tomar? En este capítulo intentaremos responder a la primera pregunta, mientras que en el siguiente trataremos la segunda. Cuando el objetivo es conocer la cantidad de enfermedad o cuando queremos realizar un estudio epidemiológico cuyos resultados debemos extrapolar a la población general, un requisito indispensable es que la muestra sea representativa de la población general, por tanto la muestra debe tomarse al azar. Cuando el objetivo es conocer si una enfermedad existe o no en una población, también podemos tomar una muestra aleatoria, pero en la mayoría de los casos, lo más apropiado será tomar una muestra sesgada, de modo que analizaremos aquellos individuos que tienen mayor posibilidad de estar enfermos. La mejor opción para obtener una muestra representativa es elegir los individuos al azar mediante un muestreo aleatorio, es decir, seleccionando los individuos de manera que todos ellos tenga la misma probabilidad de formar parte de la muestra. Cuando estos no es posible la alternativa será elegir a los individuos según un muestreo de conveniencia. El método para elegir la muestra recibe el nombre de muestreo. Para describir el proceso del muestreo, debemos utilizar una terminología precisa que facilitarán la comprensión de algunas partes de estos temas: ? Población total o población objetivo. Es el grupo de individuos del que se pretende obtener información. ? Población estudiada. A menudo, la población no es accesible en su totalidad, y deberemos trabajar sólo sobre una parte de ella, que será. Por tanto la población estudiada será la población de la que se obtiene la muestra. ? Marco de la encuesta. Es el listado de los individuos de la población. A veces, no es necesario disponer de todo el listado, p. ej en el muestreo por conglomerados ? Unidad de la encuesta. Es cada individuo de la población estudiada (animales, granjas, municipios, etc.) Según el tipo de muestreo se puede diferenciar entre unidades primarias, secundarias, etc. ? Fracción de la encuesta. Es la proporción de individuos de la población estudiada que forma parte de la muestra. ? Sesgo. Son los errores sistemáticos (diferentes de los errores de estimación).

4

12



Tipos de muestreo


EL MUESTREO POR SELECCIÓN INTENCIONADA O MUESTREO DE CONVENIENCIA Consiste en la elección por métodos no aleatorios de una muestra cuyas características sean similares a las de la población objetivo. En este tipo de muestreos la “ representatividad” la determina el investigador de modo subjetivo, siendo este el mayor inconveniente del método ya que no podemos cuantificar la representatividad de la muestra. Presenta casi siempre sesgos y por tanto debe aplicarse únicamente cuando no existe alternativa. En algunos casos, especialmente cuando se requiere una estrecha colaboración por parte de los ganaderos o veterinarios de campo, es la única opción para que el estudio sea viable. Supongamos que queremos realizar un estudio longitudinal consistente en tomar muestras de los animales de la explotación cada mes, o llevar diariamente unos registros determinados de la granja, la mejor opción será realizar el estudio en granjas de confianza que permitan las manipulaciones y tengamos garantías de que el trabajo se llevará a cabo correctamente. También puede ser útil cuando se pretende realizar una primera prospección de la población o cuando no existe un marco de la encuesta definido. Este tipo de muestreos puede incluir individuos próximos a la media o no, pero casi nunca representará la variabilidad de la población, que normalmente quedará subestimada. EL MUESTREO ALEATORIO En el muestreo aleatorio todos los elementos tienen la misma probabilidad de ser elegidos. Los individuos que formarán parte de la muestra se elegirán al azar mediante números aleatorios. Existen varios métodos para obtener números aleatorios, los más frecuentes son la utilización de tablas de números aleatorios o generarlos por ordenador. El muestreo aleatorio puede realizarse de distintas maneras, las más frecuentes son el muestreo simple, el sistemático, el estratificado y el muestreo por conglomerqados. Muestreo aleatorio simple. Es el método conceptualmente más simple. Consiste en extraer todos los individuos al azar de una lista (marco de la encuesta). En la práctica, a menos que se trate de poblaciones pequeñas o de estructura muy simple, es difícil de llevar a cabo de forma eficaz. Ejemplo: Se pretende determinar la prevalencia de Maedi en una explotación de 250 ovejas: para ello se deben examinar 61 animales (se supone una prevalencia del 30% y se desea una precisión del 10% para un nivel de confianza del 95%): se obtienen 61 números

Figura 1. Representación gráfica del muestreo aleatorio simple. 5

13


Tipos de muestreo


entre el 1 y el 250 de una tabla de números aleatorios y se sangran los animales correspondientes (en función del número de crotal o según el orden por el que se hacen pasar por una manga). Muestreo sistemático. En este caso se elige el primer individuo al azar y el resto viene condicionado por aquél. Este método es muy simple de aplicar en la práctica y tiene la ventaja de que no hace falta disponer de un marco de encuesta elaborado. Puede aplicarse en la mayoría de las situaciones, la única precaución que debe tenerse en cuenta es comprobar que la característica que estudiamos no tenga una periodicidad que coincida con la del muestreo (por ejemplo elegir un día de la semana para tomar muestras en un matadero, ya que muchos ganaderos suelen sacrificar un día determinado).

Figura 2. Representación gráfica del muestreo aleatorio sistemático.

Ejemplo: En el caso anterior debemos tomar uno de cada cuatro animales (250/61); en vez de tomar 61 números aleatorios tomamos sólo uno (entre el uno y el cuatro), por ejemplo el número 3, de modo que tomaremos la oveja número 3, y a continuación cada cuarto animal (la 7, la 11, la 15 y así sucesivamente hasta llegar a la 247). Muestreo aleatorio estratificado. Se divide la población en grupos en función de un carácter determinado y después se muestrea cada grupo aleatoriamente, para obtener la parte proporcional de la muestra. Este método se aplica para evitar que por azar algún grupo de animales este menos representado que los otros. El muestreo estratificado tiene interés cuando la característica en cuestión puede estar relacionada con la variable y% x% que queremos estudiar. Cuando se y% realiza un muestreo cuya unidad sean las granjas, la estratificación se aplica z% z% frecuentemente en relación al tamaño w% de granja o a la aptitud de los animales, w ya que muchas enfermedades presentan % prevalencias diferentes en función del tamaño de la granja o a si se trata por Figura 3. Representación gráfica del muestreo ejemplo de razas de aptitud lechera o aleatorio estratificado. cárnica. Si la unidad son los animales, se suele estratificar en función de la edad ya que ésta suele influir en muchas enfermedades.

x%

N

n

Ejemplo: La probabilidad de que una oveja esté infectada de Maedi está directamente relacionada con la edad. En el ejemplo anterior, la explotación tiene el 44% de los animales de menos de 2 años, el 28% de 3-4 años, el 18% de 5-6 y el 10% son animales de más de seis años: el 44% de los 61 animales de la muestra (27 animales) se tomará al azar

14

6 SISTEMA NACIONAL DE EVALUACIÓN SINE – COSTA RICA


Tipos de muestreo


entre los de 1-2 años, el 28% entre los de 3-4 años y así sucesivamente (17, 11 y 6 animales de los otros tres grupos). Este método evita que por casualidad (por azar) se tomen más individuos de un grupo que de los demás y esto pueda condicionar el resultado. Muestreo aleatorio por conglomerados. Se divide la población en varios grupos de características parecidas entre ellos y luego se analizan completamente algunos de los grupos, descartando los demás. Dentro de cada conglomerado existe una variación importante, pero los distintos conglomerados son parecidos. Requiere una muestra más grande, pero suele simplificar la recogida de muestras. Frecuentemente los conglomerados se aplican a zonas geográficas.

Figura 4. Representación gráfica del muestreo aleatorio por conglomerados.

Muestreo mixto. Cuando la población es compleja, cualquiera de los métodos descritos puede ser difícil de aplicar, en estos casos se aplica un muestreo mixto que combina dos o más de los anteriores sobre distintas unidades de la encuesta. Ejemplo: se pretende determinar la prevalencia de una determinada infección en una comarca: se dividen las explotaciones en tres grupos en función de su tamaño y se realiza un muestreo estratificado, en las granjas que forman la muestra se realiza un muestreo sistemático para elegir los individuos que se analizarán.

15 7


Material 6.1.3: Muestreo en la investigación cualitativa Texto: Martín-‐Crespo, M. & Salamanca Castro, A. (2007): El muestreo en la investigación cualitativa. Madrid: FUDEN. Accesible en línea en: http://www.fuden.es/FICHEROS_ADMINISTRADOR/F_METODOLOGICA/FMetodologica_27.pdf Es habitual que en investigación cualitativa el diseño del estudio evolucione a lo largo del proyecto, por eso se dice que es emergente. En el caso del muestreo sucede lo mismo, la decisión sobre el mejor modo de obtener los datos y de quién o quiénes obtenerlos son decisiones que se toman en el campo, pues queremos reflejar la realidad y los diversos puntos de vista de los participantes, los cuales nos resultan desconocidos al iniciar el estudio. En los estudios cualitativos casi siempre se emplean muestras pequeñas no aleatorias, lo cual no significa que los investigadores naturalistas no se interesen por la calidad de sus muestras, sino que aplican criterios distintos para seleccionar a los participantes. Debido al pequeño tamaño muestral una de las limitaciones frecuentemente planteada con relación al enfoque cualitativo es que la representatividad de los resultados se pone en duda, pero debemos tener en cuenta que el interés de la investigación cualitativa en ocasiones se centra en un caso que presenta interés intrínseco para descubrir significado o reflejar realidades múltiples, por lo que la generalización no es un objetivo de la investigación. Cuando el fin de la investigación cualitativa es la generalización tenemos dos posibilidades en función del objetivo perseguido: 1. El fin de la investigación es el desarrollo y examen de una teoría, entonces la selección de los casos se debe diseñar de forma que se puedan generar tantas categorías y propiedades como sean posibles, y relacionarlas entre sí. Es lo que Glasser y Strauss (año) denominan muestras teóricas, que buscan representar un problema teórico seleccionando situaciones sociales que ofrezcan observables sobre las categorías de análisis. Para ello recomiendan dos estrategias complementarias: • Minimizar las diferencias entre los casos con el fin de sacar a la luz propiedades básicas de una categoría particular. • Posteriormente maximizar las diferencias entre los casos con la intención de incrementar categorías y acotar la incidencia de la teoría. 2. El fin de la investigación es la generalización de un grupo finito de casos. Es importante valorar la tipificación de casos estudiados mediante la comparación de las características relevantes con información de las estadísticas oficiales o de otros estudios sobre la población. Se puede utilizar el estilo bola de nieve que se basa en la idea de red social y consiste en ampliar progresivamente los sujetos de nuestro campo partiendo de los contactos facilitados por otros sujetos. La estrategia para seleccionar casos puede variar a lo largo de la investigación: en las primeras fases, los casos escogidos tal vez no tengan gran relevancia, aunque más adelante pueden adquirir una considerable importancia. Los investigadores cualitativos suelen evitar las muestras probabilísticas, puesto que lo que buscamos son buenos informantes, es decir, personas informadas, lúcidas, reflexivas y dispuestas a hablar ampliamente con el investigador. Existen diversos diseños de muestreo no probabilístico utilizados en los

16



estudios naturalistas: • Muestreo por conveniencia. Se suele utilizar sobre todo al principio una muestra por conveniencia que se denomina muestra de voluntarios, y se utiliza si el investigador necesita que los posibles participantes se presenten por sí mismos. Este muestreo es fácil y eficiente pero no es uno de los preferidos debido a que en estos estudios la clave es extraer la mayor cantidad posible de información de los pocos casos de la muestra, y el método por conveniencia puede no suministrar las fuentes más ricas en información. Es un proceso fácil y económico que permite pasar a otros métodos a medida que se colectan los datos. • Muestreo de avalancha. Consiste en pedir a los informantes que recomienden a posibles participantes. También se denomina muestreo nominado, en bola de nieve o muestreo en cadena. Es más práctico y eficiente que el anterior en cuanto al coste, además, gracias a la presentación que hace el sujeto ya incluido en el proyecto, resulta más fácil establecer una relación de confianza con los nuevos participantes, también permite acceder a personas difíciles de identificar. Por último, el investigador tiene menos problemas para especificar las características que desea de los nuevos participantes. Como inconvenientes tenemos la posibilidad de obtener una muestra restringida debido a la reducida red de contactos. Además la calidad de los nuevos participantes puede estar influida por el hecho de que los sujetos que invitaron confiaran en el investigador y realmente desearan cooperar. • Muestreo teórico. También denominado muestreo intencionado. Aunque se inicie el muestreo mediante voluntarios y se realice posteriormente un proceso de avalancha, habitualmente se avanza hacia una estrategia de muestreo deliberado a lo largo del estudio, basándonos en las necesidades de información detectadas en los primeros resultados. En la investigación cualitativa la relación entre problemas de investigación y los casos seleccionados debe ser revisada continuamente. En este tipo de investigación se debe decidir cuándo y dónde observar ycon quién conversar, así como qué información registrar y cómo hacerlo. Con este proceso estamos decidiendo no sólo que es lo relevante o no, sino también estamos extrayendo varias muestras de la información disponible. Es importante establecer lo más sistemáticamente posible los criterios utilizados para asegurar así que la muestra ha sido adecuadamente escogida. Para ello existen tres grandes dimensiones a lo largo del proceso de extracción de muestras a tener en cuenta: el tiempo, las personas y el contexto. • El tiempo es una dimensión importante en la vida social. Las actividades y las actitudes en el campo suelen variar a lo largo del tiempo de forma significativa. Zerubavel (año) investigó sobre el tiempo en los hospitales. Es distinta la actividad de un servicio de urgencias según la hora del día o incluso según el día de la semana. Es imposible realizar trabajo de campo las 24 horas al día por lo que es inevitable tomar muestras de lapsos temporales. Además, no se recomiendan largos períodos de observación ininterrumpidos, ya que deben seguirse de otros períodos de sistematización y reflexión sobre el material para obtener una información de calidad. • Las personas. Ningún medio es socialmente homogéneo y la representación adecuada de la gente involucrada en un caso particular requiere tomar muestras, a menos que el total de la población investigada pueda ser estudiada en su totalidad.

17


El muestreo de las personas puede realizarse con criterios demográficos estandarizados como género, raza, edad, ocupación, nivel de instrucción, etc. Estas categorías son importantes sólo cuando son relevantes para la teoría que se está desarrollando o para contraponerlas a categorías rivales, y normalmente han de ser complementadas por otras categorías de relevancia en la investigación y que son elaboradas por el propio investigador. • Lugar y contexto. Dentro de cualquier ambiente se pueden distinguir contextos muy diferentes y el comportamiento de las personas actúa en función del contexto en el que están. Es importante no confundir los lugares, el espacio físico, con los contextos, que es un espacio social. Debemos identificar los contextos en función de cómo los individuos actúan en ellos, reconociendo que son construcciones sociales y no localizaciones físicas e intentar asegurarnos que tomamos muestras de todos los que son relevantes. Respecto al tamaño de la muestra no hay criterios ni reglas firmemente establecidas, determinándose en base a las necesidades de información, por ello, uno de los principios que guía el muestreo es la saturación de datos, esto es, hasta el punto en que ya no se obtiene nueva información y ésta comienza a ser redundante. El proceso de muestreo podría evolucionar como sigue: 1. El investigador empieza con una noción general de dónde y con quién comenzar. Se suelen utilizar procedimientos de conveniencia o avalancha. 2. La muestra se selecciona de manera seriada, es decir, los miembros sucesivos de la muestra se eligen basándonos en los ya seleccionados y en qué información han proporcionado. 3. Con frecuencia se utilizan informantes para facilitar la selección de casos apropiados y ricos en información. 4. La muestra se ajusta sobre la marcha. Las nuevas conceptualizaciones ayudan a enfocar el proceso de muestreo. 5. El muestreo continúa hasta que se alcanza la saturación. 6. El muestreo final incluye una búsqueda de casos confirmantes y desconfirmantes (Selección de casos que enriquecen y desafían las conceptualizaciones de los investigadores). Por lo tanto en la investigación cualitativa la información es la que guía el muestreo, y por ello es preciso que evolucione en el propio campo ya que es necesario que cubra todos los requerimientos conceptuales del estudio, y no la adaptación a unas reglas metodológicas.

18



Apartado 6.2: Técnicas para el levantamiento de datos Material 6.2.1: Material de apoyo para encuestas y la construcción de cuestionarios Texto: Morales Vallejo, P.: Construir Cuestionarios y Escalas. Madrid: Universidad Pontificia Comillas. Accesible en línea en: Comentario: Personalmente creo que colocar un texto escaneado como parte del documento no es estéticamente presentable. Recomendaría colocarlo como adjunto, como si fuera material de apoyo para los lectores.

19

MATERIAL DE APOYO PARA EL DISEÑO Y EJECUCIÓN DE EVALUACIONES ESTRATÉGICAS DE GOBIERNO !"#$%&$'$%()*+,'"-'%(".+,-)*$'-)+%/%.+($0$+%1.%$(,-,"1.+%

¤Pedro Morales Vallejo, Universidad Pontificia Comillas, Madrid, (Última revisión, 8 de Septiembre de 2011)

ÍNDICE 1. Cuestionarios y escalas ...................................................................................................... 3 1.1. Cautelas iniciales en la construcción de cuestionarios y escalas ............................... 4 1.2. Preguntas de identificación personal en cuestionarios y escalas ............................... 5 1.2.1. Orientaciones generales ................................................................................... 5 1.2.2. El anonimato en los cuestionarios y escalas .................................................... 6 1.2.3. Cuando interesa disponer de información sobre el rendimiento académico.... 7 1.3. Los cuestionarios: ¿Podemos ‘medir’ actitudes con una sola pregunta?................... 8 1.4. La validez de los cuestionarios .................................................................................. 9 2. Los ítems o preguntas de cuestionarios y escalas.............................................................. 10 2.1. Ítems en forma de opiniones ...................................................................................... 11 2.2. Ítems en forma de conductas o casos ......................................................................... 11 a) Conductas o hábitos personales ........................................................................... 11 b) Conductas ajenas o casos ..................................................................................... 12 2.3. Ítems bipolares ........................................................................................................... 12 2.4. Listas de adjetivos ...................................................................................................... 15 a) Varios adjetivos expresan el mismo rasgo o actitud ............................................ 15 b) Cada adjetivo expresa un rasgo distinto............................................................... 16 2.5. Bloques de ítems del mismo ámbito .......................................................................... 17 2.6. Cuando el énfasis está en la medición de valores ...................................................... 19 2.7. Listas de ordenamiento............................................................................................... 20 2.8. Escoger más de una respuesta .................................................................................... 21 2.9. Preguntas abiertas....................................................................................................... 22 3. Las respuestas de cuestionarios y escalas.......................................................................... 22 3.1. Tipos de respuestas .................................................................................................... 22 3.2. Número de respuestas ................................................................................................ 25 3.3. Número par o impar de respuestas............................................................................. 25 4. Las escalas de actitudes ..................................................................................................... 26 4.1. Por qué construimos escalas en vez de limitarnos a una sola pregunta..................... 26 4.2. Fases del proceso y estructura de todo el cuestionario ............................................. 28 4.2.1. Fases en el proceso de construcción de una escala de actitudes...................... 28 4.2.2. Estructura del instrumento............................................................................... 29 5. Puntos de partida en la construcción de una escala ........................................................... 30 5.1. Definición y retrato robot.......................................................................................... 30 5.2. Revisión de instrumentos ........................................................................................... 31 5.3. Traducción de otro idioma ......................................................................................... 32 5.4. Estudio cualitativo previo .......................................................................................... 33 6. Características de los ítems de las escalas de actitudes................................................... 34 6.1. En forma de opiniones................................................................................................ 34 6.2. Relevancia y claridad ................................................................................................. 34 6.3. Discriminación ........................................................................................................... 35 6.4. Equilibrio entre ítems positivos y negativos .............................................................. 35 6.5. Ítems negativos y discriminación............................................................................... 36 6.6. Formulación de los ítems en función de los componentes de las actitudes ............... 38 a) Conocimientos...................................................................................................... 38 b) Sentimientos ......................................................................................................... 39 c) Conductas............................................................................................................. 39

182

2 7. Preparar la clave de corrección ........................................................................................ 40 8. Número de ítems .............................................................................................................. 40 8.1. Número inicial de ítems .......................................................................................... 40 8.2. Número de ítems y fiabilidad .................................................................................. 41 8.3. Características de las escalas muy breves................................................................ 42 9. Preparar preguntas o instrumentos adicionales ................................................................. 43 9.1. Comprobar la validez de la escala ............................................................................. 44 9.2. Responder a preguntas de investigación.................................................................... 44 10. Obtener datos de una muestra .............................................................................................. 44 10.1. Tipo de muestra........................................................................................................... 44 10.2. Número de sujetos....................................................................................................... 45 10.3. Cuando la muestra es muy pequeña ............................................................................ 45 10.4. Las pruebas piloto y la validación de expertos ........................................................... 47 11. Introducir los datos en un programa informático ................................................................. 48 11.1. Los datos en EXCEL................................................................................................... 48 11.2. Cuando algunos sujetos omiten la respuesta a algunos ítems ..................................... 49 12. Proceso de análisis de una escala de actitudes: finalidad del análisis de ítems e interpretación del coeficiente de fiabilidad. ................................................................... 51 12.1. Análisis de ítems ...................................................................................................... 53 12.1.1. Correlación ítem-total .................................................................................... 53 12.1.2. Contraste de medias en cada ítem entre los dos grupos con puntuaciones mayores y menores en el total de la escala .................................................... 56 12.2. Cálculo de la fiabilidad ............................................................................................ 58 12.2.1. Cómo estimar la fiabilidad en una nueva muestra a partir de la fiabilidad conocida en otra muestra y de las desviaciones de las dos muestras............. 59 12.2.2. Cuándo un coeficiente de fiabilidad es suficientemente alto......................... 60 12.3. Selección de los ítems definitivos............................................................................ 61 12.3.1. Según el análisis de ítems .............................................................................. 61 12.3.2. Otros criterios en torno a la elección de los ítems definitivos....................... 62 1º Equilibrio entre ítems positivos y negativos ................................................ 62 2º Cuidar más la representatividad del contenido de los ítems ....................... 63 3º Incluir de manera equilibrada aspectos distintos del mismo rasgo general (subescalas) ......................................................... 63 4º Incorporación de nuevos ítems .................................................................... 64 5º Preparación de dos versiones, corta y larga, de la misma escala ................. 64 12.3.3. Explicación o redefinición del rasgo medido por nuestro instrumento .......... 64 13. Comprobación de la validez de la escala y otros análisis posteriores .................................. 65 13.1. Conceptos básicos sobre la validez de tests y escalas................................................ 65 13.2. Sugerencias para obtener datos adicionales que faciliten la validación de la escala . 67 13.2.1. Confirmación del significado pretendido (validez de constructo) ................... 68 a) Análisis correlacionales ................................................................................. 68 1º Relación con otros modos de medir el mismo rasgo ................................. 68 2º Comprobación de relaciones esperadas con otras variables.................... 69 3º Comprobar que no hay relación donde no esperamos que la haya .......... 72 b) Comparaciones entre grupos ......................................................................... 72 13.2.2. Confirmación de la utilidad del instrumento (validez predictiva) ................... 73 14. Bibliografía........................................................................................................................... 74 14.1. Referencias bibliográficas.......................................................................................... 74 14.2. Bibliografía sobre construcción de instrumentos....................................................... 78 14.3. Bibliografía sobre colecciones de instrumentos......................................................... 79G


MATERIAL DE APOYO PARA EL DISEÑO Y EJECUCIÓN DE EVALUACIONES ESTRATÉGICAS DE GOBIERNO 4

3 1. Cuestionarios y escalas En primer lugar hay que aclarar qué entendemos aquí por cuestionario y qué entendemos por escala o test. Un cuestionario según, el diccionario, es una lista de preguntas que se proponen con cualquier fin; los cuestionarios sociológicos, de evaluación, y en general los sondeos de opinión son ejemplos típicos. En los cuestionarios convencionales, los más habituales, las respuestas se analizan de manera independiente. Un test o una escala de actitudes son también cuestionarios pero con estas características: 1) Todas las preguntas (ítems) son indicadores del mismo rasgo o actitud,

C$#+*#&3$&*#=%(#$%.('(#(0#+*$# (@7&(0($#.*09(0.3*0"+($#'(# .*0*.3&3(0)*$#D.*&*#+"$#-,%(A"$# *AE()39"$#)3-*#)($)FG#"#."'"#$%E()*#$(# +(#$%&"0#$%$#,($-%($)"$#.*,,(.)"$#4# ($)(#)*)"+#($#(+#'")*#=%(#$(#)3(0(#(0# .%(0)"#-","#."+383.",#

2) Las respuestas de cada sujeto se van a sumar en un total que indica dónde se encuentra o cuánto tiene de la variable o característica que pretendemos medir.

También suelen denominarse escalas las preguntas con respuestas graduadas (como mucho, bastante, poco, nada, o en términos de frecuencia, importancia, etc.), frecuentes en todo tipo de cuestionarios, aunque las respuestas no se vayan a sumar en un único total porque cada pregunta mide algo distinto. Independientemente de los términos que utilicemos, las diferencias entre lo que denominamos cuestionarios y escalas (o tests) están esquematizadas en la figura 1. B")%,"+(5"# '(#+*$#1)(&$ >(+(..3;0 '(#+*$#1)(&$ 2")*$# 30)(,-,()"'*$# 4#%)3+35"'*$

:%($)3*0",3*$#

?($)$#4#($."+"$

:*0#."'"#%0*#$(#*A)3(0(#

?*'*$#+*$#1)(&$#(@-,($"0

:,3)(,3*$#+;/3.*$
#:'%"#?%-?.%3%)%+"("'-.(-.%+"8%:(+,("%,')1" 9("D*'(-",("?*(9("%B*9%+

!""#"/

!""#",*B"&()*+1

4G"K%&.%+".'(,?1"B"(-(+)C%&"(%B*9%+"%"?(+&1-%&"D*("-1"?*(9(-" 3/"2+,8/"/3B",=B"4=+53"+5"6

!""""#""""$""""%""""&

!""""#""""$""""%""""&

#("73"/=+>3"9+5+."4=+51/"@1>*?*@1@*35+/"+5"6

!""""#""""$""""%""""&

!""""#""""$""""%""""&

$(":+".+/=>91"?8@*>"+/9=2*1."6

!""""#""""$""""%""""&

!""""#""""$""""%""""&

%(":+"/*+593"2+/15*,123;"/*5"+/-+.150*>?+.+06+ @))));)+0)*+1,-'+.*/ &@);)*$%&(%#

4&3&)"'>*$%&(%#

5&$&)'/ #-)#-%23"&$)#-)32$*)A)&.2$$"3* 0/D)'268*

7&-%&(%#)32$*) A)&.2$$"3*

+,-)."#()(*

5*$)-2>2#-%*) C2#)(*

B*)#-%23"*)-*.$#)%*3*)>*$C2#)'#)12-%&)#-%23"&$)A)-&.#$)6*-&-

ordinariamente

a veces

0/D)>#$*)(*)'268*

0/

+,-)."#()(*

5*$)-2>2#-%*) C2#)(*

Figura 17

Figura 19

Sobre todo con niños (y siempre que sea realista hacerlo) estas respuestas en términos de frecuencia son más claras y contribuyen a aumentar la fiabilidad cuando se expresan de manera más específica, por ejemplo todos los días, una o dos veces por semana, etc.; o si se trata de tiempo empleado en ver televisión al día nunca, menos de una hora, entre una y dos horas, más de dos horas, etc. En estos casos y para establecer unos intervalos de tiempo realistas conviene obtener antes algún tipo de información39

No siempre es fácil encontrar suficientes respuestas verbales bien graduadas y que tengan un significado claro; cabe, como vamos viendo, combinar números y expresiones verbales; e incluso con alguna ayuda de tipo gráfico, como en el ejemplo de la figura 20 en el que tenemos un único ítem para evaluar un programa de formación (adaptado de Davies, 2008).

38 La justificación de estas categorías de respuesta, y un listado mayor, puede verse en Cañadas y Sánchez Bruno, (1998). 39 Stapleton et al. (2010) citan varios estudios que confirman esta mayor fiabilidad cuando las respuestas ofrecidas son más específicas.

193

40 Por ejemplo, Chang, 1997, con dos muestras de 173 y 108 sujetos. La fiabilidad test-retest (la correlación cuando se responde al mismo test dos veces con un intervalo de al menos una semana) suele ser mayor (mayor estabilidad en las respuestas) cuando todas las categorías de respuesta están expresadas verbalmente (Weng, 2004, con una muestra de 1247 estudiantes universitarios). 41 En Morales (2006), Anexo III está la escala completa de actitud hacia el estudio (otra escala semejante en el Anexo IV).



26

No satisfactorio

Satisfactorio

Muy mal 1

Excepcional 2

3

4

5

6

7

8

Figura 20

En general esta respuesta central funciona mejor si verbalmente se expresa su posición de manera explícita (como a veces, entre los extremos nunca y siempre) (Hernández, Espejo y González Romá, 2006). En cualquier caso no se puede hablar de una norma; una práctica muy habitual es utilizar cinco respuestas. 4. Las escalas de actitudes

Se definen verbalmente los extremos (muy mal y excepcional) y para que los sujetos sitúen su respuesta con más claridad, se separan gráficamente las áreas que corresponden a una valoración positiva o negativa (satisfactorio y no satisfactorio).

En primer lugar exponemos las razones para construir escalas (o tests) y damos una visión preliminar de todo el proceso de construcción y de la estructura final del cuestionario que responderán los sujetos y en el que está incluida la escala de actitudes.

3.2. Número de respuestas

4.1. Por qué construimos una escala (o un test) en vez de limitarnos a una sola pregunta.

En las escalas de actitudes (y en los cuestionarios en general) el número tradicional de respuestas es de cinco, pero pueden ser más o pueden ser menos.

Hay varias razones para construir escalas sin limitarnos a una sola pregunta. Aun en el caso de los cuestionarios sociológicos, que no son escalas de actitudes en sentido propio, puede ser útil y conveniente el disponer de varios indicadores de una misma actitud (o de una misma variable, como nivel socioeconómico) que van a ser sumados después como indicador de esa actitud o variable.

Una observación importante ya hecha es que en general, y en el caso de escalas de actitudes, a mayor número de respuestas en los ítems, suele haber una mayor fiabilidad en toda la escala, con tal de que el número de respuestas no supere la capacidad de discriminación de los que responden. También con más respuestas se verifican con más facilidad relaciones con otras preguntas porque los sujetos quedan mejor diferenciados. En las escalas de actitudes resulta más económico aumentar el número de respuestas en vez de aumentar el número de ítems y además se responde en menos tiempo. Seis o siete respuestas suele ser el número máximo habitual; a partir de nueve respuestas ya no se discriminan bien. La práctica más generalizada es poner entre 4 y 6 respuestas. El número mínimo puede ponerse en tres respuestas; en cualquier caso con tres respuestas suele subir la fiabilidad con respecto a dos nada más. En las escalas de actitudes con dos respuestas (sí o no, de acuerdo o en desacuerdo, etc.) la fiabilidad suele ser menor. Las dos respuestas (sí, no, de acuerdo en desacuerdo, etc.) es preferible dejarlas para ítems de naturaleza dicotómica (varón/mujer, haber tenido o no una determinada experiencia, etc.) o cuando lo aconseja la previsible capacidad de comprensión de los sujetos (como puede suceder con niños). 3.3. Número par o impar de respuestas Una cuestión distinta es si se debe incluir un número par o impar de respuestas (con o sin una respuesta central de indecisión). No hay normas claras sobre este punto; lo más claro es que son preferibles tres respuestas a dos (la fiabilidad es casi siempre mayor con tres respuestas que con dos, y además con sólo dos respuestas los que responden pueden sentirse incómodos). El incluir un número par de respuestas (4 ó 6) tiene al menos dos ventajas. 1) En primer lugar siempre cabe la posibilidad de agruparlas en dos categorías, de acuerdo y en desacuerdo, y esta agrupación en dos categorías puede ser útil para determinados análisis o para presentar los resultados de manera más sucinta. 2) En segundo lugar se elimina la posibilidad de que los sujetos se evadan escogiendo la respuesta central (casi nunca hay verdadera indecisión si los ítems son relevantes para que los que responden). Una respuesta central del tipo indiferente, no sé, indeciso, puede tener problemas de interpretación y no representar adecuadamente la magnitud o intensidad pretendida (punto medio entre las respuestas extremas) porque se puede escoger por razones distintas.

194

!"#$%&#'&(#)*+,*#-*# ./*0)#-*)1+,2,0%)#3# 0*-,0%)#0*4%+# 1%&)/+'1/%)# +*5(/,6(0*&/*# 1%075*4%)8#

En la vida cotidiana juzgamos sobre cómo es una persona (si es aficionado a un deporte, si es más o menos conservador, religioso o asertivo, si le gustan los temas relacionados con la naturaleza, etc.) en función de de varios indicadores, como pueden ser diversas opiniones referidas a la misma actitud o conductas observadas en el mismo sujeto. Con una única pregunta podemos simplificar en exceso el concepto que vamos a medir.

Una analogía sobre la conveniencia de hacer varias preguntas sobre lo mismo la tenemos en una consulta médica. Cuando vamos a hacernos un reconocimiento, el médico suele hacer varias preguntas, que no son otra cosa que una serie de posibles síntomas, y no es lo mismo de cara a un diagnóstico el responder sí a una de sus preguntas que responder sí a todas o casi todas sus preguntas; es más seguro disponer de varios indicadores o síntomas de la misma posible patología. En conjunto una medida compuesta por varios ítems es más válida en el sentido de que expresa mejor la actitud o rasgo al menos por dos razones: a) Varios indicadores describen mejor un constructo, rasgo o actitud que uno solo. b) Una única pregunta puede de hecho ser poco afortunada, o equívoca, o ser mal entendida por muchos o algunos sujetos. Cuando hay varios indicadores de la misma actitud (o rasgo en general) se obvian mejor las limitaciones de cada ítem en particular. Además una única pregunta puede distorsionar la información que el sujeto aporta de sí mismo; por ejemplo uno puede definirse como muy liberal en una única pregunta, porque ésa es la imagen que tiene de sí mismo, pero puede no aparecer tan liberal ante varias cuestiones más específicas. Como ya hemos indicado al decir qué entendemos por test o escala (varios ítems miden el mismo rasgo), podemos pensar en la medida del rendimiento académico que quizás es un ejemplo más claro y con el que estamos más familiarizados. Si queremos saber si un alumno sabe química, no le hacemos una sola pregunta porque puede saber esa pregunta pero no otras muchas posibles preguntas, o esa pregunta puede ser de hecho ambigua o muy difícil, etc.; una serie de preguntas sobre el mismo tema o asignatura nos da una idea más certera sobre si sabe más o sabe menos. Después de todo, nuestra conclusión y nuestro juicio no van a ser sobre si sabe o no sabe unas preguntas concretas, sino sobre si sabe o no sabe en general; de



28

unas pocas preguntas extrapolamos nuestras conclusiones a otras muchas posibles preguntas semejantes. Algo análogo hacemos con las escalas de actitudes, tests de inteligencia, etc.; una muestra relativamente amplia de preguntas (ítems) constituye una mejor base para formarnos un juicio más preciso y fundado sobre cómo está una persona (o un grupo representado por su media) en un rasgo concreto. Aun así ya veremos que pocas preguntas pueden ser suficientes si lo que queremos medir o apreciar está conceptualizado de una manera relativamente simple. Este tipo de razones para utilizar un test o escala tiene más peso cuando se van a tomar decisiones sobre los sujetos (como por ejemplo admitir o no admitir a un programa de estudios, o a un puesto de trabajo) o interesa hacer un buen diagnóstico individual. !"#$%&'()#*&+#,-.# /01,.#&%,1'0&# 2"&5424(&(#(1# 2&#,1(4(&6#

Por fiabilidad entendemos ahora lo que significa este término de manera intuitiva; sin entrar en cuestiones de psicometría fiabilidad significa precisión en la medida, menor margen de error.

Por las razones dichas anteriormente se minimizan las limitaciones de cada ítem en particular; merecen más confianza varias preguntas que una sola. Un solo ítem está más sujeto a los errores de medición (respuestas rápidas y distraídas, ítems no bien entendidos); en cambio cuando varios ítems se van a sumar en un total estos errores de medición tienden a cancelarse mutuamente o al menos pesan menos en ese total. En un sentido más psicométrico, si disponemos de una serie de ítems podemos calcular el coeficiente de fiabilidad como veremos más adelante; los coeficientes de consistencia interna (o de fiabilidad) como el coeficiente alfa de Cronbach sólo se pueden calcular si el instrumento consta de varios ítems (dos al menos), no de uno solo. La fiabilidad puede ser alta o baja, pero eso es algo que podemos verificar, de la misma manera que podemos analizar la calidad de cada ítem. 7"#$%&'()#*&+#,-.# /01,.#(10180&,).# ,19):#2&.#

(431:1'84&.# 4'01:4'(4;4(%&21.#

*/#/*0$%%-(%"#%)#"*-(I?% 8(.&+$-('%#%&'(13$2#.%-(% *$)(.2*1#/*0$

(.*0$?%1'3&+%-(% &('2($($/*#?%(2/7 =$>+'5#/*0$%/($.#"%+% .+/*+"01*/# S(./'*&/*0$%-(%"#%53(.2'#

L"+M3(% ;N

O2(5.%-(%"#%(./#"#%&'+&*#5($2(%-*/B#

L"+M3(% QN

!'(13$2#.%#-*/*+$#"(. ('($/*#.?% (2/7%M3(%&3(-($%(.2#'%'("#/*+$#-#.%/+$%"#% )#'*#C"(%5(-*-#%($%"#%(./#"#%+%2(.2

K.%T2*"%2($('%-(.-(%("% &'*$/*&*+%(.2#%*5#1($% -("%*$.2'35($2+% '(&'(.($2#-#%($%"#% >*13'#%R%4&'+-3/2+% >*$#"%-(%"#%>#.(%-(% &'(&#'#/*0$%&'()*#%#% "#%'(/+1*-#%-(%-#2+.A7%

Figura 22 Este modo de ordenar los bloques de preguntas es cómodo y tiene su lógica, pero tampoco es una norma; en los cuestionarios convencionales (más que en las escalas) también

196

!"#$%&'(#&'#)$&*+#"*+# ,%'-.()*+#&'"# /.'+)0$(*%0$#'+# 01,$%)*()'#,$%2.'#'(# '+)'#$%&'(#+'# 0()%$&./'(#&'+,.3+# "*+#%'+,.'+)*+#'(#.(*# 4$5*#&'#/6"/."$#7/$1$# !89!:;#H?%?C%)+%,%FG.%>G>IC%@B;%IC>G%J%?C%)+%,%FG.%>G>IC%@B;%KILG =>?@

+

56 '

)+,%234" $$%&)(

* $$$$$%&+(

)+%,%-./"

56 ) 56 !

!

)

$%&'(

$$%&)(

)+,%234" $$$$%&*(

$$$$$$%&8(

)+%,%-./"

$$$%&!(

$$$$$%&+( $$%&)(

$$$$$%&+(

$$%&)(

$$$$%&*(

$$%&)(

$$$%&!(

$%&'(

)+,%234" )+%,%-./"

'

$$$%&!( $$$$$$$%&9(

:

:;0 :
*()#(*+&(3%*($)"0)$'51':'#%/()9)0%)6.'0'/%/ D%$)'1."&+&".%#'(1"$)$") +6"/"1)&"/6#'&)%)/($) 5&%1/"$).'+($

F1%0'8%1/()"0)#(1."1'/( K(1)*-.(/($)"T+"&'*"1.%0"$ GFDCEHI)DVPCKF,)F2FJH!BH)) G"&':'#%1/()='+>."$'$)#(="&"1."$ ()KR!KH2BAFD GFDCEHI)HU2HJCSH!BFD

%?)@(3&")"0) !"#"$%&'()+"&()1()$'"*+&") @CP!CQCKFER $6:'#'"1." MS"/'*($)0()+ 0.*3"*>+&'3(3.,$*

!"),.'3&*+"++$