CAPITULO 6:

60 downloads 161 Views 8MB Size Report
misma. Cuando se enfoquen variables aparentemente no observables (como por ejemplo la felicidad, actitudes) .... Resumen del proceso de operacionalización (Meyer, en Stockmann, 2010). ...... (Última revisión, 8 de Septiembre de 2011).
Ministerio de Planificación Nacional y Política Económica

CAPITULO 6: LEVANTAMIENTO Y ANALISIS DE DATOS    

1  

MATERIAL DE APOYO PARA EL DISEÑO Y EJECUCIÓN DE EVALUACIONES ESTRATÉGICAS DE GOBIERNO

Apartado 6.1: Consideraciones previas al levantamiento de datos Material 6.1.1: La Medición: Variables, Indicadores e Índices LA MEDICIÓN: VARIABLES, INDICADORES, INDICES Cualquier  evaluación  implica  de  algún  modo  una  tarea  de  medición  de  los  conceptos  que  intervienen  en  la   misma.   Cuando   se   enfoquen   variables   aparentemente   no   observables   (como   por   ejemplo   la   felicidad,   actitudes),  o  complejas  (pobreza,  competitividad)  se  está  ante  la  obligación  de  describir  sus  características  o   de   relacionar   estas   variables   con   otras   con   las   que   pueden   estar   conectadas.   En   todo   caso   se   tendría   que   utilizar  determinadas  variables  que  definan  el  comportamiento  de  estudio  y  se  tendrá  que  encontrar  el  valor   que  éstas  asumen  en  el  caso  estudiado.  En  eso  consiste,  desde  el  punto  de  vista  lógico  más  general,  la  tarea   de  medir.     La  idea  de  medición  o  de  medida,  es  intrínsecamente  comparativa.  Medir  algo,  en  el  caso  más  sencillo,  es   determinar  cuántas  veces  una  cierta  unidad  o  patrón  de  medida,  cabe  en  el  objeto  a  medir.  Para  medir  la longitud   de   un   objeto   físico,   se   desplaza   una   regla   o   cinta   graduada   sobre   el   mismo,   observando   cuantas   unidades   (en   este   caso   centímetros   o   metros)   abarca   el   objeto   en   cuestión.   Es   decir   que   comparamos   el   objeto  con  nuestro  patrón  de  medición  para  determinar  cuántas  unidades  y  fracciones  del  mismo  incluye.  

1. Variables y Escalas de Medición En   estadística,   cuando   se   hace   referencia   al   concepto   de   “variable”,   se   está   hablando   del   carácter   o   fenómeno  que  se  está  estudiando  en  la  realidad.  Los  “datos”  son  el  producto  de  la  medición  de  las  variables   del  estudio.     Una  variable  es  aquello  que  varía  o  puede  variar.  Se  trata  de  algo  inestable,  inconstante  y  mudable.  En  otras   palabras,  una  variable  es  un  símbolo  que  representa  un  elemento  no  especificado  de  un  conjunto  dado.  Este   conjunto   es   denominado   conjunto   universal   de   la   variable   o   universo   de   la   variable,   y   cada   elemento   del   conjunto  es  un  valor  de  la  variable,  por  ejemplo:  x  es  una  variable  del  universo  {2,  4,  6,  8}.  Por  lo  tanto,  X   puede   tener   cualquiera   de   dichos   valores,   es   decir   que   puede   ser   reemplazada   por   cualquier   número   par   menor  a  nueve.     Una   variable   es   un   elemento   de   una   fórmula,   proposición   o   algoritmo,   que   puede   ser   sustituido   o   puede   adquirir  un  valor  cualquiera  dentro  de  su  universo.  Los  valores  de  una  variable  pueden  definirse  dentro  de   un  rango  o  estar  limitados  por  condiciones  de  pertenencia.     En  términos  generales,  las  variables  pueden  clasificarse  en  variables  cualitativas,  dependiendo  si  los  valores   presentados   tienen   o   no   un   orden   de   magnitud   natural   (cuantitativas),   o   simplemente   un   atributo   no   sometido   a   la   cuantificación   (cualitativa).   La   diferencia   entre   varibales   cualitativas   y   cuantitativas   está   relacionada  con  las  escalas  de  medición  las  cuales  son  una  sucesión  de  medidas  que  permiten  organizar  los   datos.      

2  

SISTEMA NACIONAL DE EVALUACIÓN SINE – COSTA RICA  

Ministerio de Planificación Nacional y Política Económica

Las  variables  cualitativas,  pueden  agruparse  en  variables  nominales  u  ordinales:     Nominal:   Cuando   la   información   dada   se   puede   clasificar   en   categorías   no   numéricas   mutuamente   excluyentes,   entre   las   cuales   no   se   puede   establecer   ninguna   relación   de   orden,   por   tanto,   no   se   puede  fijar  ningún  origen  que  sirva  de  referencia  (por  ejemplo  Sexo,  Estado  Civil,  Nacionalidad)     Ordinal:  Este  tipo  de  medidas  es  igual  a  la  escala  nominal,  pero  se  diferencian  de  éstas  ya  que  en  este   tipo   de   escalas   si   se   puede   establecer   algún   tipo   de   orden   (de   más   a   menos,   de   mayor   a   menor),   existiendo   algún   punto   de   referencia   para   tal   ordenación,   por   ejemplo   Nivel   de   Estudios,   Edad   por   tramos,  Situación  Económica).     Para  las  variables  cuantitativas  se  pueden  distinguir  dos  niveles  de  escala,  las  de  intervalo,  y  las  de  razón:     De  intervalo:  La  escala  de  intervalo  mide  las  variables  de  manera  numérica.  Aunque  a  las  categorías   de  variables  cualitativas  también  se  les  asignen  números,  esto  se  hace  solamente  para  etiquetarlos   sin   interpretar   la   cifra   como   una   magnitud   natural.   En   el   caso   de   la   escala   de   intervalo,   por   el   otro   lado,   los   números   de   la   escala   permiten   establecer   “distancias”   exactas   entre   dos   objetos   de   medición   (por   ejemplo,   la   temperatura   en   grados   Celsius   o   Fahrenheit,   donde   para   aumentar   la   temperatura  en  un  grado  es  siempre  la  misma  “distancia”).  Es  importante  notar  que  en  la  escala  de   intervalo,   el   cero   es   un   valor   que   no   indica   ausencia   de   la   característica   o   variable   medida   (por   ejemplo,  ni  cero  grados  Celsuis  ni  Fahrenheit  es  la  total  ausencia  de  energía  térmica).  Este  repercute     en   que   las   operaciones   aritméticas   de   suma   y   resta   son   perfectamente   realizables,   pero   no   así   la   multiplicación  y  división.     De   razón:   La   escala   de   razón   tiene   las   mismas   características   que   la   escala   de   intervalo,   pero   adicionalmente  se  define  un  valor  cero  “natural”  (no  arbitrario)  donde  el  cero  es  un  valor  que  indica   una  ausencia  total  de  la  característica  que  se  está  midiendo  (por  ejemplo,  salario  en  Colones,  peso  en   kg).   Esto   es   una   diferencia   importante,   dado   que   ahora   sí   se   permiten   las   operaciones   aritméticas   de   multiplicación  y  división.  Por  ende,  la  escala  de  razón,  es  el  nivel  de  escala  más  alto.     Para   las   variables   cuantitativas,   sean   de   intervalo   o   de   razón,   además   se   pueden   distinguir   variables   discretas  y  continuas:     Discretas:   La   variables   se   denomina   discreta   cuando     el   número   o   valores   potenciales   que   la   variable   puede  asumir  dentro  de  un  intervalo  determinado  es  contable,  o  finita.  Esto  es  el  caso,  por  ejemplo,   para  la  variable  “Número  de  habitantes  de  una  comunidad  X”  dado  que  no  existen  fracciones  de  la   unidad  “habitante”  (“medio  habitante”,  por  ejemplo).     Continuas:   En   el   caso   de   las   variables   continuas,   los   valores   pueden   asumir   cualquier   valor   dentro   de   un  intervalo,  por  lo  cual  el  número  de  valores  potenciales  es  infinito.  Por  ejemplo,  la  variable  “peso   en   kg”   puede   generar   valores   con   cualquier   fracción   de   1kg   (gramos,   miligramos,   microgramos),   limitado  solamente  por  la  capacidad  del  instrumento  de  medición.     En   lo   anterior,   ya   se   ha   mencionado   que   las   operaciones   matemáticas   permitidas   dependen   del   nivel   de   escala,  donde  un  nivel  de  escala  más  alto  permite  siempre  todas  las  operaciones  de  los  niveles  más  bajos,   más   algunos   que   requieren   un   determinado   nivel   de   escala   mínimo.   La   siguiente   tabla   resume   los   más   frecuentes  cálculos  estadísticos  y  su  relación  con  los  niveles  de  escala:    

3  

MATERIAL DE APOYO PARA EL DISEÑO Y EJECUCIÓN DE EVALUACIONES ESTRATÉGICAS DE GOBIERNO

Tabla  1:  Cálculos  estadísticos  descriptivos  de  acuerdo  a  la  escala  de  medición     Tipo  de  operación  

Nivel  de  escala  (o  asosciación   entre  variables)  

Técnica  estadística  

Variables  individuales  (Análisis   univariado)  

Nominales  

-­‐  Frecuencias   -­‐  Proporciones   -­‐  Porcentajes  

Variables  individuales  (Análisis   univariado)  

Ordinales  

-­‐  Frecuencias  acumuladas   -­‐  Cuartiles,  Percentiles   -­‐  Mediana  

Variables  individuales  (Análisis   univariado  

Numéricas  (intervalo  o  razón)  

-­‐  Media  aritmética   -­‐  Desviación  estándar   -­‐  Curtosis  y  oblicuidad  

Asociación  entre  variables    

Categóricas  (nominales  u   ordinales)  con  categóricas  

-­‐  Tablas  de  contingencia   -­‐  Medidas  de  asociación:  Kendall,   Kramer,  Spearman  y  otros  

Asociación  entre  variables    

Categórica  con  numérica  

-­‐  Comparación  de  medias     -­‐  Análisis  de  varianza   -­‐  Medida  de  asociación:  Eta    

Asociación  entre  variables  

Numérica  con  numérica  

-­‐  Coeficiente  de  correlación  (r)   -­‐  Análisis  de  regresión  

   

2. Indicadores. El   término   de   indicador   se   puede   definir   como   las   unidades   de   medida   que   deben   informar   acerca   de   un   estado   de   las   cosas   definidas,   las   cuales   no   pueden   ser   medidas   directamente   o   es   difícil   su   medición   ya   sea   cuantitativamente   o   cualitativamente.   Esto   implica   la   tarea   de   establecer   una   conexión   lógica   entre   un   concepto  teórico,  como  por  ejemplo  “pobreza”  y  sus  dimensiones  y  las  respectivas  variables  que  permiten  la   determinación   de   una   regla   para   clasificar   una   persona   como   “pobre”   o   “no   pobre”   (al   tratarse   de   crear   categorías)  o  determinar  el  grado  exacto  de  pobreza  (al  tratar  de  lograr  una  medición  métrica  del  concepto).     Dentro   del   marco   de   una   Evaluación,   se   toman   los   valores   medidos   empíricamente   por   medio   de   un   Indicador,   comparados   con   valores   de   comparación   (valor   antes   de   iniciar   la   intervención,   valor   de   una   meta,   entre   otros),   como   base   para   efectuar   las   valoraciones.   En   otras   variables,   la   utilidad   del   indicador   consiste  en  contribuir  información  para  dar  respuesta  a  las  interrogantes  de  la  evaluación.     Por  lo  tanto,  en  el  proceso  de  la  operacionalización  del  indicador  se  debe  definir  teóricamente  qué  es  lo  que   en   realidad   interesa:   ¿Cuál   es   el   objetivo   de   la   medición?   ¿Qué   conceptos   forman   parte   de   la   teoría   de   cambio  de  la  intervención  a  evaluar?  ¿Y  a  través  de  qué  variables  se  pueden  hacer  accesibles  a  la  medición?   Identificados   dichos   conceptos   y   posibles   variables   de   medición   (indicadores),   es   de   suma   importancia   justificar   explícitamente   cuál   es   la   relación   entre   el   indicador   medible   y   el   concepto   subyacente   que   es   el   objetivo  de  la  medición:  ¿Por  qué  suponemos  que  el  indicador  efectivamente  mide  dicho  objeto  o  concepto.   Finalmente,   como   para   toda   variable   de   estudio,   se   debe   operacionalizar   metodológicamente   la   medición  

4  

SISTEMA NACIONAL DE EVALUACIÓN SINE – COSTA RICA  

Ministerio de Planificación Nacional y Política Económica

del  indicador,  es  decir,  determinar  las  escalas  de  medición:  en  caso  de  variables  cuantitativas,  la  unidad  de   medida;   en   caso   de   variables   cualitativas   las   diferentes   categorías   de   clasificación   para   las   unidades   de   investigación.   Finalmente   se   debe   definir   la   forma   de   determinar   empíricamente   la   medida   en   que   el   indicador   efectivamente   cumple   el   objetivo   de   la   medición   (regla   de   falsificación   para   la   correspondencia   entre  el  indicador  a  el  objetivo  de  medición).     Resumen  del  proceso  de  operacionalización  (Meyer,  en  Stockmann,  2010).       El  proceso  de  la  Operacionalización     Paso  1:     Determinación  del  objeto  teórico  a  observar  y  de  un  Indicador  potencial   (¿Qué  se  pretende  operacionalizar  y  de  qué  manera?)   Paso  2:     Definición  de  una  regla  de  correspondencia  lógicamente  derivada  y  que  no  sea   afectada  por  la  medición  (¿Por  qué  mide  el  Indicador  el  objeto?)   Paso  3:     Determinación  de  las  escalas  y  unidades/categorías  para  la  medición                         (¿Con  qué  exactitud  debe  medir  el  Indicador?)   Paso  4:     Determinación  de  falsificadores  de  la  regla  de  correspondencia  (¿Cuándo   esta  clasificación  entre  el  Indicador  y  el  Objeto  es  insuficiente)  

  A   diferencia   de   las   ciencias   naturales,   en   las   ciencias   sociales   en   general     -­‐   y   la   evaluación   de   intervenciones   públicas  en  particular  -­‐    la  conceptualización  del  indicador  y  la  medición  son  un  proceso  social,  que  inicia  con   la  comunicación  de  las  características  a  medir,  continúa  con  discusiones  acerca  de  la  operacionalización  en   indicadores   y   ciertas   formas   de   escalas   e   índices   y   finalmente,   termina   en   discusiones   acerca   de   la   interpretación  de  los  resultados  y  la  calidad  de  las  mediciones  efectuadas.     La   complejidad   de   este   proceso   conlleva   que   los   indicadores,   para   contribuir   al   objetivo   de   la   evaluación,   deben   cumplir   con   varios   requerimientos   de   calidad   los   cuales   según   Meyer   (2010)   se   pueden   resumir   en   cuatro  categorías  principales:     • Desde  la  perspectiva  teórica,  deben  cumplir  con  la  calidad  de  la  operacionalización,  de  acuerdo  a   los   pasos   arriba   especificados.   Si   no   se   cuenta   con   una   suficiente   correspondencia   entre   el   indicador   y   el   objetivo   de   la   medición,   el   indicador   puede   generar   mediciones   técnicamente   precisas  y  sin  embargo,  no  válidas  para  los  fines  de  la  evaluación.     • Desde  la  perspectiva  metodológica,  deben  cumplir  con  la  calidad  de  la  medición.  El  indicador  debe   medir   aquello   para   lo   cual   fue   creado   (validez)   y   al   realizarse   mediciones   repetitivas   bajo   circunstancias  iguales,  siempre  debe  generar  el  mismo  resultado  (confiabilidad).  Este  requiere  una   definición  precisa  de  las  herramientas  y  procedimientos  de  medición.     •

Desde   la   perspectiva   práctica,   deben   cumplir   con   la   calidad   de   la   ejecución   (viabilidad),   con   frecuencia  los  limitados  recursos  disponibles  en  cuanto  a  tiempo,  personal  y  recursos  financieros,   impiden  la  aplicación  de  los  mejores  instrumentos  de  medición  aunque  estas  respondan  a  todos  los  

5  

MATERIAL DE APOYO PARA EL DISEÑO Y EJECUCIÓN DE EVALUACIONES ESTRATÉGICAS DE GOBIERNO



requerimientos   teóricos   y   metodológicos.   Por   ende,   se   requiere   de   cierto   pragmatismo   en   la   construcción  y  selección  de  los  indicadores.  En  comparación  con  otros  contextos  de  investigación   aplicada,   en   las   evaluaciones   de   intervenciones   públicas   las   limitaciones   prácticas   suelen   ser   significativamente  más  grandes.   Desde  una  perspectiva  de  enfoque  político,  deben  cumplir  con  el  requerimiento  en  lo  que  se  refiere   a   la   calidad   del   reconocimiento   o   aceptación   de   un   indicador   por   parte   de   los   participantes.   La   medida  en  que  los  resultados  de  las  mediciones  son  aceptados  por  los  involucrados  para  la  toma  de   decisiones   y   en   que   el   indicador   se   interpreta   de   manera   uniforme,   no   depende   solamente   de   criterios   conceptuales   y   metodológicos   sino   del   grado   en   que   se   ha   logrado   un   consenso   entre   todos   los   involucrados.   En   la   intervención   de   intervenciones   públicos   es   muy   común   que   existan   intereses   políticos   relacionados   con   la   selección   de   determinados   indicadores,   de   manera   que   la   misma  operacionalización  llega  a  ser  una  tarea  política  al  igual  que  conceptual/técnica.  

 

3. Índices 3.1.  Definición  y  aplicación  de  índices     Los  índices  son  indicadores  para  medir  objetos  de  medición  altamente  complejos.  Un  índice  combina,  a  su   vez,   una   serie   de   otros   indicadores   más   sencillos   y   al   hacerlo   enlaza   diferentes   dimensiones   de   una   estructura  teórica  en  una  sola  escala  de  medición.       De   esta   manera,   un   índice   se   puede   definir   como   un   número   que   engloba   un   amplio   contenido   de   información,   la   cual   se   expresa   de   manera   simple   en   una   sola   cifra.   Por   lo   mismo,   para   entender   el   mensaje   que  arroja  el  valor  de  un  índice  es  importante  tener  un  entendimiento,  al  menos  general,  de  las  variables   que  lo  conforman.       Los  números  índices  se  caracterizan  por  ser  valores  relativos  (no  absolutos),  ya  que  ellos  son  resultado  de  un   procesamiento  matemático  que  combina  variables  con  distintas  unidades  de  medición,  y  a  veces,  distintos   niveles  de  escala.  Por  lo  tanto,  no  puede  producirse  una  magnitud  “natural”.       La  importancia  de  los  números  índices  reside  en  que  logran  representar  una  realidad  compleja  a  través  de   un   valor   sencillo,   el   cual   sin   embargo   es   sustentado   por   un   amplio   espectro   de   información.   Este   permite   que  un  solo  índice  pueda  mostrar  claramente  la  evolución  en  el  tiempo  de  un  objeto  complejo  de  medición.   Sus   resultados,   por   estar   basados   convierten   a   los   números   índices   en   bases   concretas   para   la   toma   de   decisiones,  la  evaluación  de  situaciones  y  la  predicción  de  situaciones  futuras.     Los  números  índices  son  muy  versátiles,  lo  que  los  hace  aplicables  a  cualquier  ciencia  o  campo  de  estudio.   Como   todo   indicador,   esencialmente   se   usan   para   hacer   comparaciones   (entre   distintas   unidades   de   investigación,  entre  distintos  momentos  en  el  tiempo).  Tres  ejemplos:       • Un   psicólogo   usa   los   números   índices   para   comparar   la   inteligencia   relativa   de   estudiantes   en   sitios   diferentes,  en  años  diferentes,  con  trasfondo  social  diferente,  etc.     • Un   asesor   de   capital   observa   el   comportamiento   de   Indice   Dow   Jones   para   estar   al   tanto   de   las   tendencias  en  la  bolsa  de  acciones.    

6  

SISTEMA NACIONAL DE EVALUACIÓN SINE – COSTA RICA  

Ministerio de Planificación Nacional y Política Económica



Funcionarios  de  la  Caja  de  Seguro  Social  observan  el  índice  de  natalidad  para  elaborar  pronósticos   acerca  de  la  sostenibilidad  del  contrato  generacional  que  sostiene  el  sistema  del  seguro  social.  

  Con   base   a   estos   tipos   de   índices   se   realizan   valoraciones   acerca   del   estado   de   objetos   sumamente   complejos,   y   sin   embargo,   una   sola   cifra   puede   dar   indicaciones   válidas   con   respecto   a   la   toma   de   decisiones.        

3.2.  

Ventajas  y  desventajas  de  índices  

Por   un   lado   una   de   las   ventajas   de   trabajar   con   índices   es   que   con   una   sola   cifra,   pueden   representar   complejas   interrelaciones   y   desarrollos,   permitiendo   la   realización   de   las   correspondientes   valoraciones,   también  facilita  comparar  los  cambios  en  diferentes  tipos  de  información.     La  elaboración  de  números  índices  tiene  sentido  en  variables  de  naturaleza  cuantitativa.  El  índice,  por   estar   definido   por   un   cociente,   es   independiente   de   las   unidades   de   medida   en   las   que   venga   expresada   la   variable,   con   lo   que   se   puedan   efectuar   agregaciones   de   distintos   índices,   construyéndose   indicadores   de   evolución  general  de  todo  tipo  de  fenómeno.     Por  el  otro  lado,  una  de  las  desventajas  de  utilizar  índices  es  que  son  muy  abstractos,  por  lo  que  resulta  muy   difícil   comprender   lo   que   la   cifra   representa.   Si   un   índice   se   utiliza   como   única   orientación   para   actuar,   puede  conducir  por  un  camino  equivocado  ya  que  siempre  se  está  ante  la  presencia  de  aspectos  que  no  se   toman  en  cuenta  lo  suficientemente  y  no  son  abarcados  por  los  índices,  que  en  muchos  casos,  puede  llevar  a   feroces  discusiones  acerca  de  la  adecuada  interpretación  de  un  índice.  Para  entender  eso,  uno  debe  tan  solo   imaginarse  como  del  crecimiento  del  BIP,  la  cuota  del  desempleo,  y  la  tasa  de  inflación  se  suele  extrapolar  a   “estado   de   la   nación”   y   como,   en   el   debate   político,   cada   parte   termina   dando   una   lectura   distinta   a   los   valores  de  los  índices  aunque  estos  estén  matemáticamente  precisos.        

3.3.  

Tipos  de  números  índices  

3.3.1  

Índices  simples  y  compuestos  

  Indices  simples     Un   índice   simple   es   cuando   la   operación   matemática   que   lo   conforma   se   realiza   en   base   a   una   sola   magnitud.  En  cambio,  cuando  se  trabaja  con  más  de  una  magnitud    a  la  vez,  se  conforman  índices  complejos.   En   cualquiera   de   los   dos   casos   se   compara   siempre   dos   situaciones,   una   de   las   cuales   se   considera   de   referencia.   Cuando,   por   ejemplo,   las   comparaciones   son   temporales,   el   índice   se   calcula   en   base   a   un   momento  o  período  base,  frente  al  momento  o  periodo  actual  con  el  que  se  realiza  la  comparación:       En  este  caso  se  le  asigna  al   período  de  referencia  el  valor  100,  lo  cual  implica  que  el  número  índice  simple   que  resulta  de  esta  operación  no  es  otra  cosa  que  un  porcentaje.  Se  trata  de  los  porcentajes  de  cada  valor   de  la  magnitud  con  respecto  al  valor  de  referencia  o  base.  Este  tipo  de  índice,  al  ser  un  porcentaje  definidos   sobre  los  propios  valores  de  la  variable,  hace  que  sean  adimensionales  (es  decir  no  tienen  una  unidad  de   medida  como  kg,  unidades  monetarias,  etc.),  lo  que  permite  la  comparación  de  las  variaciones  de  distintas   variables  aunque  estas  se  midan  en  unidades  diferentes.        

7  

MATERIAL DE APOYO PARA EL DISEÑO Y EJECUCIÓN DE EVALUACIONES ESTRATÉGICAS DE GOBIERNO

Ejemplos:     En  la  Economía,  como  uno  de  los  campos  de  mayor  aplicación  de  los  números  índices,  los  números  índices   más   habituales   utilizados   hacen   referencia   a   precios   (basándose   en   variables   medidas   en   unidades   monetarias   por   unidad   física),   cantidades   (medidos   en   unidades   físicas)   y   valor   (medidos   en   unidades   monetarias).     • El   índice   de   precios   es   el   de   mayor   uso,   compara   los   cambios   en   el   precio   entre   dos   períodos.   El   índice  de  precios  al  consumidor  mide  los  cambios  globales  de  precio  de  varios  bienes  de  consumo  y   también  de  los  servicios  y  se  utiliza  para  definir  el  costo  de  vida.  Uno  de  los  ejemplos  más  simples   de  un  número  índice  es  una  relación  de  precios,  que  no  es  sino  el  cociente  entre  el  precio  de  un   artículo  en  un  período  dado  y  su  precio  en  otro  período,  conocido  como  período  base  o  período  de   referencia.     • Por  su  lado  el  índice  de  cantidad,  mide  cuánto  cambia  en  el  tiempo  el  número  o  cantidad  de  una   variable,  en  vez  de  comparar  los  precios  de  un  artículo,  lo  que  interesa  es  comparar  las  cantidades   (o   volúmenes)   de   producción,   consumo   o   exportación.   En   tales   casos   se   habla   de   relaciones   de   cantidad  o  relaciones  de  volumen.     • En  cuanto  al  Índice  de  valor,  este  mide  los  cambios  del  valor  monetario  total,  mide  los  cambios  en   el   valor   monetario   de   una   variable.   En   efecto,   combina   los   cambios   de   precio   y   cantidad   para   presentar   un   índice   más   informativo,   por   ejemplo   si   “p”   es   el   precio   de   un   artículo   durante   un   periodo   y   “q”   es   la   cantidad   (o   volumen)   producida,   vendida,   etc.   Durante   ese   periodo,   entonces   “pq”  se  llama  el  valor  total.     Indices  compuestos   Este  tipo  de  índice  puede  consistir:       a) en   la   agregación   de   distintos   índices   simples   elaborados.   Retomando   uno   de   los   ejemplos   anteriores,  esto  podría  darse  combinando  los  índices  de  precios  para  diversos  bienes  y  uniéndolos   en   un   índice   agregado.   Todas   las   variables   empleadas   todavía   se   basarían   en   la   misma   unidad   de   medida.     b) En  otros  casos,  también  se  agregan  índices  basados  en  variables  con  distintas  unidades  de  medición   y  que  incluso  pueden  estar  midiendo  objetos  aparentemente  no  relacionados  uno  con  el  otro.  Por   ejemplo,   el   Indice   de   Desarrollo   Humano   (IDH)   agrega   índices   basados   en   variables   tan   dinstintas   como  las  expectativas  media  de  vida,  la  permanencia  media  en  la  educación  escolar,  y  el  Producto   Bruto   Interior   per   cápita   de   la   población   en   una   zona   determinada.   Nótese   que   la   situación   referencial  en  que  se  basa  dicho  índice  no  es  una  comparación  temporal,  sino  cociente  basado  en   los  máximos  y  mínimos  de  las  zonas  estudiadas.         Lo   anterior   evidencia   que   la   agregación   de   un   índice   puede   realizarse   según   muy   diversos   métodos   o   procedimientos,  siguiendo  algunas  propiedades,  tales  como  que  el  resultado  sea  un  número  índice  sencillo  y   que  en  el  mismo  se  reúna  gran  cantidad  de  información.      

8  

SISTEMA NACIONAL DE EVALUACIÓN SINE – COSTA RICA  

Ministerio de Planificación Nacional y Política Económica

En   la   medida   en   que   se   el   índice   contempla   más   de   una   variable,   se   plantea   la   pregunta   ¿cuánto   peso   deberá  tener  el  valor  de  cada  componente  para  determinar  el  valor  del  número  índice  final?.  Según  cual  sea   la  respuesta,  se  tienen  dos  categorías  de  índices  compuestos  distintas:     •  En   los   índices   compuestos   no   ponderados   prevalece   el   criterio   de   la   sencillez   frente   al   de   la   información  y  cada  componente  tendrá  el  mismo  peso.     •  En   los   índices   compuestos   ponderados   se   prima   la   información   frente   a   la   sencillez   y   se   busca   ponderar   el   peso   de   cada   componente   de   acuerdo   a   la   importancia   relativa   que   tiene,   ante   los   otros  componentes,  para  determinar  las  variaciones  del  objeto  de  medición  en  la  “realidad”.  

3.3.1  

Índices  de  agregados  ponderados  y  no  ponderados  

  Índices  no  ponderados   Los  precios  de  varios  artículos  o  mercancías  sencillamente  podrían  sumarse  tanto  para  el  caso  del  período   dado  como  para  el  del  período  base,  respectivamente  y  después  compararse  y  la  forma  más  sencilla  de  un   índice   compuesto   es   el   índice   no   ponderado   de   agregados.   No   ponderado   significa   que   todos   los   valores   incluidos  al  calcular  el  índice  tienen  igual  importancia.  Agregado  significa  que  se  suman  todos  los  valores.  La   principal   ventaja   de   este   índice   es   su   simplicidad.   El   índice   no   ponderado   de   agregados   se   obtiene   sumando   todos  los  elementos  del  compuesto  durante  cierto  periodo  y  dividiendo  después  el  resultado  entre  la  suma   de  los  mismos  elementos  durante  el  periodo  base.     Dentro   de   esta   categoría,   el   más   sencillo   es   el   que   define   el   índice   compuesto   como   la   media   aritmética   simple   de   los   índices   simples.   Al   mismo   se   le   conoce   como   Índice   de   Sauerbeck,   utilizado   para   precios   y   cantidades,  respectivamente,  otro  índice  compuesto  no  ponderado  utilizado  es  el  que  se  conoce  como  el  de   la  media  agregativa  simple  o  de  Bradstreet-­‐Dutot.  Este  consiste  en  sumar,  cuando  se  trata  de  un  índice  de   precios,   los   precios   de   todos   los   bienes   para   un   periodo   y   obtener   la   media   de   esos   precios.   Con   la   serie   resultante   se   obtendría   un   índice   simple   que   es,   de   hecho,   compuesto,   pues   en   el   mismo   se   han   reunido   los   precios   de   más   de   un   bien.   Este   procedimiento   tiene   el   inconveniente,   frente   al   anterior,   de   que   suma   inicialmente   magnitudes   que   puede   que   no   sean   homogéneas,   lo   que   lleva   a   que   el   índice   resultante   pierda   precisión.   Índices  ponderados   Con  el  fin  de  evitar  las  desventajas  del  índice  no  ponderado  de  agregados,  en  el  caso  del  índice  de  precios  se   asigna  un  peso  al  precio  de  cada  artículo,  en  general  la  cantidad  (o  volumen)  vendida  durante  el  año  base,   durante   el   año   dado.   Por   lo   general,   se   tiene   que   atribuir   mayor   importancia   a   los   cambios   de   algunas   variables   que   a   los   de   otras   al   calcular   un   índice.   Considerar   este   hecho   mediante   las   respectivas   ponderaciones  permite  incluir  más  información  al  índice  sin  que  este  pierda  su  precisión.      

9  

MATERIAL DE APOYO PARA EL DISEÑO Y EJECUCIÓN DE EVALUACIONES ESTRATÉGICAS DE GOBIERNO

BIBLIOGRAFÍA  

  CANSADO,  Enrique.  (1975).  Curso  de  estadística  general.  Centro  interamericano  de   enseñanza  de  estadística   (CIENES),  Santiago  de  Chile.     KASMIER,  Leonard  J.  (2000).  Estadística  aplicada  a  la  administración  y  a  la  economía.  3era  edición.  México,   Mcgraw-­‐Hill.     LEVIN,  Richard.  (1996).  Estadística  para  administradores.  Sexta  edición.  Pearson  educación.     MURRAY,  Spiegel.  (1991).  Estadística.  2da  edición.  México,  Mcgraw-­‐Hill.     ROSENBAUM,   Roberta   S.   Y   HIGHLAND,   Esther   H.   (1987).   Matemáticas   Financieras,   3era   edición.   Prentice   Hall.     YAMANE,  Taro,  Ed.  Harla.  ESTADISTICA,  México  DF.  1979.     SÁNCHEZ  FERNÁNDEZ,  Jesús  Introducción  a  la  Estadística  Empresarial.  Capítulo  5.-­‐  Números  índices.  

10  

SISTEMA NACIONAL DE EVALUACIÓN SINE – COSTA RICA  

Ministerio de Planificación Nacional y Política Económica

Material 6.1.2: Muestreo Texto:     Casal,  J.  &  Mateu,  E.  (2003):  Tipos  de  Muestreo,  en:  Riv.  Epidem.  Med.  Prev.,  No.  1,  2003,  pp.  3-­‐ 7.  Accesible  en  línea  en:  http://minnie.uab.es/~veteri/21216/TiposMuestreo1.pdf   Tipos de muestreo

Rev. Epidem. Med. Prev. (2003), 1: 3-7

TIPOS DE MUESTREO Jordi Casal1, Enric Mateu CReSA. Centre de Recerca en Sanitat Animal / Dep. Sanitat i Anatomia Animals, Universitat Autònoma de Barcelona, 08193-Bellaterra, Barcelona

RESUMEN Se discute la utilidad del muestreo y se describen los distintos tipos de muestreo que se pueden aplicar para tomar una muestra de la población. La selección intencionada o muestreo por conveniencia consiste en un muestreo no aleatorio, por lo que suele presentar sesgos. El muestreo aleatorio puede realizar se varias maneras. El muestreo aleatorio simple consiste en elegir cada uno de los individuos al azar mediante números aleatorios. El muestreo sistemático consiste en elegir el primer individuo al azar y el resto de manera sistemática. El muestreo aleatorio estratificado consiste en dividir la población en grupos en función de una característica determinada y realizar a continuación el muestreo proporcionalmente. Finalmente el muestreo por conglomerados consiste en definir grupos de características semejantes e incluir en la muestra varios de estos grupos. Para cada método se discuten las ventajas e inconvenientes.

INTRODUCCIÓN En sanidad animal podemos necesitar información sobre una población para determinar la prevalencia de una enfermedad o infección subclínica, para determinar simplemente la presencia o la ausencia de una enfermedad o bien puede interesarnos conocer posibles causas o factores de riesgo mediante estudios epidemiológicos. En cualquiera de estos casos, podemos analizar toda la población, es decir, realizar un censo, o bien examinar sólo una parte de ella mediante un muestreo. Si examinamos toda la población, podemos conocer exactamente la distribución que presenta la variable o las variables estudiadas en dicha población. Sin embargo, en la mayoría de los casos, los censos son inviables o como mínimo innecesarios. Los censos son lentos y caros (hay que examinar una gran cantidad de individuos, lo cual requiere tiempo y dinero) y poco flexibles (debido a su complejidad, es muy difícil modificarlos cuando se han puesto en marcha). Tratar una gran cantidad de individuos requiere disponer de personal entrenado, instalaciones (laboratorios, centros de tratamientos de datos,...) que no siempre están disponibles, en estos casos un censo puede ser irrealizable, o bien puede realizarse sin los recursos necesarios, de modo que, los datos obtenidos pueden contener errores y por

1

[email protected]

3

11  

MATERIAL DE APOYO PARA EL DISEÑO Y EJECUCIÓN DE EVALUACIONES ESTRATÉGICAS DE GOBIERNO

Tipos de muestreo

Rev. Epidem. Med. Prev. (2003), 1: 3-7

tanto, en contra de lo que parece inicialmente, no necesariamente van a proporcionar una buena información. Una alternativa a los censos será la medición de estas variables en una parte de la población, es decir, en una muestra. Trabajar con una muestra de la población tiene la ventaja de que es más rápido, más barato y los resultados obtenidos pueden ser más precisos, de modo que, si la muestra se elige correctamente, la información que obtenemos permite una estimación razonable de la situación de la población. Cuando nos planteamos tomar una muestra, surgen dos preguntas: ¿Qué individuos debo incluir en la muestra? ¿Cuántos individuos debo tomar? En este capítulo intentaremos responder a la primera pregunta, mientras que en el siguiente trataremos la segunda. Cuando el objetivo es conocer la cantidad de enfermedad o cuando queremos realizar un estudio epidemiológico cuyos resultados debemos extrapolar a la población general, un requisito indispensable es que la muestra sea representativa de la población general, por tanto la muestra debe tomarse al azar. Cuando el objetivo es conocer si una enfermedad existe o no en una población, también podemos tomar una muestra aleatoria, pero en la mayoría de los casos, lo más apropiado será tomar una muestra sesgada, de modo que analizaremos aquellos individuos que tienen mayor posibilidad de estar enfermos. La mejor opción para obtener una muestra representativa es elegir los individuos al azar mediante un muestreo aleatorio, es decir, seleccionando los individuos de manera que todos ellos tenga la misma probabilidad de formar parte de la muestra. Cuando estos no es posible la alternativa será elegir a los individuos según un muestreo de conveniencia. El método para elegir la muestra recibe el nombre de muestreo. Para describir el proceso del muestreo, debemos utilizar una terminología precisa que facilitarán la comprensión de algunas partes de estos temas: ? Población total o población objetivo. Es el grupo de individuos del que se pretende obtener información. ? Población estudiada. A menudo, la población no es accesible en su totalidad, y deberemos trabajar sólo sobre una parte de ella, que será. Por tanto la población estudiada será la población de la que se obtiene la muestra. ? Marco de la encuesta. Es el listado de los individuos de la población. A veces, no es necesario disponer de todo el listado, p. ej en el muestreo por conglomerados ? Unidad de la encuesta. Es cada individuo de la población estudiada (animales, granjas, municipios, etc.) Según el tipo de muestreo se puede diferenciar entre unidades primarias, secundarias, etc. ? Fracción de la encuesta. Es la proporción de individuos de la población estudiada que forma parte de la muestra. ? Sesgo. Son los errores sistemáticos (diferentes de los errores de estimación).

4

12  

SISTEMA NACIONAL DE EVALUACIÓN SINE – COSTA RICA  

Ministerio de Planificación Nacional y Política Económica

Tipos de muestreo

Rev. Epidem. Med. Prev. (2003), 1: 3-7

EL MUESTREO POR SELECCIÓN INTENCIONADA O MUESTREO DE CONVENIENCIA Consiste en la elección por métodos no aleatorios de una muestra cuyas características sean similares a las de la población objetivo. En este tipo de muestreos la “ representatividad” la determina el investigador de modo subjetivo, siendo este el mayor inconveniente del método ya que no podemos cuantificar la representatividad de la muestra. Presenta casi siempre sesgos y por tanto debe aplicarse únicamente cuando no existe alternativa. En algunos casos, especialmente cuando se requiere una estrecha colaboración por parte de los ganaderos o veterinarios de campo, es la única opción para que el estudio sea viable. Supongamos que queremos realizar un estudio longitudinal consistente en tomar muestras de los animales de la explotación cada mes, o llevar diariamente unos registros determinados de la granja, la mejor opción será realizar el estudio en granjas de confianza que permitan las manipulaciones y tengamos garantías de que el trabajo se llevará a cabo correctamente. También puede ser útil cuando se pretende realizar una primera prospección de la población o cuando no existe un marco de la encuesta definido. Este tipo de muestreos puede incluir individuos próximos a la media o no, pero casi nunca representará la variabilidad de la población, que normalmente quedará subestimada. EL MUESTREO ALEATORIO En el muestreo aleatorio todos los elementos tienen la misma probabilidad de ser elegidos. Los individuos que formarán parte de la muestra se elegirán al azar mediante números aleatorios. Existen varios métodos para obtener números aleatorios, los más frecuentes son la utilización de tablas de números aleatorios o generarlos por ordenador. El muestreo aleatorio puede realizarse de distintas maneras, las más frecuentes son el muestreo simple, el sistemático, el estratificado y el muestreo por conglomerqados. Muestreo aleatorio simple. Es el método conceptualmente más simple. Consiste en extraer todos los individuos al azar de una lista (marco de la encuesta). En la práctica, a menos que se trate de poblaciones pequeñas o de estructura muy simple, es difícil de llevar a cabo de forma eficaz. Ejemplo: Se pretende determinar la prevalencia de Maedi en una explotación de 250 ovejas: para ello se deben examinar 61 animales (se supone una prevalencia del 30% y se desea una precisión del 10% para un nivel de confianza del 95%): se obtienen 61 números

Figura 1. Representación gráfica del muestreo aleatorio simple. 5

13  

MATERIAL DE APOYO PARA EL DISEÑO Y EJECUCIÓN DE EVALUACIONES ESTRATÉGICAS DE GOBIERNO

Tipos de muestreo

Rev. Epidem. Med. Prev. (2003), 1: 3-7

entre el 1 y el 250 de una tabla de números aleatorios y se sangran los animales correspondientes (en función del número de crotal o según el orden por el que se hacen pasar por una manga). Muestreo sistemático. En este caso se elige el primer individuo al azar y el resto viene condicionado por aquél. Este método es muy simple de aplicar en la práctica y tiene la ventaja de que no hace falta disponer de un marco de encuesta elaborado. Puede aplicarse en la mayoría de las situaciones, la única precaución que debe tenerse en cuenta es comprobar que la característica que estudiamos no tenga una periodicidad que coincida con la del muestreo (por ejemplo elegir un día de la semana para tomar muestras en un matadero, ya que muchos ganaderos suelen sacrificar un día determinado).

Figura 2. Representación gráfica del muestreo aleatorio sistemático.

Ejemplo: En el caso anterior debemos tomar uno de cada cuatro animales (250/61); en vez de tomar 61 números aleatorios tomamos sólo uno (entre el uno y el cuatro), por ejemplo el número 3, de modo que tomaremos la oveja número 3, y a continuación cada cuarto animal (la 7, la 11, la 15 y así sucesivamente hasta llegar a la 247). Muestreo aleatorio estratificado. Se divide la población en grupos en función de un carácter determinado y después se muestrea cada grupo aleatoriamente, para obtener la parte proporcional de la muestra. Este método se aplica para evitar que por azar algún grupo de animales este menos representado que los otros. El muestreo estratificado tiene interés cuando la característica en cuestión puede estar relacionada con la variable y% x% que queremos estudiar. Cuando se y% realiza un muestreo cuya unidad sean las granjas, la estratificación se aplica z% z% frecuentemente en relación al tamaño w% de granja o a la aptitud de los animales, w ya que muchas enfermedades presentan % prevalencias diferentes en función del tamaño de la granja o a si se trata por Figura 3. Representación gráfica del muestreo ejemplo de razas de aptitud lechera o aleatorio estratificado. cárnica. Si la unidad son los animales, se suele estratificar en función de la edad ya que ésta suele influir en muchas enfermedades.

x%

N

n

Ejemplo: La probabilidad de que una oveja esté infectada de Maedi está directamente relacionada con la edad. En el ejemplo anterior, la explotación tiene el 44% de los animales de menos de 2 años, el 28% de 3-4 años, el 18% de 5-6 y el 10% son animales de más de seis años: el 44% de los 61 animales de la muestra (27 animales) se tomará al azar

14  

6 SISTEMA NACIONAL DE EVALUACIÓN SINE – COSTA RICA  

Ministerio de Planificación Nacional y Política Económica

Tipos de muestreo

Rev. Epidem. Med. Prev. (2003), 1: 3-7

entre los de 1-2 años, el 28% entre los de 3-4 años y así sucesivamente (17, 11 y 6 animales de los otros tres grupos). Este método evita que por casualidad (por azar) se tomen más individuos de un grupo que de los demás y esto pueda condicionar el resultado. Muestreo aleatorio por conglomerados. Se divide la población en varios grupos de características parecidas entre ellos y luego se analizan completamente algunos de los grupos, descartando los demás. Dentro de cada conglomerado existe una variación importante, pero los distintos conglomerados son parecidos. Requiere una muestra más grande, pero suele simplificar la recogida de muestras. Frecuentemente los conglomerados se aplican a zonas geográficas.

Figura 4. Representación gráfica del muestreo aleatorio por conglomerados.

Muestreo mixto. Cuando la población es compleja, cualquiera de los métodos descritos puede ser difícil de aplicar, en estos casos se aplica un muestreo mixto que combina dos o más de los anteriores sobre distintas unidades de la encuesta. Ejemplo: se pretende determinar la prevalencia de una determinada infección en una comarca: se dividen las explotaciones en tres grupos en función de su tamaño y se realiza un muestreo estratificado, en las granjas que forman la muestra se realiza un muestreo sistemático para elegir los individuos que se analizarán.

15   7

MATERIAL DE APOYO PARA EL DISEÑO Y EJECUCIÓN DE EVALUACIONES ESTRATÉGICAS DE GOBIERNO

Material 6.1.3: Muestreo en la investigación cualitativa Texto:   Martín-­‐Crespo,  M.  &  Salamanca  Castro,  A.  (2007):  El  muestreo  en  la  investigación  cualitativa.   Madrid:  FUDEN.  Accesible  en  línea  en:   http://www.fuden.es/FICHEROS_ADMINISTRADOR/F_METODOLOGICA/FMetodologica_27.pdf   Es  habitual  que  en  investigación   cualitativa   el   diseño   del   estudio   evolucione   a   lo   largo   del   proyecto,   por   eso   se   dice   que   es   emergente.   En   el   caso   del   muestreo   sucede   lo   mismo,   la   decisión   sobre   el   mejor   modo   de   obtener   los   datos   y   de   quién   o   quiénes   obtenerlos   son   decisiones   que   se   toman   en   el   campo,   pues   queremos   reflejar   la   realidad   y   los   diversos   puntos   de   vista   de   los   participantes,   los   cuales   nos   resultan   desconocidos  al  iniciar  el  estudio.     En   los   estudios   cualitativos   casi   siempre   se   emplean   muestras   pequeñas   no   aleatorias,   lo   cual   no   significa   que  los  investigadores  naturalistas  no  se  interesen  por  la  calidad  de  sus  muestras,  sino  que  aplican  criterios   distintos   para   seleccionar   a   los   participantes.   Debido   al   pequeño   tamaño   muestral   una   de   las   limitaciones   frecuentemente  planteada  con  relación  al  enfoque  cualitativo  es  que  la  representatividad  de  los  resultados   se  pone  en  duda,  pero  debemos  tener  en  cuenta  que  el  interés  de  la  investigación  cualitativa  en  ocasiones   se   centra   en   un   caso   que   presenta   interés   intrínseco   para   descubrir   significado   o   reflejar   realidades   múltiples,  por  lo  que  la  generalización  no  es  un  objetivo  de  la  investigación.     Cuando   el   fin   de   la   investigación   cualitativa   es   la   generalización   tenemos   dos   posibilidades   en   función   del   objetivo  perseguido:     1.     El  fin  de  la  investigación  es  el  desarrollo  y  examen  de  una  teoría,  entonces  la  selección  de  los  casos  se   debe  diseñar  de  forma  que  se  puedan  generar  tantas  categorías  y  propiedades  como  sean  posibles,  y   relacionarlas   entre   sí.   Es   lo   que   Glasser   y   Strauss   (año)   denominan   muestras   teóricas,   que   buscan   representar  un  problema  teórico  seleccionando  situaciones  sociales  que  ofrezcan  observables  sobre  las   categorías  de  análisis.  Para  ello  recomiendan  dos  estrategias  complementarias:     • Minimizar   las   diferencias   entre   los   casos   con   el   fin   de   sacar   a   la   luz   propiedades   básicas   de   una   categoría  particular.     • Posteriormente  maximizar  las  diferencias  entre  los  casos  con  la  intención  de  incrementar  categorías  y   acotar  la  incidencia  de  la  teoría.     2.     El   fin   de   la   investigación   es   la   generalización   de   un   grupo   finito   de   casos.   Es   importante   valorar   la   tipificación   de   casos   estudiados   mediante   la   comparación   de   las   características   relevantes   con   información   de   las   estadísticas   oficiales   o   de   otros   estudios   sobre   la   población.   Se   puede   utilizar   el   estilo   bola   de   nieve   que   se   basa   en   la   idea   de   red   social   y   consiste   en   ampliar   progresivamente   los   sujetos  de  nuestro  campo  partiendo  de  los  contactos  facilitados  por  otros  sujetos.     La   estrategia   para   seleccionar   casos   puede   variar   a   lo   largo   de   la   investigación:   en   las   primeras   fases,   los   casos  escogidos  tal  vez  no  tengan  gran  relevancia,  aunque  más  adelante  pueden  adquirir  una  considerable   importancia.   Los   investigadores   cualitativos   suelen   evitar   las   muestras   probabilísticas,   puesto   que   lo   que   buscamos  son  buenos  informantes,  es  decir,  personas  informadas,  lúcidas,  reflexivas  y  dispuestas  a  hablar   ampliamente   con   el   investigador.   Existen   diversos   diseños   de   muestreo   no   probabilístico   utilizados   en   los  

16  

SISTEMA NACIONAL DE EVALUACIÓN SINE – COSTA RICA  

Ministerio de Planificación Nacional y Política Económica

estudios  naturalistas:     •   Muestreo  por  conveniencia.  Se  suele  utilizar  sobre  todo  al  principio  una  muestra  por  conveniencia   que   se   denomina   muestra   de   voluntarios,   y   se   utiliza   si   el   investigador   necesita   que   los   posibles   participantes  se  presenten  por  sí  mismos.  Este  muestreo  es  fácil  y  eficiente  pero  no  es  uno  de  los   preferidos   debido   a   que   en   estos   estudios   la   clave   es   extraer   la   mayor   cantidad   posible   de   información  de  los  pocos  casos  de  la  muestra,  y  el  método  por  conveniencia  puede  no  suministrar   las   fuentes   más   ricas   en   información.   Es   un   proceso   fácil   y   económico   que   permite   pasar   a   otros   métodos  a  medida  que  se  colectan  los  datos.     •   Muestreo   de   avalancha.   Consiste   en   pedir   a   los   informantes   que   recomienden   a   posibles   participantes.  También  se  denomina  muestreo  nominado,  en  bola  de  nieve  o  muestreo  en  cadena.   Es  más  práctico  y  eficiente  que  el  anterior  en  cuanto  al  coste,  además,  gracias  a  la  presentación  que   hace   el   sujeto   ya   incluido   en   el   proyecto,   resulta   más   fácil   establecer   una   relación   de   confianza   con   los  nuevos  participantes,  también  permite  acceder  a  personas  difíciles  de  identificar.  Por  último,  el   investigador   tiene   menos   problemas   para   especificar   las   características   que   desea   de   los   nuevos   participantes.   Como   inconvenientes   tenemos   la   posibilidad   de   obtener   una   muestra   restringida   debido   a   la   reducida  red  de  contactos.  Además  la  calidad  de  los  nuevos  participantes  puede  estar  influida  por   el   hecho   de   que   los   sujetos   que   invitaron   confiaran   en   el   investigador   y   realmente   desearan   cooperar.     •   Muestreo   teórico.   También   denominado   muestreo   intencionado.   Aunque   se   inicie   el   muestreo   mediante   voluntarios   y   se   realice   posteriormente   un   proceso   de   avalancha,   habitualmente   se   avanza   hacia   una   estrategia   de   muestreo   deliberado   a   lo   largo   del   estudio,   basándonos   en   las   necesidades  de  información  detectadas  en  los  primeros  resultados.     En   la   investigación   cualitativa   la   relación   entre   problemas   de   investigación   y   los   casos   seleccionados   debe   ser  revisada  continuamente.     En  este  tipo  de  investigación  se  debe  decidir  cuándo  y  dónde  observar  ycon  quién  conversar,  así  como  qué   información  registrar  y  cómo  hacerlo.  Con  este  proceso  estamos  decidiendo  no  sólo  que  es  lo  relevante  o   no,  sino  también  estamos  extrayendo  varias  muestras  de  la  información  disponible.     Es   importante   establecer   lo   más   sistemáticamente   posible   los   criterios   utilizados   para   asegurar   así   que   la   muestra   ha   sido   adecuadamente   escogida.   Para   ello   existen   tres   grandes   dimensiones   a   lo   largo   del   proceso   de  extracción  de  muestras  a  tener  en  cuenta:  el  tiempo,  las  personas  y  el  contexto.     •   El  tiempo  es  una  dimensión  importante  en  la  vida  social.  Las  actividades  y  las  actitudes  en  el  campo   suelen  variar  a  lo  largo  del  tiempo  de  forma  significativa.  Zerubavel  (año)    investigó  sobre  el  tiempo   en  los  hospitales.  Es  distinta  la   actividad  de  un  servicio  de  urgencias  según  la  hora  del  día  o  incluso   según  el  día  de  la  semana.  Es  imposible  realizar  trabajo  de  campo  las  24  horas  al  día  por  lo  que  es   inevitable   tomar   muestras   de   lapsos   temporales.   Además,   no   se   recomiendan   largos   períodos   de   observación   ininterrumpidos,   ya   que   deben   seguirse   de   otros   períodos   de   sistematización   y   reflexión  sobre  el  material  para  obtener  una  información  de  calidad.     •   Las  personas.  Ningún  medio  es  socialmente  homogéneo  y  la  representación  adecuada  de  la  gente   involucrada   en   un   caso   particular   requiere   tomar   muestras,   a   menos   que   el   total   de   la   población   investigada  pueda  ser  estudiada  en  su  totalidad.  

17  

MATERIAL DE APOYO PARA EL DISEÑO Y EJECUCIÓN DE EVALUACIONES ESTRATÉGICAS DE GOBIERNO

  El   muestreo   de   las   personas   puede   realizarse   con   criterios   demográficos   estandarizados   como   género,   raza,   edad,   ocupación,   nivel   de   instrucción,   etc.   Estas   categorías   son   importantes   sólo   cuando  son  relevantes  para  la  teoría  que  se  está  desarrollando  o  para  contraponerlas  a  categorías   rivales,   y   normalmente   han   de   ser   complementadas   por   otras   categorías   de   relevancia   en   la   investigación  y  que  son  elaboradas  por  el  propio  investigador.     •   Lugar   y   contexto.   Dentro   de   cualquier   ambiente   se   pueden   distinguir   contextos   muy   diferentes   y   el   comportamiento  de  las  personas  actúa  en  función  del  contexto  en  el  que  están.     Es  importante  no  confundir  los  lugares,  el  espacio  físico,  con  los  contextos,  que  es  un  espacio  social.   Debemos   identificar   los   contextos   en   función   de   cómo   los   individuos   actúan   en   ellos,   reconociendo   que   son   construcciones   sociales   y   no   localizaciones   físicas   e   intentar   asegurarnos   que   tomamos   muestras  de  todos  los  que  son  relevantes.     Respecto   al   tamaño   de   la   muestra   no   hay   criterios   ni   reglas   firmemente   establecidas,   determinándose   en   base  a  las  necesidades  de  información,  por  ello,  uno  de  los  principios  que  guía  el  muestreo  es  la  saturación   de   datos,   esto   es,   hasta   el   punto   en   que   ya   no   se   obtiene   nueva   información   y   ésta   comienza   a   ser   redundante.     El  proceso  de  muestreo  podría  evolucionar  como  sigue:     1.     El   investigador   empieza   con   una   noción   general   de   dónde   y   con   quién   comenzar.   Se   suelen   utilizar   procedimientos  de  conveniencia  o  avalancha.   2.     La  muestra  se  selecciona  de  manera  seriada,  es  decir,  los  miembros  sucesivos  de  la  muestra  se  eligen   basándonos  en  los  ya  seleccionados  y  en  qué  información  han  proporcionado.   3.     Con   frecuencia   se   utilizan   informantes   para   facilitar   la   selección   de   casos   apropiados   y   ricos   en   información.   4.     La  muestra  se  ajusta  sobre  la  marcha.  Las  nuevas  conceptualizaciones  ayudan  a  enfocar  el  proceso  de   muestreo.   5.     El  muestreo  continúa  hasta  que  se  alcanza  la  saturación.     6.     El  muestreo  final  incluye  una  búsqueda  de  casos  confirmantes  y  desconfirmantes     (Selección  de  casos  que  enriquecen  y  desafían  las  conceptualizaciones  de  los  investigadores).     Por  lo  tanto  en  la  investigación  cualitativa  la  información  es  la  que  guía  el  muestreo,  y  por  ello  es  preciso   que  evolucione  en  el  propio  campo  ya  que  es  necesario  que  cubra  todos  los  requerimientos  conceptuales   del  estudio,  y  no  la  adaptación  a  unas  reglas  metodológicas.    

18  

SISTEMA NACIONAL DE EVALUACIÓN SINE – COSTA RICA  

Ministerio de Planificación Nacional y Política Económica

Apartado 6.2: Técnicas para el levantamiento de datos Material 6.2.1: Material de apoyo para encuestas y la construcción de cuestionarios Texto:     Morales  Vallejo,  P.:  Construir  Cuestionarios  y  Escalas.  Madrid:  Universidad  Pontificia  Comillas.   Accesible  en  línea  en:     Comentario: Personalmente creo que colocar un texto escaneado como parte del documento no es estéticamente presentable. Recomendaría colocarlo como adjunto, como si fuera material de apoyo para los lectores.

 

19  

MATERIAL DE APOYO PARA EL DISEÑO Y EJECUCIÓN DE EVALUACIONES ESTRATÉGICAS DE GOBIERNO !"#$%&$'$%()*+,'"-'%(".+,-)*$'-)+%/%.+($0$+%1.%$(,-,"1.+%

¤Pedro Morales Vallejo, Universidad Pontificia Comillas, Madrid, (Última revisión, 8 de Septiembre de 2011)

ÍNDICE 1. Cuestionarios y escalas ...................................................................................................... 3 1.1. Cautelas iniciales en la construcción de cuestionarios y escalas ............................... 4 1.2. Preguntas de identificación personal en cuestionarios y escalas ............................... 5 1.2.1. Orientaciones generales ................................................................................... 5 1.2.2. El anonimato en los cuestionarios y escalas .................................................... 6 1.2.3. Cuando interesa disponer de información sobre el rendimiento académico.... 7 1.3. Los cuestionarios: ¿Podemos ‘medir’ actitudes con una sola pregunta?................... 8 1.4. La validez de los cuestionarios .................................................................................. 9 2. Los ítems o preguntas de cuestionarios y escalas.............................................................. 10 2.1. Ítems en forma de opiniones ...................................................................................... 11 2.2. Ítems en forma de conductas o casos ......................................................................... 11 a) Conductas o hábitos personales ........................................................................... 11 b) Conductas ajenas o casos ..................................................................................... 12 2.3. Ítems bipolares ........................................................................................................... 12 2.4. Listas de adjetivos ...................................................................................................... 15 a) Varios adjetivos expresan el mismo rasgo o actitud ............................................ 15 b) Cada adjetivo expresa un rasgo distinto............................................................... 16 2.5. Bloques de ítems del mismo ámbito .......................................................................... 17 2.6. Cuando el énfasis está en la medición de valores ...................................................... 19 2.7. Listas de ordenamiento............................................................................................... 20 2.8. Escoger más de una respuesta .................................................................................... 21 2.9. Preguntas abiertas....................................................................................................... 22 3. Las respuestas de cuestionarios y escalas.......................................................................... 22 3.1. Tipos de respuestas .................................................................................................... 22 3.2. Número de respuestas ................................................................................................ 25 3.3. Número par o impar de respuestas............................................................................. 25 4. Las escalas de actitudes ..................................................................................................... 26 4.1. Por qué construimos escalas en vez de limitarnos a una sola pregunta..................... 26 4.2. Fases del proceso y estructura de todo el cuestionario ............................................. 28 4.2.1. Fases en el proceso de construcción de una escala de actitudes...................... 28 4.2.2. Estructura del instrumento............................................................................... 29 5. Puntos de partida en la construcción de una escala ........................................................... 30 5.1. Definición y retrato robot.......................................................................................... 30 5.2. Revisión de instrumentos ........................................................................................... 31 5.3. Traducción de otro idioma ......................................................................................... 32 5.4. Estudio cualitativo previo .......................................................................................... 33 6. Características de los ítems de las escalas de actitudes................................................... 34 6.1. En forma de opiniones................................................................................................ 34 6.2. Relevancia y claridad ................................................................................................. 34 6.3. Discriminación ........................................................................................................... 35 6.4. Equilibrio entre ítems positivos y negativos .............................................................. 35 6.5. Ítems negativos y discriminación............................................................................... 36 6.6. Formulación de los ítems en función de los componentes de las actitudes ............... 38 a) Conocimientos...................................................................................................... 38 b) Sentimientos ......................................................................................................... 39 c) Conductas............................................................................................................. 39

182

2 7. Preparar la clave de corrección ........................................................................................ 40 8. Número de ítems .............................................................................................................. 40 8.1. Número inicial de ítems .......................................................................................... 40 8.2. Número de ítems y fiabilidad .................................................................................. 41 8.3. Características de las escalas muy breves................................................................ 42 9. Preparar preguntas o instrumentos adicionales ................................................................. 43 9.1. Comprobar la validez de la escala ............................................................................. 44 9.2. Responder a preguntas de investigación.................................................................... 44 10. Obtener datos de una muestra .............................................................................................. 44 10.1. Tipo de muestra........................................................................................................... 44 10.2. Número de sujetos....................................................................................................... 45 10.3. Cuando la muestra es muy pequeña ............................................................................ 45 10.4. Las pruebas piloto y la validación de expertos ........................................................... 47 11. Introducir los datos en un programa informático ................................................................. 48 11.1. Los datos en EXCEL................................................................................................... 48 11.2. Cuando algunos sujetos omiten la respuesta a algunos ítems ..................................... 49 12. Proceso de análisis de una escala de actitudes: finalidad del análisis de ítems e interpretación del coeficiente de fiabilidad. ................................................................... 51 12.1. Análisis de ítems ...................................................................................................... 53 12.1.1. Correlación ítem-total .................................................................................... 53 12.1.2. Contraste de medias en cada ítem entre los dos grupos con puntuaciones mayores y menores en el total de la escala .................................................... 56 12.2. Cálculo de la fiabilidad ............................................................................................ 58 12.2.1. Cómo estimar la fiabilidad en una nueva muestra a partir de la fiabilidad conocida en otra muestra y de las desviaciones de las dos muestras............. 59 12.2.2. Cuándo un coeficiente de fiabilidad es suficientemente alto......................... 60 12.3. Selección de los ítems definitivos............................................................................ 61 12.3.1. Según el análisis de ítems .............................................................................. 61 12.3.2. Otros criterios en torno a la elección de los ítems definitivos....................... 62 1º Equilibrio entre ítems positivos y negativos ................................................ 62 2º Cuidar más la representatividad del contenido de los ítems ....................... 63 3º Incluir de manera equilibrada aspectos distintos del mismo rasgo general (subescalas) ......................................................... 63 4º Incorporación de nuevos ítems .................................................................... 64 5º Preparación de dos versiones, corta y larga, de la misma escala ................. 64 12.3.3. Explicación o redefinición del rasgo medido por nuestro instrumento .......... 64 13. Comprobación de la validez de la escala y otros análisis posteriores .................................. 65 13.1. Conceptos básicos sobre la validez de tests y escalas................................................ 65 13.2. Sugerencias para obtener datos adicionales que faciliten la validación de la escala . 67 13.2.1. Confirmación del significado pretendido (validez de constructo) ................... 68 a) Análisis correlacionales ................................................................................. 68 1º Relación con otros modos de medir el mismo rasgo ................................. 68 2º Comprobación de relaciones esperadas con otras variables.................... 69 3º Comprobar que no hay relación donde no esperamos que la haya .......... 72 b) Comparaciones entre grupos ......................................................................... 72 13.2.2. Confirmación de la utilidad del instrumento (validez predictiva) ................... 73 14. Bibliografía........................................................................................................................... 74 14.1. Referencias bibliográficas.......................................................................................... 74 14.2. Bibliografía sobre construcción de instrumentos....................................................... 78 14.3. Bibliografía sobre colecciones de instrumentos......................................................... 79G

SISTEMA NACIONAL DE EVALUACIÓN SINE – COSTA RICA

 

MATERIAL DE APOYO PARA EL DISEÑO Y EJECUCIÓN DE EVALUACIONES ESTRATÉGICAS DE GOBIERNO 4

3 1. Cuestionarios y escalas En primer lugar hay que aclarar qué entendemos aquí por cuestionario y qué entendemos por escala o test. Un cuestionario según, el diccionario, es una lista de preguntas que se proponen con cualquier fin; los cuestionarios sociológicos, de evaluación, y en general los sondeos de opinión son ejemplos típicos. En los cuestionarios convencionales, los más habituales, las respuestas se analizan de manera independiente. Un test o una escala de actitudes son también cuestionarios pero con estas características: 1) Todas las preguntas (ítems) son indicadores del mismo rasgo o actitud,

C$#+*#&3$&*#=%(#$%.('(#(0#+*$# (@7&(0($#.*09(0.3*0"+($#'(# .*0*.3&3(0)*$#D.*&*#+"$#-,%(A"$# *AE()39"$#)3-*#)($)FG#"#."'"#$%E()*#$(# +(#$%&"0#$%$#,($-%($)"$#.*,,(.)"$#4# ($)(#)*)"+#($#(+#'")*#=%(#$(#)3(0(#(0# .%(0)"#-","#."+383.",#

2) Las respuestas de cada sujeto se van a sumar en un total que indica dónde se encuentra o cuánto tiene de la variable o característica que pretendemos medir.

También suelen denominarse escalas las preguntas con respuestas graduadas (como mucho, bastante, poco, nada, o en términos de frecuencia, importancia, etc.), frecuentes en todo tipo de cuestionarios, aunque las respuestas no se vayan a sumar en un único total porque cada pregunta mide algo distinto. Independientemente de los términos que utilicemos, las diferencias entre lo que denominamos cuestionarios y escalas (o tests) están esquematizadas en la figura 1. B")%,"+(5"# '(#+*$#1)(&$ >(+(..3;0 '(#+*$#1)(&$ 2")*$# 30)(,-,()"'*$# 4#%)3+35"'*$

:%($)3*0",3*$#

?($)$#4#($."+"$

:*0#."'"#%0*#$(#*A)3(0(#

?*'*$#+*$#1)(&$#(@-,($"0

:,3)(,3*$#+;/3.*$
#:'%"#?%-?.%3%)%+"("'-.(-.%+"8%:(+,("%,')1" 9("D*'(-",("?*(9("%B*9%+

!""#"/

!""#",*B"&()*+1

4G"K%&.%+".'(,?1"B"(-(+)C%&"(%B*9%+"%"?(+&1-%&"D*("-1"?*(9(-" 3/"2+,8/"/3B",=B"4=+53"+5"6

!""""#""""$""""%""""&

!""""#""""$""""%""""&

#("73"/=+>3"9+5+."4=+51/"@1>*?*@1@*35+/"+5"6

!""""#""""$""""%""""&

!""""#""""$""""%""""&

$(":+".+/=>91"?8@*>"+/9=2*1."6

!""""#""""$""""%""""&

!""""#""""$""""%""""&

%(":+"/*+593"2+/15*,123;"/*5"+/-+.150*>?+.+06+ @))));)+0)*+1,-'+.*/ &@);)*$%&(%#

4&3&)"'>*$%&(%#

5&$&)'/ #-)#-%23"&$)#-)32$*)A)&.2$$"3* 0/D)'268*

7&-%&(%#)32$*) A)&.2$$"3*

+,-)."#()(*

5*$)-2>2#-%*) C2#)(*

B*)#-%23"*)-*.$#)%*3*)>*$C2#)'#)12-%&)#-%23"&$)A)-&.#$)6*-&-

ordinariamente

a veces

0/D)>#$*)(*)'268*

0/

+,-)."#()(*

5*$)-2>2#-%*) C2#)(*

Figura 17

Figura 19

Sobre todo con niños (y siempre que sea realista hacerlo) estas respuestas en términos de frecuencia son más claras y contribuyen a aumentar la fiabilidad cuando se expresan de manera más específica, por ejemplo todos los días, una o dos veces por semana, etc.; o si se trata de tiempo empleado en ver televisión al día nunca, menos de una hora, entre una y dos horas, más de dos horas, etc. En estos casos y para establecer unos intervalos de tiempo realistas conviene obtener antes algún tipo de información39

No siempre es fácil encontrar suficientes respuestas verbales bien graduadas y que tengan un significado claro; cabe, como vamos viendo, combinar números y expresiones verbales; e incluso con alguna ayuda de tipo gráfico, como en el ejemplo de la figura 20 en el que tenemos un único ítem para evaluar un programa de formación (adaptado de Davies, 2008).

38 La justificación de estas categorías de respuesta, y un listado mayor, puede verse en Cañadas y Sánchez Bruno, (1998). 39 Stapleton et al. (2010) citan varios estudios que confirman esta mayor fiabilidad cuando las respuestas ofrecidas son más específicas.

193

40 Por ejemplo, Chang, 1997, con dos muestras de 173 y 108 sujetos. La fiabilidad test-retest (la correlación cuando se responde al mismo test dos veces con un intervalo de al menos una semana) suele ser mayor (mayor estabilidad en las respuestas) cuando todas las categorías de respuesta están expresadas verbalmente (Weng, 2004, con una muestra de 1247 estudiantes universitarios). 41 En Morales (2006), Anexo III está la escala completa de actitud hacia el estudio (otra escala semejante en el Anexo IV).

SISTEMA NACIONAL DE EVALUACIÓN SINE – COSTA RICA

 

MATERIAL DE APOYO PARA EL DISEÑO Y EJECUCIÓN DE EVALUACIONES ESTRATÉGICAS DE GOBIERNO 25

26

No satisfactorio

Satisfactorio

Muy mal 1

Excepcional 2

3

4

5

6

7

8

Figura 20

En general esta respuesta central funciona mejor si verbalmente se expresa su posición de manera explícita (como a veces, entre los extremos nunca y siempre) (Hernández, Espejo y González Romá, 2006). En cualquier caso no se puede hablar de una norma; una práctica muy habitual es utilizar cinco respuestas. 4. Las escalas de actitudes

Se definen verbalmente los extremos (muy mal y excepcional) y para que los sujetos sitúen su respuesta con más claridad, se separan gráficamente las áreas que corresponden a una valoración positiva o negativa (satisfactorio y no satisfactorio).

En primer lugar exponemos las razones para construir escalas (o tests) y damos una visión preliminar de todo el proceso de construcción y de la estructura final del cuestionario que responderán los sujetos y en el que está incluida la escala de actitudes.

3.2. Número de respuestas

4.1. Por qué construimos una escala (o un test) en vez de limitarnos a una sola pregunta.

En las escalas de actitudes (y en los cuestionarios en general) el número tradicional de respuestas es de cinco, pero pueden ser más o pueden ser menos.

Hay varias razones para construir escalas sin limitarnos a una sola pregunta. Aun en el caso de los cuestionarios sociológicos, que no son escalas de actitudes en sentido propio, puede ser útil y conveniente el disponer de varios indicadores de una misma actitud (o de una misma variable, como nivel socioeconómico) que van a ser sumados después como indicador de esa actitud o variable.

Una observación importante ya hecha es que en general, y en el caso de escalas de actitudes, a mayor número de respuestas en los ítems, suele haber una mayor fiabilidad en toda la escala, con tal de que el número de respuestas no supere la capacidad de discriminación de los que responden. También con más respuestas se verifican con más facilidad relaciones con otras preguntas porque los sujetos quedan mejor diferenciados. En las escalas de actitudes resulta más económico aumentar el número de respuestas en vez de aumentar el número de ítems y además se responde en menos tiempo. Seis o siete respuestas suele ser el número máximo habitual; a partir de nueve respuestas ya no se discriminan bien. La práctica más generalizada es poner entre 4 y 6 respuestas. El número mínimo puede ponerse en tres respuestas; en cualquier caso con tres respuestas suele subir la fiabilidad con respecto a dos nada más. En las escalas de actitudes con dos respuestas (sí o no, de acuerdo o en desacuerdo, etc.) la fiabilidad suele ser menor. Las dos respuestas (sí, no, de acuerdo en desacuerdo, etc.) es preferible dejarlas para ítems de naturaleza dicotómica (varón/mujer, haber tenido o no una determinada experiencia, etc.) o cuando lo aconseja la previsible capacidad de comprensión de los sujetos (como puede suceder con niños). 3.3. Número par o impar de respuestas Una cuestión distinta es si se debe incluir un número par o impar de respuestas (con o sin una respuesta central de indecisión). No hay normas claras sobre este punto; lo más claro es que son preferibles tres respuestas a dos (la fiabilidad es casi siempre mayor con tres respuestas que con dos, y además con sólo dos respuestas los que responden pueden sentirse incómodos). El incluir un número par de respuestas (4 ó 6) tiene al menos dos ventajas. 1) En primer lugar siempre cabe la posibilidad de agruparlas en dos categorías, de acuerdo y en desacuerdo, y esta agrupación en dos categorías puede ser útil para determinados análisis o para presentar los resultados de manera más sucinta. 2) En segundo lugar se elimina la posibilidad de que los sujetos se evadan escogiendo la respuesta central (casi nunca hay verdadera indecisión si los ítems son relevantes para que los que responden). Una respuesta central del tipo indiferente, no sé, indeciso, puede tener problemas de interpretación y no representar adecuadamente la magnitud o intensidad pretendida (punto medio entre las respuestas extremas) porque se puede escoger por razones distintas.

194

!"#$%&#'&(#)*+,*#-*# ./*0)#-*)1+,2,0%)#3# 0*-,0%)#0*4%+# 1%&)/+'1/%)# +*5(/,6(0*&/*# 1%075*4%)8#

En la vida cotidiana juzgamos sobre cómo es una persona (si es aficionado a un deporte, si es más o menos conservador, religioso o asertivo, si le gustan los temas relacionados con la naturaleza, etc.) en función de de varios indicadores, como pueden ser diversas opiniones referidas a la misma actitud o conductas observadas en el mismo sujeto. Con una única pregunta podemos simplificar en exceso el concepto que vamos a medir.

Una analogía sobre la conveniencia de hacer varias preguntas sobre lo mismo la tenemos en una consulta médica. Cuando vamos a hacernos un reconocimiento, el médico suele hacer varias preguntas, que no son otra cosa que una serie de posibles síntomas, y no es lo mismo de cara a un diagnóstico el responder sí a una de sus preguntas que responder sí a todas o casi todas sus preguntas; es más seguro disponer de varios indicadores o síntomas de la misma posible patología. En conjunto una medida compuesta por varios ítems es más válida en el sentido de que expresa mejor la actitud o rasgo al menos por dos razones: a) Varios indicadores describen mejor un constructo, rasgo o actitud que uno solo. b) Una única pregunta puede de hecho ser poco afortunada, o equívoca, o ser mal entendida por muchos o algunos sujetos. Cuando hay varios indicadores de la misma actitud (o rasgo en general) se obvian mejor las limitaciones de cada ítem en particular. Además una única pregunta puede distorsionar la información que el sujeto aporta de sí mismo; por ejemplo uno puede definirse como muy liberal en una única pregunta, porque ésa es la imagen que tiene de sí mismo, pero puede no aparecer tan liberal ante varias cuestiones más específicas. Como ya hemos indicado al decir qué entendemos por test o escala (varios ítems miden el mismo rasgo), podemos pensar en la medida del rendimiento académico que quizás es un ejemplo más claro y con el que estamos más familiarizados. Si queremos saber si un alumno sabe química, no le hacemos una sola pregunta porque puede saber esa pregunta pero no otras muchas posibles preguntas, o esa pregunta puede ser de hecho ambigua o muy difícil, etc.; una serie de preguntas sobre el mismo tema o asignatura nos da una idea más certera sobre si sabe más o sabe menos. Después de todo, nuestra conclusión y nuestro juicio no van a ser sobre si sabe o no sabe unas preguntas concretas, sino sobre si sabe o no sabe en general; de

SISTEMA NACIONAL DE EVALUACIÓN SINE – COSTA RICA

 

MATERIAL DE APOYO PARA EL DISEÑO Y EJECUCIÓN DE EVALUACIONES ESTRATÉGICAS DE GOBIERNO 27

28

unas pocas preguntas extrapolamos nuestras conclusiones a otras muchas posibles preguntas semejantes. Algo análogo hacemos con las escalas de actitudes, tests de inteligencia, etc.; una muestra relativamente amplia de preguntas (ítems) constituye una mejor base para formarnos un juicio más preciso y fundado sobre cómo está una persona (o un grupo representado por su media) en un rasgo concreto. Aun así ya veremos que pocas preguntas pueden ser suficientes si lo que queremos medir o apreciar está conceptualizado de una manera relativamente simple. Este tipo de razones para utilizar un test o escala tiene más peso cuando se van a tomar decisiones sobre los sujetos (como por ejemplo admitir o no admitir a un programa de estudios, o a un puesto de trabajo) o interesa hacer un buen diagnóstico individual. !"#$%&'()#*&+#,-.# /01,.#&%,1'0&# 2"&5424(&(#(1# 2&#,1(4(&6#

Por fiabilidad entendemos ahora lo que significa este término de manera intuitiva; sin entrar en cuestiones de psicometría fiabilidad significa precisión en la medida, menor margen de error.

Por las razones dichas anteriormente se minimizan las limitaciones de cada ítem en particular; merecen más confianza varias preguntas que una sola. Un solo ítem está más sujeto a los errores de medición (respuestas rápidas y distraídas, ítems no bien entendidos); en cambio cuando varios ítems se van a sumar en un total estos errores de medición tienden a cancelarse mutuamente o al menos pesan menos en ese total. En un sentido más psicométrico, si disponemos de una serie de ítems podemos calcular el coeficiente de fiabilidad como veremos más adelante; los coeficientes de consistencia interna (o de fiabilidad) como el coeficiente alfa de Cronbach sólo se pueden calcular si el instrumento consta de varios ítems (dos al menos), no de uno solo. La fiabilidad puede ser alta o baja, pero eso es algo que podemos verificar, de la misma manera que podemos analizar la calidad de cada ítem. 7"#$%&'()#*&+#,-.# /01,.#(10180&,).# ,19):#2&.#

(431:1'84&.# 4'01:4'(4;4(%&21.#

*/#/*0$%%-(%"#%)#"*-(I?% 8(.&+$-('%#%&'(13$2#.%-(% *$)(.2*1#/*0$

(.*0$?%1'3&+%-(% &('2($($/*#?%(2/7 =$>+'5#/*0$%/($.#"%+% .+/*+"01*/# S(./'*&/*0$%-(%"#%53(.2'#

L"+M3(% ;N

O2(5.%-(%"#%(./#"#%&'+&*#5($2(%-*/B#

L"+M3(% QN

!'(13$2#.%#-*/*+$#"(. ('($/*#.?% (2/7%M3(%&3(-($%(.2#'%'("#/*+$#-#.%/+$%"#% )#'*#C"(%5(-*-#%($%"#%(./#"#%+%2(.2

K.%T2*"%2($('%-(.-(%("% &'*$/*&*+%(.2#%*5#1($% -("%*$.2'35($2+% '(&'(.($2#-#%($%"#% >*13'#%R%4&'+-3/2+% >*$#"%-(%"#%>#.(%-(% &'(&#'#/*0$%&'()*#%#% "#%'(/+1*-#%-(%-#2+.A7%

Figura 22 Este modo de ordenar los bloques de preguntas es cómodo y tiene su lógica, pero tampoco es una norma; en los cuestionarios convencionales (más que en las escalas) también

196

!"#$%&'(#&'#)$&*+#"*+# ,%'-.()*+#&'"# /.'+)0$(*%0$#'+# 01,$%)*()'#,$%2.'#'(# '+)'#$%&'(#+'# 0()%$&./'(#&'+,.3+# "*+#%'+,.'+)*+#'(#.(*# 4$5*#&'#/6"/."$#7/$1$# !89!:;#H?%?C%)+%,%FG.%>G>IC%@B;%IC>G%J%?C%)+%,%FG.%>G>IC%@B;%KILG =>?@

+

56 '

)+,%234" $$%&)(

* $$$$$%&+(

)+%,%-./"

56 ) 56 !

!

)

$%&'(

$$%&)(

)+,%234" $$$$%&*(

$$$$$$%&8(

)+%,%-./"

$$$%&!(

$$$$$%&+( $$%&)(

$$$$$%&+(

$$%&)(

$$$$%&*(

$$%&)(

$$$%&!(

$%&'(

)+,%234" )+%,%-./"

'

$$$%&!( $$$$$$$%&9(

:

:;0 :
*()#(*+&(3%*($)"0)$'51':'#%/()9)0%)6.'0'/%/ D%$)'1."&+&".%#'(1"$)$") +6"/"1)&"/6#'&)%)/($) 5&%1/"$).'+($

F1%0'8%1/()"0)#(1."1'/( K(1)*-.(/($)"T+"&'*"1.%0"$ GFDCEHI)DVPCKF,)F2FJH!BH)) G"&':'#%1/()='+>."$'$)#(="&"1."$ ()KR!KH2BAFD GFDCEHI)HU2HJCSH!BFD

%?)@(3&")"0) !"#"$%&'()+"&()1()$'"*+&") @CP!CQCKFER $6:'#'"1." MS"/'*($)0()+ 0.*3"*>+&'3(3.,$*

!"),.'3&*+"++$