12 Recolección de datos: salir al campo
12.1 Del escritorio al mundo real
Hasta ahora, todo ha sido planificación. Ahora empieza lo bueno (y lo difícil): ir a buscar los datos. Es como la diferencia entre estudiar el mapa y caminar el terreno. El mapa nunca te prepara del todo.
Este capítulo cubre las principales técnicas de recolección de datos. No es un tratado exhaustivo (hay libros enteros sobre cada técnica), sino una guía práctica con los errores que más veo. Para profundizar en encuestas, recomiendo Fowler (2014) y Dillman et al. (2014); para entrevistas, Kvale & Brinkmann (2015); para observación, DeWalt & DeWalt (2011).
12.2 Encuestas: el instrumento más usado (y más abusado)
La encuesta (o cuestionario) es probablemente la técnica más usada en ciencias sociales cuantitativas. Y también la más abusada: muchas encuestas están mal diseñadas, mal aplicadas y mal analizadas.
12.2.1 Principios de diseño
Claridad ante todo. Cada pregunta debe ser entendida de la misma manera por todos los respondientes. Dillman et al. (2014) llama a esto el principio de pregunta compartida: lo que tú entiendes al escribir la pregunta debe ser lo mismo que entiende el respondiente al leerla.
- ❌ “¿Considera usted que las políticas gubernamentales son adecuadas?” (¿Cuáles políticas? ¿Adecuadas para qué? ¿Según qué criterio?)
- ✅ “En una escala de 1 a 5, ¿qué tan satisfecho está con la calidad de los servicios de salud pública en su municipio?”
Una pregunta, una idea. Evita preguntas dobles (double-barreled questions).
- ❌ “¿Cree que los profesores son puntuales y bien preparados?” (¿Qué pasa si son puntuales pero no están preparados?)
- ✅ Sepáralas en dos preguntas distintas.
Evita la inducción. No le digas al encuestado qué debería responder.
- ❌ “¿No cree usted que la corrupción es el principal problema del país?”
- ❌ “Considerando los graves problemas de nuestro sistema de salud, ¿cómo calificaría la gestión del ministro?”
- ✅ “¿Cuál considera que es el principal problema del país?” (pregunta abierta) o una lista de opciones sin jerarquizar.
Cuidado con el efecto de deseabilidad social. Las personas tienden a responder lo que creen que es “correcto” o socialmente aceptable, no lo que realmente piensan o hacen. Preguntar “¿usted discrimina?” siempre da 0%. Mejor diseñar preguntas indirectas o usar viñetas (vignettes).
Ordena con lógica. La secuencia importa más de lo que crees:
- Empieza con preguntas fáciles y no amenazantes (datos demográficos simples o preguntas de opinión general).
- Agrupa por temas (no saltes de educación a salud a educación de vuelta).
- Deja las preguntas sensibles para el final (ingreso, opiniones políticas, comportamiento): cuando ya hay confianza.
- Termina con una pregunta abierta opcional (“¿Hay algo más que quiera agregar?”). A veces aparecen joyas ahí.
12.2.2 Tipos de preguntas
| Tipo | Cuándo usarla | Ejemplo | Análisis |
|---|---|---|---|
| Cerrada dicotómica | Hechos claros | ¿Tiene seguro de salud? Sí/No | Frecuencias, chi-cuadrado |
| Opción múltiple | Categorías definidas | ¿Cuál es su nivel educativo? | Frecuencias, tablas cruzadas |
| Escala Likert | Actitudes, percepciones | ¿Qué tan satisfecho está? (1-5) | Medias, correlaciones (ver Cap 8) |
| Escala de diferencial semántico | Evaluación de conceptos | La gestión fue: Eficiente ___ Ineficiente | Perfiles, comparaciones |
| Ranking | Prioridades | Ordene de 1 a 5 los problemas | Medianas, Friedman |
| Abierta | Exploración, matices | ¿Por qué eligió esta carrera? | Análisis de contenido |
Las preguntas abiertas son valiosas, pero costosas de analizar. Si tu encuesta tiene 400 respondientes y 10 preguntas abiertas, tienes 4.000 respuestas de texto libre para codificar. ¿Realmente tienes tiempo para eso? Usa 1-2 preguntas abiertas estratégicas, no más.
12.2.3 El piloteo: tu seguro de vida
NUNCA apliques una encuesta sin pilotearla primero. El piloteo es probar tu instrumento con un grupo pequeño (10-20 personas similares a tu población) para detectar:
- Preguntas que no se entienden (las que a ti te parecen claras pero a nadie más).
- Opciones de respuesta que faltan (“Otro: ___” aparece demasiado → falta una categoría).
- Preguntas que toman demasiado tiempo.
- Efecto de orden (las respuestas cambian según dónde aparece la pregunta).
- Problemas técnicos (si es digital: ¿funciona en celular? ¿carga rápido?).
- Tiempo total de aplicación (más de 20 minutos = altas tasas de abandono).
El piloteo te ahorra meses de dolor. Créeme.
12.2.4 Encuestas digitales: ventajas y trampas
Google Forms, SurveyMonkey, Qualtrics, KoboToolbox… Las encuestas digitales se han vuelto la norma. Ventajas obvias: bajo costo, rapidez, alcance geográfico. Pero tienen sus propios problemas:
- Sesgo de cobertura: ¿Tu población tiene acceso a internet? En América Latina, asumir que “todos están online” excluye sistemáticamente a los más pobres, los más rurales y los más viejos.
- Baja tasa de respuesta: Una encuesta enviada por correo electrónico o WhatsApp puede tener tasas de respuesta del 5-15%. ¿Es tu muestra representativa de algo?
- Respondientes de baja calidad: Sin supervisión, las personas completan encuestas en 2 minutos lo que debería tomar 15. Marca todo en 3 y listo. Incluye preguntas trampa (attention checks) para detectar esto.
- Selección de herramienta: KoboToolbox (gratuito, ideal para campo) funciona offline. Qualtrics tiene lógica avanzada pero es caro. Google Forms es simple pero limitado. Elige según tu necesidad real.
12.3 Entrevistas: el arte de callarse
Las entrevistas son la herramienta estrella de la investigación cualitativa. Pero hacer una buena entrevista es mucho más difícil de lo que parece. Kvale & Brinkmann (2015) describe al entrevistador como un “artesano” que combina técnica con sensibilidad — no es algo que se improvisa.
12.3.1 Tipos
- Estructurada: Preguntas predefinidas, en orden fijo. Es casi una encuesta oral. Útil para comparar respuestas entre participantes.
- Semi-estructurada: Tienes una guía de temas/preguntas, pero puedes improvisar, profundizar, reordenar. Es la más usada y recomendada para investigación cualitativa.
- No estructurada / en profundidad: Conversación guiada por unos pocos temas generadores. Máxima flexibilidad, máxima exigencia para el investigador.
12.3.2 La guía de entrevista: no un cuestionario, un mapa
Una buena guía de entrevista semi-estructurada tiene:
- Pregunta de apertura (fácil, narrativa): “Cuéntame sobre tu experiencia como docente en esta escuela.”
- Preguntas temáticas (los temas centrales de tu investigación): “¿Cómo describirías la relación con los padres de familia?”
- Preguntas de profundización (listas para cuando aparezcan temas interesantes): “¿Puedes darme un ejemplo concreto?” “¿Qué quisiste decir con…?”
- Pregunta de cierre (abierta): “¿Hay algo que no te pregunté y que crees importante que sepa?”
Lo que la guía NO es: Una lista de 40 preguntas que lees una por una mirando tu hoja en vez de al entrevistado.
12.3.3 El error del entrevistador novato
El error #1 del entrevistador novato es hablar demasiado. Tu trabajo no es compartir tu opinión, demostrar lo que sabes, o llenar silencios. Tu trabajo es escuchar.
Reglas de oro:
- Pregunta, escucha, repregunta. Los silencios no son incómodos; son productivos. El entrevistado está pensando. Déjalo.
- No juzgues. Si alguien te dice algo que te parece terrible, tu cara no puede reflejarlo. Eres investigador, no juez.
- Profundiza. “¿Podrías contarme más sobre eso?” es tu mejor amiga. “¿Cómo así?” “¿Y eso qué significó para ti?”
- Graba (con permiso). Tomar notas mientras entrevistas es como conducir mirando el celular. Graba y transcribe después.
- No asientas demasiado. Si dices “ajá, sí, claro, exacto” después de cada frase, estás validando selectivamente. El entrevistado dirá más de lo que tú validas.
12.3.4 Sesgos del entrevistador
Nadie es neutral. Pero puedes ser consciente de tus sesgos:
| Sesgo | Descripción | Mitigación |
|---|---|---|
| Sesgo de confirmación | Oyes lo que quieres oír | Graba todo, codifica con otro investigador |
| Efecto del entrevistador | Tu género, edad, clase social influyen en las respuestas | Reconócelo en tus limitaciones |
| Preguntas inductivas | Guías la respuesta sin darte cuenta | Revisa tu guía: ¿hay preguntas que sugieren la respuesta? |
| Sesgo de cortesía | El entrevistado dice lo que cree que quieres oír | Preguntas indirectas, triangulación |
12.4 Grupos focales
Un grupo focal reúne a 6-10 personas para discutir un tema guiado por un moderador. No es una entrevista grupal (donde preguntas lo mismo a cada uno). Es una conversación donde lo que interesa es la interacción entre los participantes: cómo negocian significados, cómo se desafían o refuerzan mutuamente.
12.4.1 Cuándo usarlos
- Para explorar percepciones, actitudes y experiencias compartidas.
- Para entender dinámicas grupales y normas sociales.
- Para generar hipótesis o refinar instrumentos.
- Cuando la interacción genera datos que la entrevista individual no generaría.
12.4.2 Cuándo NO usarlos
- Para temas muy sensibles o íntimos (la gente no habla de sus traumas frente a extraños).
- Cuando hay relaciones de poder en el grupo (jefe y subordinados juntos = silencio del subordinado).
- Cuando necesitas experiencias individuales detalladas (para eso son las entrevistas).
12.4.3 El moderador hace la diferencia
Un buen moderador no domina la conversación; la facilita. Asegura que todos hablen (no solo el más extrovertido), maneja las dinámicas de poder, y profundiza en los temas emergentes. Un mal moderador convierte el grupo focal en una entrevista serial (pregunta-respuesta-pregunta-respuesta) y pierde toda la riqueza de la interacción.
12.5 Observación: ver con ojos de investigador
La observación es una técnica cualitativa donde el investigador registra sistemáticamente lo que ve (y a veces participa) en un contexto natural (DeWalt & DeWalt, 2011).
12.5.1 Tipos
- Participante: Te insertas en el grupo que estudias. Vives la experiencia. Requiere tiempo (semanas, meses) y genera datos extraordinariamente ricos.
- No participante: Observas desde afuera, sin interactuar. Menos intrusivo pero pierdes la perspectiva interna.
- Participante como observador: Participas pero todos saben que investigas. El más común en ciencias sociales.
12.5.2 El diario de campo: tu instrumento principal
Un buen diario de campo distingue entre tres tipos de notas:
- Notas descriptivas: Lo que pasó. Quién hizo qué. Qué se dijo. (Factual, sin interpretación.)
- Notas textuales: Citas verbales exactas. Lo que la gente dijo con sus palabras.
- Notas reflexivas: Lo que tú pensaste, sentiste, sospechaste, te preguntaste. Tu interpretación.
Las tres son valiosas, pero mezclarlas es peligroso. Si no distingues entre “el director gritó a la maestra” (descriptiva) y “el director parece un autoritario” (reflexiva), vas a contaminar tus datos con tus juicios. Escríbelas en columnas separadas, con colores distintos, o como prefieras, pero sepáralas.
12.5.3 ¿Cuánto tiempo observar?
No hay respuesta mágica. Pero la regla general es: más de lo que crees. Los primeros días ves todo como exótico. Luego empiezas a ver los patrones. Luego los matices. Es en los matices donde están los datos interesantes.
12.6 Datos secundarios: lo que ya existe
No siempre necesitas generar datos nuevos. Hay una enorme cantidad de datos ya disponibles:
| Fuente | Ejemplos | Ventaja | Limitación |
|---|---|---|---|
| Encuestas nacionales | ENAHO (Perú), CASEN (Chile), ENIGH (México), GEIH (Colombia) | Grandes, representativas, gratuitas | No diseñadas para tu pregunta |
| Censos | Censo nacional de población | Cobertura total | Cada 10 años, pocas variables |
| Registros administrativos | Datos de escuelas, hospitales, programas sociales | Gran N, longitudinales | Calidad variable, acceso restringido |
| Bases internacionales | Banco Mundial, CEPAL, UNESCO, PNUD | Comparabilidad entre países | Indicadores agregados, no individuales |
| Datos abiertos | Portales de datos abiertos gubernamentales | Acceso libre | Documentación a veces deficiente |
| Datos digitales | Redes sociales, web scraping, Google Trends | Masivos, en tiempo real | Éticos, representatividad cuestionable |
12.6.1 Datos digitales y big data: la frontera nueva
Las ciencias sociales están experimentando una explosión de datos digitales: tweets, publicaciones de Facebook, datos de movilidad de celulares, transacciones electrónicas, búsquedas de Google. Esto abre posibilidades enormes, pero también trampas:
- Representatividad: Los usuarios de Twitter no son “la sociedad.” Son un subgrupo con características particulares (más jóvenes, más urbanos, más opinados).
- Ética: ¿El hecho de que los datos sean “públicos” significa que puedes usarlos para investigación sin consentimiento? (Spoiler: no necesariamente. Ver el Capítulo 4.)
- Señal vs. ruido: Tener millones de datos no garantiza buenas conclusiones. Pueden ser millones de datos irrelevantes.
- Transparencia: Los algoritmos de las plataformas determinan qué ves y qué no. No controlas el “marco muestral.”
Más datos no es lo mismo que mejores datos. Una encuesta bien diseñada con 500 casos puede ser infinitamente más valiosa que 5 millones de tweets sesgados. La calidad del dato importa más que la cantidad.
12.7 Triangulación: no pongas todos los huevos en una canasta
La triangulación es usar múltiples fuentes, métodos o investigadores para estudiar el mismo fenómeno. No es solo un concepto bonito; es una estrategia concreta para fortalecer la credibilidad de tus hallazgos.
Tipos de triangulación:
| Tipo | Qué combinas | Ejemplo |
|---|---|---|
| De datos | Diferentes fuentes de datos | Encuesta + registros administrativos + datos censales |
| Metodológica | Diferentes técnicas | Encuesta + entrevistas + observación |
| De investigadores | Diferentes personas analizan los mismos datos | Dos codificadores independientes |
| Teórica | Diferentes marcos interpretativos | Analizar los datos desde Bourdieu y desde Sen |
La triangulación no busca que todas las fuentes digan lo mismo (eso sería sospechoso). Busca que las convergencias fortalezcan los hallazgos y que las divergencias generen preguntas nuevas e interesantes.
12.8 El consentimiento informado en la práctica
Ya hablamos de ética en el Capítulo 4, pero aquí van los aspectos prácticos del consentimiento informado durante la recolección:
- Explica el propósito de la investigación en lenguaje claro (no en jerga académica ni en lenguaje legal incomprensible).
- Aclara que la participación es voluntaria y que pueden retirarse en cualquier momento sin consecuencias.
- Explica qué harás con los datos: quién tendrá acceso, cómo los almacenarás, cuánto tiempo los conservarás.
- Garantiza anonimato o confidencialidad (no son lo mismo: anonimato = ni tú sabes quién es; confidencialidad = tú sabes pero no lo revelas).
- Obtén el consentimiento por escrito (o documentado de otra forma si la escritura no es viable).
- Con menores de edad o poblaciones vulnerables, necesitas consentimiento de un tutor más el asentimiento del participante.
- Identifica la(s) técnica(s) de recolección más apropiadas para tu pregunta de investigación. Justifica por qué.
- Si usarás encuesta: diseña 10 preguntas (variando tipos: cerradas, Likert, una abierta). Pilotéalas con 5 personas y anota los problemas.
- Si usarás entrevista: escribe tu guía de entrevista semi-estructurada (apertura, temas, profundización, cierre). Haz una entrevista de prueba y grábala. Escúchala: ¿hablas más que el entrevistado?
- ¿Puedes triangular? Identifica al menos dos fuentes de datos o dos técnicas que podrían complementarse para responder tu pregunta.
- Redacta tu formulario de consentimiento informado en lenguaje que entienda tu abuela.