Agregar datos de encuestas en Excel — 5 pasos de CSV a chi-cuadrado

Descargar el CSV de una herramienta de encuestas, agregarlo en Excel y convertirlo en un informe — es la tarea más frecuente en la operación de investigación, pero a menudo vemos casos en los que se pierden 1 o 2 horas por errores de configuración de campos en tablas dinámicas, problemas de codificación UTF-8 y errores en los argumentos de la función CHISQ.TEST. En este artículo organizamos en 5 pasos para completar en 30 minutos todo el proceso, desde importar el CSV a Excel hasta la agregación total (GT), la tabulación cruzada, la prueba de chi-cuadrado y la creación de gráficos.

En cada paso incluimos advertencias sobre "los errores más comunes" y enlaces a artículos especializados para profundizar.

Paso 1: Importar el CSV a Excel (medidas contra problemas de codificación UTF-8)

El primer obstáculo al trabajar con CSV en Excel son los problemas de codificación con caracteres no latinos. Si abres el archivo CSV directamente con doble clic, en archivos UTF-8 sin BOM los caracteres se convierten en "?" o en signos aleatorios. Hay que abrirlos siempre a través de "Obtener datos".

Procedimiento:

Inicia Excel → pestaña "Datos" → selecciona "Desde texto/CSV"
Selecciona el archivo CSV
Origen del archivo: especifica "65001 : Unicode (UTF-8)"
Delimitador: selecciona "Coma"
Detección de tipo de datos: se recomienda "Archivo completo"
Haz clic en "Cargar"

Aquí es donde muchos fallan: caer en el bucle infinito de abrir con doble clic, ver caracteres ilegibles, descargar de nuevo y volver a abrir con doble clic. Se previene haciendo de "Obtener datos" un hábito desde el principio.

Los detalles se organizan en la guía completa de limpieza de datos de encuestas, donde tratamos la detección práctica de respuestas inválidas tras la importación (straight-liner / speeder).

Paso 2: Crear la agregación total (GT) con tabla dinámica

La agregación total (GT) es el trabajo básico de obtener "el número de respuestas y la proporción de cada opción por pregunta". Se crea de un solo paso con una tabla dinámica.

Procedimiento:

Selecciona el rango de datos → "Insertar" → "Tabla dinámica" → "Aceptar"
Arrastra la columna de la pregunta a agregar al área de "Filas"
Arrastra la misma columna de la pregunta al área de "Valores" (cuenta automáticamente)
Configuración del campo de valor → "Mostrar valores como" → "% del total de columnas" para mostrar en %
Haz clic derecho en "Etiquetas de fila" → "Ordenar" en orden descendente del número

Aquí es donde muchos fallan: cuando una pregunta de respuesta múltiple (MA) está en una sola columna separada por comas, la agregación dinámica no funciona. Hay que expandirla previamente a varias columnas con "Datos" → "Texto en columnas", o verificar la configuración en herramientas como Kicue para exportar la MA en columnas separadas.

Paso 3: Crear la tabulación cruzada (atributo × pregunta)

La tabulación cruzada es la agregación que examina la relación entre dos preguntas y es la más utilizada para tomar decisiones en investigación. Ejemplo: "¿Cómo varía la satisfacción por grupo de edad?".

Procedimiento:

Crea una nueva tabla dinámica (mismo rango de datos)
"Filas": pregunta de atributo (p. ej., grupo de edad)
"Columnas": pregunta de evaluación (p. ej., satisfacción)
"Valores": número de casos (arrastra cualquier columna y selecciona "Cuenta")
Configuración del campo de valor → "Mostrar valores como" → "% del total de filas" para mostrar el % por fila

Así puedes ver "la distribución de satisfacción por grupo de edad" en porcentajes.

Aquí es donde muchos fallan: emocionarse con el % de celdas con N pequeño (N < 30). Aunque digas "la satisfacción de los 40 es del 80%", si N=5 el margen de error es grande y no sirve como base para decisiones. Es imprescindible el hábito de mostrar N y % juntos.

Los detalles se organizan en agregación de encuestas y prueba de significancia — uso de tabulación cruzada, chi-cuadrado y tamaño del efecto, donde tratamos los 5 patrones a observar en la tabulación cruzada.

Paso 4: Prueba de chi-cuadrado (función CHISQ.TEST)

Cuando en la tabulación cruzada parezca "haber diferencia", la prueba de chi-cuadrado determina si es una diferencia estadísticamente significativa o solo variabilidad aleatoria. Puedes ejecutarla con la función CHISQ.TEST de Excel.

Procedimiento:

Copia los valores observados de la tabulación cruzada a otra hoja (excluyendo las celdas de subtotales de fila/columna, solo las celdas del cuerpo)
Crea una matriz de valores esperados del mismo tamaño. Cada celda: =REDONDEAR(total_fila*total_columna/total_general, 2)
Ejecuta la función CHISQ.TEST: =PRUEBA.CHI.CUAD(rango_observados, rango_esperados)
Aparece el resultado (valor p)
Si el valor p es inferior a 0,05, se considera estadísticamente significativo

Ejemplo: =PRUEBA.CHI.CUAD(B2:D4, F2:H4) → si el resultado es 0,023, "la diferencia de satisfacción por grupo de edad es estadísticamente significativa"

Aquí es donde muchos fallan: el uso incorrecto de olvidar calcular los valores esperados y pasar dos rangos de valores observados. CHISQ.TEST es una función que requiere "rango de valores observados" y "rango de valores esperados". Si solo le pasas los valores observados, devuelve un número sin sentido.

Además, no juzgues solo por el valor p. Con un tamaño muestral grande, incluso diferencias pequeñas resultan significativas, por lo que el estándar académico es analizar junto con el tamaño del efecto (V de Cramér). Los detalles también se organizan en la guía de agregación de encuestas y prueba de significancia, donde explicamos el cálculo y la interpretación del tamaño del efecto.

Paso 5: Creación de gráficos y uso compartido interno

Si pegas los valores agregados tal cual en PPT/Word, no se transmiten. Selecciona el gráfico óptimo según el tipo de pregunta y dale forma de informe.

Gráfico óptimo por tipo de pregunta:

Respuesta única (SA): gráfico de barras (se recomiendan barras horizontales)
Respuesta múltiple (MA): gráfico de barras
Escala de Likert: gráfico de barras apiladas divergentes (divergent stacked bar)
Tabulación cruzada: gráfico de barras agrupadas / gráfico de mosaico
Series temporales: gráfico de líneas

Requisitos mínimos para el formato:

Incluir siempre etiquetas de ejes, leyenda, título y fuente de datos
Mostrar N= en cada gráfico
Limitar el color a 3 o menos (incluido el color de fondo)

Aquí es donde muchos fallan: usar un gráfico circular con 5 o más segmentos. Se vuelve difícil de comparar visualmente y aumenta la carga cognitiva para el lector. Para más de 5 segmentos, el estándar es el gráfico de barras.

Los detalles se organizan en la guía de visualización de resultados de encuestas, donde tratamos los gráficos óptimos por tipo de pregunta y los 5 patrones peligrosos a evitar.

Perspectiva editorial — 3 puntos para hacer más eficiente la agregación en Excel

Desde la posición de seguir continuamente casos del sector y voces de profesionales, estos son 3 puntos para hacer más eficiente la agregación en Excel.

Crea una hoja plantilla: convierte en plantilla de Excel los modelos de GT, tabulación cruzada y chi-cuadrado, y en proyectos futuros operarás solo cambiando los datos. Si lo haces desde cero cada vez, los 30 minutos se inflan a 2 horas.
No edites nunca la hoja de datos brutos: realiza cálculos y gráficos en otra hoja, y conserva los datos brutos como copia de seguridad. Si sobrescribes los datos brutos por error, ocurren con frecuencia incidentes irrecuperables.
Muestra siempre "N=" junto con los resultados agregados: "Satisfacción 60% (N=120)" da más criterio al lector que "Satisfacción 60%". Como los resultados con muestras pequeñas pueden inducir a error, indicar N es la alfabetización mínima.

Exportación de CSV con la herramienta de encuestas Kicue

La exportación de CSV de Kicue se entrega en un formato que se adapta fácilmente al flujo de agregación en Excel de esta guía:

Codificación UTF-8: estructura en la que es poco probable que surjan problemas de codificación al importar a Excel
Texto de la pregunta incluido en el encabezado de columna: legible por humanos desde la primera fila, sin necesidad de consultar por separado el ID de la pregunta
Columna de ID de respondiente: utilizable para vincular atributos en la tabulación cruzada o para extraer candidatos a entrevistas adicionales (extracción de respondientes de un segmento específico)
Columnas independientes por pregunta: estructura que permite la agregación dinámica directamente

Como el formato de salida de la respuesta múltiple (MA) depende de la configuración en el momento del diseño de la pregunta, hay casos en los que es necesaria la división de columnas con Texto en columnas del Paso 2 antes de la agregación dinámica. El procedimiento de este artículo permite gestionarlo.

Cabe señalar que es realista realizar la prueba de chi-cuadrado y el cálculo del tamaño del efecto con las funciones estándar de Excel / R / Python / SPSS / JASP, y Kicue en sí no ofrece funciones de análisis estadístico. Está diseñado bajo el supuesto de un flujo de trabajo de exportación CSV → herramienta externa.

Resumen — 5 pasos en 30 minutos

Paso 1 Importar CSV: especifica UTF-8 y evita el doble clic → guía de limpieza de datos
Paso 2 Agregación GT: en un paso con tabla dinámica, divide MA previamente → guía de agregación y prueba de significancia
Paso 3 Tabulación cruzada: muestra en % de filas, indica N y % juntos → guía de agregación y prueba de significancia
Paso 4 Prueba de chi-cuadrado: pasa los 2 rangos de observados + esperados a CHISQ.TEST → guía de agregación y prueba de significancia
Paso 5 Creación de gráficos: gráfico óptimo por tipo de pregunta, más de 5 segmentos en barras → guía de visualización

Con esto, en 30 minutos tendrás la base del informe. El siguiente paso es el diseño operativo de convertirlo en plantilla y proteger los datos brutos.

Si deseas exportar CSV en un formato fácil de agregar en Excel, prueba la herramienta gratuita de encuestas Kicue. CSV con codificación UTF-8 fácil de importar en Excel, datos estructurados con columnas de ID de respondiente, y columnas independientes por pregunta — puedes comenzar los 5 pasos de agregación en Excel de esta guía desde una sola cuenta (los análisis estadísticos avanzados, el cálculo del tamaño del efecto y la creación de Joint Display requieren integración con R / Python / SPSS / JASP).

Referencias

Field, A. (2017). Discovering Statistics Using IBM SPSS Statistics (5th ed.). SAGE Publications.

Agregar datos de encuestas en Excel — 5 pasos de CSV a chi-cuadrado

Paso 1: Importar el CSV a Excel (medidas contra problemas de codificación UTF-8)

Paso 2: Crear la agregación total (GT) con tabla dinámica

Paso 3: Crear la tabulación cruzada (atributo × pregunta)

Paso 4: Prueba de chi-cuadrado (función CHISQ.TEST)

Paso 5: Creación de gráficos y uso compartido interno

Perspectiva editorial — 3 puntos para hacer más eficiente la agregación en Excel

Exportación de CSV con la herramienta de encuestas Kicue

Resumen — 5 pasos en 30 minutos

Referencias

Artículos relacionados

Cómo crear una encuesta anónima — 5 pasos para evitar la re-identificación

Cómo calcular el CSAT — 5 pasos con la Top 2 Box

Cómo calcular el NPS — 5 pasos con promotores y detractores