Baixar o CSV da ferramenta de pesquisas, agregar no Excel e transformar em relatório — é a tarefa mais frequente na operação de pesquisas, mas vemos no campo muitas equipes perdendo de 1 a 2 horas com erros de configuração de campos na Tabela Dinâmica, problemas de codificação UTF-8 e erros nos argumentos da função TESTE.QUI (CHISQ.TEST). Neste artigo, organizamos em 5 passos para concluir em 30 minutos o caminho da importação do CSV no Excel até a tabulação GT, tabulação cruzada, teste qui-quadrado e criação de gráficos.
Em cada Step listamos os pontos de atenção em que "muita gente erra" e links para artigos especializados para aprofundamento.
Step 1: Importar o CSV no Excel (tratamento de problemas de codificação UTF-8)
O primeiro obstáculo ao tratar CSV no Excel é o problema de codificação de caracteres. Se você abrir o arquivo CSV com duplo clique, em arquivos UTF-8 sem BOM os caracteres aparecem como "?" ou caracteres aleatórios. É preciso sempre abrir via "Obter Dados / Importar dados".
Procedimento:
- Abra o Excel → aba "Dados" → selecione "De Texto/CSV"
- Selecione o arquivo CSV
- Origem do arquivo: especifique "65001: Unicode (UTF-8)"
- Delimitador: selecione "Vírgula"
- Detecção de tipo de dados: recomendado "Conjunto de dados inteiro"
- Clique em "Carregar"
Aqui muita gente erra: abre direto com duplo clique, vê os caracteres corrompidos, baixa de novo, abre de novo com duplo clique — entra em loop infinito. Pode-se prevenir tornando hábito sempre usar a rota "Obter Dados / Importar dados" desde o início.
Para detalhes, consulte o Guia completo de limpeza de dados de pesquisa, em que organizamos a prática de detecção de respostas inválidas após a importação (straight-liners / speeders).
Step 2: Criar a tabulação GT com a Tabela Dinâmica
A tabulação GT (Grand Total, tabulação geral) é o trabalho básico de gerar "número e proporção de respostas por opção de cada pergunta". É possível fazer em um único passo com a Tabela Dinâmica.
Procedimento:
- Selecione o intervalo de dados → "Inserir" → "Tabela Dinâmica" → "OK"
- Arraste a coluna da pergunta a ser agregada para a área "Linhas"
- Arraste a mesma coluna da pergunta para a área "Valores" (a contagem é calculada automaticamente)
- Configurações do campo de valor → "Mostrar valores como" → "% do Total da Coluna" para exibir em %
- Clique com o botão direito em "Rótulos de Linha" → "Classificar" para ordenar por contagem decrescente
Aqui muita gente erra: quando uma pergunta de múltipla escolha (MA) está em uma única coluna separada por vírgulas, a agregação da Tabela Dinâmica não funciona. Antes de agregar, expanda em várias colunas com "Dados" → "Texto para colunas", ou verifique a configuração para exportar MA em colunas separadas em ferramentas como o Kicue.
Step 3: Criar a tabulação cruzada (atributo × pergunta)
A tabulação cruzada é a agregação que mostra a relação entre duas perguntas, sendo a mais usada na tomada de decisão em pesquisa. Exemplo: "Como a satisfação varia por faixa etária".
Procedimento:
- Crie uma nova Tabela Dinâmica (mesmo intervalo de dados)
- "Linhas": pergunta de atributo (ex.: faixa etária)
- "Colunas": pergunta de avaliação (ex.: satisfação)
- "Valores": contagem (arraste qualquer coluna e selecione "Contagem")
- Configurações do campo de valor → "Mostrar valores como" → "% do Total da Linha" para exibir % por linha
Assim, a "distribuição da satisfação por faixa etária" é visível em %.
Aqui muita gente erra: comemorar ou se preocupar com % de células com N pequeno (N < 30). Dizer "a satisfação na faixa dos 40 é 80%" com N=5 tem grande margem de erro e não serve como base para decisão. É essencial o hábito de colocar N e % juntos.
Para detalhes, consulte o Guia de agregação de pesquisas e testes de significância — tabulação cruzada, teste qui-quadrado e como usar o tamanho do efeito, em que organizamos os 5 padrões a observar em tabulações cruzadas.
Step 4: Teste qui-quadrado (função TESTE.QUI / CHISQ.TEST)
Se ao ver a tabulação cruzada você pensar "parece haver diferença", confirme com o teste qui-quadrado se é uma diferença estatisticamente significativa ou apenas variação por acaso. Pode-se executar com a função TESTE.QUI (em inglês CHISQ.TEST) do Excel.
Procedimento:
- Copie os valores observados da tabulação cruzada para outra planilha (exclua as células de subtotal de linha / coluna, apenas as células do corpo)
- Crie uma matriz de valores esperados do mesmo tamanho. Cada célula é
=ARRED(Total da Linha*Total da Coluna/Total Geral, 2)(em inglês=ROUND(...)) - Execute a função
TESTE.QUI:=TESTE.QUI(intervalo de observados, intervalo de esperados) - O resultado (valor p) é exibido
- Se o valor p for menor que 0,05, considera-se que há diferença estatisticamente significativa
Exemplo: =TESTE.QUI(B2:D4, F2:H4) → se o resultado for 0,023, "a diferença de satisfação por faixa etária é estatisticamente significativa".
Aqui muita gente erra: o uso incorreto de esquecer de calcular os esperados e colocar dois intervalos de observados lado a lado. A função TESTE.QUI exige dois argumentos: "intervalo de observados" e "intervalo de esperados". Passar apenas observados retorna números sem significado.
Além disso, não decida apenas pelo valor p. Com tamanhos de amostra grandes, mesmo pequenas diferenças se tornam significativas, então o padrão acadêmico é olhar em conjunto com o tamanho do efeito (V de Cramér). Para detalhes, consulte também o Guia de agregação e testes de significância, em que organizamos o cálculo e a interpretação do tamanho do efeito.
Step 5: Criação de gráficos e compartilhamento interno
Colar os valores agregados direto no PPT / Word não comunica. Escolha o gráfico ótimo por tipo de pergunta e formate para o relatório.
Gráfico ótimo por tipo de pergunta:
- Resposta única (SA): gráfico de barras (recomendamos barras horizontais)
- Múltipla escolha (MA): gráfico de barras
- Escala Likert: gráfico de barras empilhadas divergentes (divergent stacked bar)
- Tabulação cruzada: gráfico de barras agrupadas / mosaic plot
- Série temporal: gráfico de linhas
Condições mínimas de formatação:
- Inclua sempre rótulos de eixo, legenda, título e fonte de dados
- Coloque N= junto a cada gráfico
- Limite as cores a no máximo 3 (incluindo a cor de fundo)
Aqui muita gente erra: usar gráfico de pizza com 5 ou mais segmentos. A comparação visual fica difícil e a carga cognitiva do leitor aumenta. Acima de 5 segmentos, o padrão é gráfico de barras.
Para detalhes, consulte o Guia de visualização de resultados de pesquisa, em que organizamos os gráficos ótimos por tipo de pergunta e os 5 padrões de risco a evitar.
A visão da redação — 3 pontos para tornar a agregação no Excel mais eficiente
Da posição de quem acompanha continuamente casos do setor e a voz de profissionais de campo, 3 pontos para tornar a agregação no Excel mais eficiente.
- Crie uma planilha-modelo: transforme em template no Excel os modelos de tabulação GT, tabulação cruzada e qui-quadrado, e nas próximas operações apenas substitua os dados. Criar do zero a cada vez faz 30 minutos virarem 2 horas.
- Nunca edite a planilha de dados brutos: faça cálculos e gráficos em outra planilha, e mantenha os dados brutos como backup. Sobrescrever acidentalmente os dados brutos causa incidentes irrecuperáveis com frequência.
- Coloque sempre "N=" junto aos resultados agregados: "Satisfeito 60% (N=120)" oferece mais base para o leitor decidir do que "Satisfeito 60%". Resultados com tamanho de amostra pequeno induzem a interpretações erradas, então colocar N junto é a literacia mínima.
Exportação de CSV na ferramenta de pesquisas Kicue
A exportação de CSV do Kicue é gerada em um formato fácil de colocar no fluxo de agregação no Excel deste guia:
- Codificação UTF-8: estrutura em que problemas de codificação raramente ocorrem na importação para o Excel
- Cabeçalhos de coluna contendo o texto da pergunta: legível por humanos desde a linha 1, sem necessidade de consultar separadamente o ID da pergunta
- Coluna de ID do respondente: utilizável para combinar atributos em tabulação cruzada ou extrair candidatos a entrevistas adicionais (extração de respondentes de segmentos específicos)
- Colunas independentes por pergunta: estrutura em que a tabulação dinâmica é direta
O formato de saída das perguntas de múltipla escolha (MA) depende da configuração no design da pergunta, então em alguns casos é necessária a divisão de colunas via "Texto para colunas" do Step 2 antes da tabulação dinâmica. O procedimento deste artigo cobre essa situação.
Vale notar que, na prática, o teste qui-quadrado e o cálculo do tamanho do efeito são executados com recursos padrão do Excel / R / Python / SPSS / JASP, e o Kicue não oferece funções de análise estatística. Foi projetado partindo do fluxo de trabalho "exportação de CSV → ferramenta externa".
Resumo — 5 passos em 30 minutos
- Step 1 Importação do CSV: especificar UTF-8 e evitar duplo clique → Guia de limpeza de dados
- Step 2 Tabulação GT: um passo com a Tabela Dinâmica, MA dividida previamente → Guia de agregação e testes de significância
- Step 3 Tabulação cruzada: exibir em % por linha, colocar N e % juntos → Guia de agregação e testes de significância
- Step 4 Teste qui-quadrado: passar os 2 intervalos de observados + esperados para TESTE.QUI → Guia de agregação e testes de significância
- Step 5 Criação de gráficos: gráfico ótimo por tipo de pergunta, acima de 5 segmentos use barras → Guia de visualização
Com isso, em 30 minutos a base do relatório está pronta. Os próximos passos são o desenho operacional de templatização e proteção dos dados brutos.
Se você quer exportar CSV em um formato fácil de agregar no Excel, experimente a ferramenta gratuita de pesquisas Kicue. CSV codificado em UTF-8 fácil de importar no Excel, dados estruturados com colunas de ID de respondente, e colunas independentes por pergunta — você pode começar os 5 passos de agregação no Excel deste guia em uma única conta (análises estatísticas avançadas, cálculo do tamanho do efeito e criação de Joint Display requerem integração com R / Python / SPSS / JASP).
Referências
- Field, A. (2017). Discovering Statistics Using IBM SPSS Statistics (5th ed.). SAGE Publications.
