Como Nosso Analytics Analisam Resultados de Aprendizagem
5 min de leituraMohammad Shaker

Como Nosso Analytics Analisam Resultados de Aprendizagem

Descubra como o analytics da Alphazed acompanha reais resultados de aprendizagem, não apenas cliques, para melhorar o ensino de árabe.

Engineering

Resposta rápida

Descubra como o analytics da Alphazed acompanha reais resultados de aprendizagem, não apenas cliques, para melhorar o ensino de árabe.

Como Nosso Analytics Analisam Resultados de Aprendizagem (Não Apenas Cliques)

Diferentemente da maioria dos apps EdTech que rastreiam apenas cliques e tempo na tela, o analytics lake da Alphazed acompanha resultados reais de aprendizagem: melhoria na pronúncia com o tempo, transições no domínio dos conceitos (iniciante → intermediário → avançado), eficácia da repetição espaçada (as revisões estão reduzindo o esquecimento?) e progressão nos níveis da Taxonomia de Bloom. Esses dados impulsionam melhorias no currículo e comprovam aos pais que seus filhos estão efetivamente aprendendo, não apenas brincando.

Arquitetura Analítica em Três Camadas

Camada 1: Eventos Mobile

(Em tempo real pelo app)
Quando uma criança conclui um exercício, o app envia um evento:

{
  "event_type": "attempt_complete",
  "concept_id": "letter_ba",
  "exercise_type": "select",
  "accuracy_score": 0.89,
  "attempt_number": 3,
  "session_id": "session_abc123",
  "timestamp": "2026-03-28T14:35:22Z",
  "is_correct": true,
  "response_time_ms": 2400
}

Camada 2: Enriquecimento no Backend

(Contexto adicionado no servidor)
O backend adiciona propriedades do usuário:

{
  "...event...",
  "user_id": "user_456",
  "age_group": "5-7",
  "persona": "intermediate",
  "days_since_signup": 34,
  "total_practice_minutes": 487,
  "app_name": "amal",
  "device_type": "Android",
  "country": "US"
}

Camada 3: Analytics Lake

(Assíncrono, consultável via SQL)

Backend envia evento enriquecido → fila SQS (fire-and-forget)
    ↓ (não espera analytics)
    ↓ (experiência do usuário sem impacto)
Kinesis Firehose (agrupa eventos a cada 5 min ou 100MB)
    ↓
S3 (particionado: s3://alphazed-analytics/amal/2026/03/28/events.parquet)
    ↓
AWS Glue (analisa S3 a cada 1 hora, infere esquema)
    ↓
Athena (motor SQL Presto para consultas)
    ↓
Painel de controle (dashboard real-time para pais + análises internas)

Métricas de Resultados de Aprendizagem Monitoradas

Tipo de Evento 1: Tentativa Concluída

Disparado sempre que uma criança termina um exercício.

SELECT
  user_id,
  concept_id,
  ROUND(AVG(accuracy_score), 2) as avg_accuracy,
  COUNT(*) as total_attempts,
  SUM(CASE WHEN is_correct THEN 1 ELSE 0 END) as correct_count,
  DATE(FROM_UNIXTIME(timestamp / 1000)) as date
FROM analytics_lake.attempt_complete
WHERE app_name = 'amal'
  AND concept_id = 'letter_ba'
GROUP BY user_id, concept_id, date
ORDER BY date DESC

Resultado: "Letra ب: user_456 melhorou de 72% de precisão (semana 1) para 94% (semana 3)"

Tipo de Evento 2: Transição de Domínio do Conceito

Disparado quando um conceito muda de nível de domínio (iniciante → intermediário).

{
  "event_type": "mastery_transition",
  "concept_id": "word_kitab",
  "from_level": "beginner",
  "to_level": "intermediate",
  "hlr_half_life_before": 4.0,
  "hlr_half_life_after": 8.0,
  "timestamp": "2026-03-20T10:15:00Z"
}

Monitorar essas transições revela a eficácia do currículo:
- Quantas crianças alcançam o nível intermediário por conceito?
- Tempo médio para chegar ao intermediário?
- Quais conceitos são gargalos?

Tipo de Evento 3: Crescimento da Meia-Vida HLR

Durante a repetição espaçada, acompanhamos a força da memória:

SELECT
  user_id,
  concept_id,
  DATE(FROM_UNIXTIME(timestamp / 1000)) as date,
  MAX(hlr_half_life_hours) as max_half_life,
  COUNT(DISTINCT CASE WHEN is_correct THEN 1 END) as correct_reviews,
  COUNT(DISTINCT CASE WHEN NOT is_correct THEN 1 END) as incorrect_reviews
FROM analytics_lake.hlr_update
GROUP BY user_id, concept_id, date

Resultado: "Juz Amma Al-Ikhlas: user_789 atingiu meia-vida de 256 horas (estabilidade de 2 semanas) após 7 revisões corretas"

Tipo de Evento 4: Tendências de Precisão no Reconhecimento de Fala

Melhora da pronúncia ao longo do tempo:

SELECT
  user_id,
  DATE_TRUNC('week', FROM_UNIXTIME(timestamp / 1000)) as week,
  AVG(similarity_score) as avg_pronunciation_accuracy,
  APPROX_PERCENTILE(similarity_score, 0.5) as median_accuracy
FROM analytics_lake.speech_recognition_result
WHERE concept_type = 'letter'
GROUP BY user_id, week
ORDER BY week DESC

Resultado: "Precisão de pronúncia do usuário melhorou 18% em 8 semanas de prática consistente"

Tipo de Evento 5: Progressão na Taxonomia de Bloom

Acompanhando o avanço nos níveis cognitivos:

{
  "event_type": "blooms_level_completion",
  "concept_id": "word_kitab",
  "blooms_level_achieved": 4,
  "user_age_group": "5-7",
  "time_to_level_days": 14,
  "attempt_count": 47,
  "timestamp": "2026-03-25T16:45:00Z"
}

Monitoramento: Quantas crianças chegam ao Nível 4 de Bloom (Analisar)? Em média, quanto tempo levam?

Como Isso Guia Decisões do Produto

Decisão 1: Redesenhar um Conteúdo

  • Consulta: "Quais conteúdos têm >40% de tentativas incorretas?"
  • Resultado: "Exercício de formação de palavras com grupos consonantais tem 52% de erros"
  • Ação: Equipe de conteúdo redesenha o exercício (mais apoio, progressão mais lenta)
  • Validação: Repetir consulta em 2 semanas, taxa de erro deve cair para <25%

Decisão 2: Ajustar Mix de Exercícios

  • Consulta: "Quais tipos de exercícios têm maior engajamento + resultado de aprendizagem?"
  • Resultado: Jogos de física têm 30% mais engajamento e 15% mais melhora em precisão
  • Ação: Aumentar frequência dos jogos de física nas lições adaptativas

Decisão 3: Identificar Conceitos Difíceis

  • Consulta: "Conceitos onde >30% dos usuários nunca alcançam nível intermediário?"
  • Resultado: "Consoantes enfáticas (ص, ض, ط, ظ) são difíceis consistentemente"
  • Ação: Criar conteúdo suplementar (mais exercícios de pronúncia, progressão mais lenta)

Comparação com Concorrentes

MétricaDuolingoAmal/Thurayya
Rastrea cliques✓ XP, sequência✓ (mas secundário)
Rastrea precisão✓ Por conceito
Rastrea decaimento da memória✓ Meia-vida HLR
Rastrea resultados de aprendizagem✓ Transições de domínio
Rastrea pronúncia✓ Tendências de precisão na fala
Decisões baseadas em dadosFoco em engajamentoFoco em aprendizagem

Perguntas Frequentes

P: Os dados do meu filho estão no analytics lake?
R: Sim, de forma anonimizada. Monitoramos métricas de aprendizagem (não informações pessoais identificáveis). Você pode ver os dados do seu filho no dashboard dos pais; pesquisadores não têm acesso a nomes individuais.

P: Por quanto tempo os dados são armazenados?
R: Dados recentes (últimos 12 meses) ficam disponíveis para consultas no Athena. Dados históricos são arquivados no S3 por 7 anos (conforme regras). O período pode ser configurado conforme o tipo de dado.

P: Posso exportar as análises de aprendizagem do meu filho?
R: Sim. O dashboard oferece um botão "Exportar Relatório" que gera um PDF com os resultados personalizados dos últimos 3 meses.

Artigos Relacionados