Analyse Alphazed: Suivi des résultats d'apprentissage

Comment le lac d'analyse d'Alphazed suit les résultats d'apprentissage (pas seulement les clics)

Contrairement à la plupart des applications EdTech qui suivent les clics et le temps passé à l'écran, le lac d'analyse d'Alphazed suit des résultats d'apprentissage réels : amélioration de l'exactitude de la prononciation dans le temps, transitions de maîtrise des concepts (débutant → intermédiaire → avancé), efficacité de la répétition espacée (les sessions de révision réduisent-elles l'oubli ?), et progression dans la taxonomie de Bloom. Ces données améliorent le programme et prouvent aux parents que leurs enfants apprennent véritablement, et non seulement jouent.

Architecture analytique à trois niveaux

Niveau 1 : Événements mobiles (en temps réel depuis l'application) Lorsqu'un enfant termine un exercice, l'application envoie un événement :

{
  "event_type": "attempt_complete",
  "concept_id": "letter_ba",
  "exercise_type": "select",
  "accuracy_score": 0.89,
  "attempt_number": 3,
  "session_id": "session_abc123",
  "timestamp": "2026-03-28T14:35:22Z",
  "is_correct": true,
  "response_time_ms": 2400
}

Niveau 2 : Enrichissement côté serveur (Contexte ajouté côté serveur) Le backend enrichit avec des propriétés utilisateur :

{
  "...event...",
  "user_id": "user_456",
  "age_group": "5-7",
  "persona": "intermediate",
  "days_since_signup": 34,
  "total_practice_minutes": 487,
  "app_name": "amal",
  "device_type": "Android",
  "country": "US"
}

Niveau 3 : Lac d'analyse (Asynchrone, interrogeable en SQL)

Backend envoie l'événement enrichi → File SQS (fire-and-forget)
    ↓ (ne s'attarde pas sur les analyses)
    ↓ (expérience utilisateur non affectée)
Kinesis Firehose (regroupe les événements toutes les 5 min ou 100MB)
    ↓
S3 (partitionné : s3://alphazed-analytics/amal/2026/03/28/events.parquet)
    ↓
AWS Glue (parcourt S3 toutes les heures, déduit le schéma)
    ↓
Athena (moteur SQL Presto pour interroger)
    ↓
Tableau de bord (tableau de bord des parents en temps réel + analyses internes)

Indicateurs de résultats d'apprentissage que nous suivons

Type d'événement 1 : Tentative terminée Déclenché chaque fois qu'un enfant termine un exercice.

SELECT
  user_id,
  concept_id,
  ROUND(AVG(accuracy_score), 2) as avg_accuracy,
  COUNT(*) as total_attempts,
  SUM(CASE WHEN is_correct THEN 1 ELSE 0 END) as correct_count,
  DATE(FROM_UNIXTIME(timestamp / 1000)) as date
FROM analytics_lake.attempt_complete
WHERE app_name = 'amal'
  AND concept_id = 'letter_ba'
GROUP BY user_id, concept_id, date
ORDER BY date DESC

Résultat : "Lettre ب : user_456 a amélioré de 72 % d'exactitude (semaine 1) à 94 % (semaine 3)"

Type d'événement 2 : Transition de maîtrise de concept Déclenché lorsqu'un concept change de niveau de maîtrise (débutant → intermédiaire).

{
  "event_type": "mastery_transition",
  "concept_id": "word_kitab",
  "from_level": "beginner",
  "to_level": "intermediate",
  "hlr_half_life_before": 4.0,
  "hlr_half_life_after": 8.0,
  "timestamp": "2026-03-20T10:15:00Z"
}

Suivre les transitions de maîtrise révèle l'efficacité du programme :

Combien d'enfants atteignent l'intermédiaire par concept ?
Temps moyen pour atteindre l'intermédiaire ?
Quels concepts sont des goulots d'étranglement ?

Type d'événement 3 : Croissance de la demi-vie HLR Pendant la répétition espacée, nous suivons la force de la mémoire :

SELECT
  user_id,
  concept_id,
  DATE(FROM_UNIXTIME(timestamp / 1000)) as date,
  MAX(hlr_half_life_hours) as max_half_life,
  COUNT(DISTINCT CASE WHEN is_correct THEN 1 END) as correct_reviews,
  COUNT(DISTINCT CASE WHEN NOT is_correct THEN 1 END) as incorrect_reviews
FROM analytics_lake.hlr_update
GROUP BY user_id, concept_id, date

Résultat : "Juz Amma Al-Ikhlas : user_789 a atteint une demi-vie de 256 heures (stabilité de 2 semaines) après 7 révisions correctes"

Type d'événement 4 : Tendances de précision de reconnaissance vocale Amélioration de la prononciation dans le temps :

SELECT
  user_id,
  DATE_TRUNC('week', FROM_UNIXTIME(timestamp / 1000)) as week,
  AVG(similarity_score) as avg_pronunciation_accuracy,
  APPROX_PERCENTILE(similarity_score, 0.5) as median_accuracy
FROM analytics_lake.speech_recognition_result
WHERE concept_type = 'letter'
GROUP BY user_id, week
ORDER BY week DESC

Résultat : "L'exactitude de la prononciation de l'utilisateur s'est améliorée de 18 % au cours de 8 semaines de pratique cohérente"

Type d'événement 5 : Progression dans la taxonomie de Bloom Suivi des avancées cognitives :

{
  "event_type": "blooms_level_completion",
  "concept_id": "word_kitab",
  "blooms_level_achieved": 4,
  "user_age_group": "5-7",
  "time_to_level_days": 14,
  "attempt_count": 47,
  "timestamp": "2026-03-25T16:45:00Z"
}

Suivi : Combien d'enfants atteignent le niveau 4 de Bloom (Analyser) ? En moyenne, combien de temps cela prend-il ?

Comment cela guide les décisions produit

Décision 1 : Rédiger un contenu

Requête : "Quels contenus ont plus de 40 % de tentatives incorrectes ?"
Résultat : "Exercice de construction de mots pour les clusters de consonnes a un taux d'erreur de 52 %"
Action : L'équipe de contenu repense l'exercice (plus de support, progression plus lente)
Validation : Relancer la requête 2 semaines plus tard, le taux d'erreur devrait baisser à moins de 25 %

Décision 2 : Ajuster le mélange d'exercices

Requête : "Quels types d'exercices ont le plus d'engagement + résultats d'apprentissage ?"
Résultat : Les jeux de physique ont 30 % d'engagement en plus mais les jeux de physique ont 15 % d'amélioration de précision en plus
Action : Augmenter la fréquence des jeux de physique dans les leçons adaptatives

Décision 3 : Identifier les concepts difficiles

Requête : "Concepts où plus de 30 % des utilisateurs n'atteignent jamais le niveau intermédiaire ?"
Résultat : "Les consonnes d'emphase (ص, ض, ط, ظ) sont constamment difficiles"
Action : Créer du contenu supplémentaire (plus d'exercices de prononciation, progression plus lente)

Comparaison avec la concurrence

Indicateur	Duolingo	Amal/Thurayya
Suit les clics	✓ XP, streak	✓ (mais secondaire)
Suit la précision	✗	✓ Par concept
Suit la décroissance de la mémoire	✗	✓ Demi-vie HLR
Suit les résultats d'apprentissage	✗	✓ Transitions de maîtrise
Suit la prononciation	✗	✓ Tendances de précision vocale
Décisions produit basées sur les données	Focus sur l'engagement	Focus sur l'apprentissage

FAQ

Q : Les données de mon enfant sont-elles dans le lac d'analytique ? R : Oui, de manière anonymisée. Nous suivons les mesures d'apprentissage (pas d'éléments personnels identifiables). Vous pouvez voir les mesures de votre enfant dans le tableau de bord des parents ; les chercheurs ne peuvent pas voir les noms des enfants individuellement.

Q : Combien de temps les données sont-elles conservées ? R : Données en direct (12 derniers mois) : dans Athena pour requêtes. Données historiques : archivées sur S3 pendant 7 ans (conformité). La rétention est configurable par type de données.

Q : Puis-je exporter les analyses d'apprentissage de mon enfant ? R : Oui. Le tableau de bord a un bouton "Exporter le rapport" qui génère un PDF avec les résultats d'apprentissage personnalisés des 3 derniers mois.

Analyse Alphazed: Suivi des résultats d'apprentissage

Comment le lac d'analyse d'Alphazed suit les résultats d'apprentissage (pas seulement les clics)

Architecture analytique à trois niveaux

Indicateurs de résultats d'apprentissage que nous suivons

Comment cela guide les décisions produit

Comparaison avec la concurrence

FAQ

Articles connexes

Génération de 10,000 contenus éducatifs avec l'IA

Éducation en arabe à grande échelle sur AWS Lambda

Plateforme multi-apps avec une seule codebase