Wie Alphazeds Analytics-Lake Lernergebnisse verfolgt
Anders als die meisten EdTech-Apps, die Klicks und Bildschirmzeit nachverfolgen, verfolgt Alphazeds Analytics Lake tatsächliche Lernergebnisse: Verbesserung der Aussprachegenauigkeit im Laufe der Zeit, Übergänge in der Konzeptbeherrschung (Anfänger → Fortgeschrittene → Experte), Effektivität von Wiederholungsintervallen (reduzieren Wiederholungssitzungen das Vergessen?) und Fortschritt in der Bloom's Taxonomie. Diese Daten fördern Lehrplanverbesserungen und beweisen Eltern, dass ihre Kinder wirklich lernen und nicht nur spielen.
Drei-Ebenen-Analytik-Architektur
Ebene 1: Mobile Ereignisse (Echtzeit aus der App) Wenn ein Kind eine Übung abschließt, sendet die App ein Ereignis:
{
"event_type": "attempt_complete",
"concept_id": "letter_ba",
"exercise_type": "select",
"accuracy_score": 0.89,
"attempt_number": 3,
"session_id": "session_abc123",
"timestamp": "2026-03-28T14:35:22Z",
"is_correct": true,
"response_time_ms": 2400
}
Ebene 2: Backend-Anreicherung (Kontext wird serverseitig hinzugefügt) Backend ergänzt mit Benutzereigenschaften:
{
"...event...",
"user_id": "user_456",
"age_group": "5-7",
"persona": "intermediate",
"days_since_signup": 34,
"total_practice_minutes": 487,
"app_name": "amal",
"device_type": "Android",
"country": "US"
}
Ebene 3: Analytics Lake (Asynchron, SQL-abfragbar)
Backend sendet angereichertes Ereignis → SQS-Queue (Feuer-und-Vergessen)
↓ (wartet nicht auf Analytik)
↓ (Benutzererfahrung unverändert)
Kinesis Firehose (bündelt Ereignisse alle 5 Minuten oder 100 MB)
↓
S3 (partitioniert: s3://alphazed-analytics/amal/2026/03/28/events.parquet)
↓
AWS Glue (durchläuft S3 jede 1 Stunde und leitet das Schema ab)
↓
Athena (Presto SQL-Engine für Abfragen)
↓
Dashboard (Echtzeit-Eltern-Dashboard + interne Analytik)
Lernerfolg-Metriken, die wir verfolgen
Ereignistyp 1: Abschluss des Versuchs Wird ausgelöst, wenn ein Kind eine Übung abschließt.
SELECT
user_id,
concept_id,
ROUND(AVG(accuracy_score), 2) as avg_accuracy,
COUNT(*) as total_attempts,
SUM(CASE WHEN is_correct THEN 1 ELSE 0 END) as correct_count,
DATE(FROM_UNIXTIME(timestamp / 1000)) as date
FROM analytics_lake.attempt_complete
WHERE app_name = 'amal'
AND concept_id = 'letter_ba'
GROUP BY user_id, concept_id, date
ORDER BY date DESC
Ergebnis: "Buchstabe ب: user_456 verbesserte sich von 72% Genauigkeit (Woche 1) auf 94% (Woche 3)"
Ereignistyp 2: Übergang in der Konzeptbeherrschung Wird ausgelöst, wenn ein Konzept das Beherrschungsniveau ändert (Anfänger → Fortgeschrittener).
{
"event_type": "mastery_transition",
"concept_id": "word_kitab",
"from_level": "beginner",
"to_level": "intermediate",
"hlr_half_life_before": 4.0,
"hlr_half_life_after": 8.0,
"timestamp": "2026-03-20T10:15:00Z"
}
Das Tracking von Beherrschungsübergängen zeigt die Effektivität des Lehrplans:
- Wie viele Kinder erreichen pro Konzept das Fortgeschrittenen-Niveau?
- Durchschnittliche Zeit bis zum Erreichen des Fortgeschrittenen-Niveaus?
- Welche Konzepte sind Engpässe?
Ereignistyp 3: Wachstum der HLR-Halbwertszeit Während der Intervallwiederholung überwachen wir die Gedächtnisstärke:
SELECT
user_id,
concept_id,
DATE(FROM_UNIXTIME(timestamp / 1000)) as date,
MAX(hlr_half_life_hours) as max_half_life,
COUNT(DISTINCT CASE WHEN is_correct THEN 1 END) as correct_reviews,
COUNT(DISTINCT CASE WHEN NOT is_correct THEN 1 END) as incorrect_reviews
FROM analytics_lake.hlr_update
GROUP BY user_id, concept_id, date
Ergebnis: "Juz Amma Al-Ikhlas: user_789 erreichte eine 256-Stunden-Halbwertszeit (2-Wochen-Stabilität) nach 7 richtigen Überprüfungen"
Ereignistyp 4: Trends der Spracherkennung Genauigkeit Verbesserung der Aussprache im Laufe der Zeit:
SELECT
user_id,
DATE_TRUNC('week', FROM_UNIXTIME(timestamp / 1000)) as week,
AVG(similarity_score) as avg_pronunciation_accuracy,
APPROX_PERCENTILE(similarity_score, 0.5) as median_accuracy
FROM analytics_lake.speech_recognition_result
WHERE concept_type = 'letter'
GROUP BY user_id, week
ORDER BY week DESC
Ergebnis: "Die Aussprachgenauigkeit des Nutzers verbesserte sich um 18% über 8 Wochen konstanten Übens"
Ereignistyp 5: Bloom's Taxonomie-Fortschritt Überwachung der kognitiven Niveaufortschritte:
{
"event_type": "blooms_level_completion",
"concept_id": "word_kitab",
"blooms_level_achieved": 4,
"user_age_group": "5-7",
"time_to_level_days": 14,
"attempt_count": 47,
"timestamp": "2026-03-25T16:45:00Z"
}
Verfolgung: Wie viele Kinder erreichen Bloom's Niveau 4 (Analysieren)? Im Durchschnitt, wie lange dauert es?
Wie dies Produktentscheidungen befeuert
Entscheidung 1: Neugestaltung eines Inhaltsbausteins
- Abfrage: "Welche Inhaltsbausteine haben >40% falsche Versuche?"
- Ergebnis: "Wortbildungsübung für Konsonantencluster hat eine Fehlerquote von 52%"
- Aktion: Inhaltsteam gestaltet die Übung neu (mehr Unterstützung, langsamerer Fortschritt)
- Validierung: Abfrage nach 2 Wochen erneut ausführen, Fehlerquote sollte auf <25% sinken
Entscheidung 2: Anpassung der Übungsmischung
- Abfrage: "Welche Übungstypen haben die höchste Beteiligung + Lernergebnis?"
- Ergebnis: Physikspiele haben 30% höhere Beteiligung, aber Physikspiele haben 15% höhere Genauigkeitsverbesserung
- Aktion: Erhöhung der Häufigkeit von Physikspielen in adaptiven Lektionen
Entscheidung 3: Identifizierung schwieriger Konzepte
- Abfrage: "Konzepte, bei denen >30% der Nutzer niemals das Fortgeschrittenen-Niveau erreichen?"
- Ergebnis: "Emphasis-Konsonanten (ص, ض, ط, ظ) sind durchgehend schwierig"
- Aktion: Erstellen von ergänzendem Inhalt (mehr Ausspracheübungen, langsamer fortschreiten)
Vergleich mit Wettbewerbern
| Metrik | Duolingo | Amal/Thurayya |
|---|---|---|
| Verfolgt Klicks | ✓ XP, Serie | ✓ (aber sekundär) |
| Verfolgt Genauigkeit | ✗ | ✓ Pro Konzept |
| Verfolgt Gedächtniszerfall | ✗ | ✓ HLR-Halbwertszeit |
| Verfolgt Lernergebnisse | ✗ | ✓ Beherrschungsübergänge |
| Verfolgt Aussprache | ✗ | ✓ Sprachgenauigkeitstrends |
| Datengetriebene Produktentscheidungen | Fokus auf Beteiligung | Fokus auf Lernen |
FAQ
F: Ist die Daten meines Kindes im Analytics Lake? A: Ja, anonymisiert. Wir verfolgen Lernmetriken (nicht personenbezogen). Sie können die Metriken Ihres Kindes im Eltern-Dashboard sehen; Forscher können keine individuellen Kindernamen sehen.
F: Wie lange werden Daten aufbewahrt? A: Live-Daten (vergangene 12 Monate): in Athena für Abfragen. Historische Daten: zu S3 für 7 Jahre archiviert (Compliance). Aufbewahrung ist pro Datentyp konfigurierbar.
F: Kann ich die Lernanalytik meines Kindes exportieren? A: Ja. Das Dashboard hat einen "Exportbericht"-Knopf, der ein PDF mit personalisierten Lernergebnissen für die letzten 3 Monate erstellt.


