Kako Alphazed kreira 10.000+ edukativnih sadržaja pomoću AI
Čitanje: 4 minMohammad Shaker

Kako Alphazed kreira 10.000+ edukativnih sadržaja pomoću AI

Alphazed koristi automatizirane AI procese za izradu 10.000+ edukativnih materijala prilagođenih kurikulumu, uz ljudsku kontrolu kvalitete.

Engineering

Brzi odgovor

Alphazed koristi automatizirane AI procese za izradu 10.000+ edukativnih materijala prilagođenih kurikulumu, uz ljudsku kontrolu kvalitete.

Alphazed koristi automatizirane AI procese za kreiranje i uređivanje više od 10.000 edukativnih sadržaja — uključujući vježbe arapskog vokabulara, vježbe izgovora, sekvence za učenje Kur'ana i interaktivne priče. Ovaj proces kombinira OpenAI za generisanje teksta, Google Cloud TTS za zvuk, prilagođene generatore slika i ljudsku kontrolu kvalitete kako bi se proizveli sadržaji usklađeni s obrazovnim programom u velikom obimu.

Stack za generisanje sadržaja

Generisanje teksta

  • OpenAI GPT-4o-mini: Generira zadatke, ometače, skripte priča i tumačenja Kur’ana
  • Prompt inženjering: Precizno dizajnirani upiti osiguravaju da su rezultati u skladu sa Bloomovom taksonomijom
  • Primjer upita: „Generiraj 5 vjerodostojnih ometača za arapsku riječ ‘كتاب’ (knjiga). Ometači moraju biti semantički povezani, ali jasno različiti. Nivo: Srednjoškolac, dob 6-8.“

Generisanje zvuka

  • Google Cloud TTS (WaveNet glasovi): Generira zvuk arapskog izvornog kvaliteta
  • Više glasova: Muški/ženski glasovi, različite brzine govora, emotivni tonovi
  • Prilagođen izgovor: Dijakritički znakovi utiču na odabir fonema za autentičan izgovor Kur’ana
  • Ekstrakcija govornih markera: Vremenski pečati fonema za animacije usana (blog #3)

Napredni audio

  • ElevenLabs za višejezične glasove: Marketinški video zapisi, uvodne sekvence aplikacija
  • Kompozicija muzike: Besplatni pozadinski muzicki zapisi sa Epidemic Sound

Generisanje slika

  • Prilagođene slike ometača preko DALL-E ili Midjourney
  • Vektorske grafike za UI elemente
  • Ilustracije likova za priče

Arhitektura procesa

Repository: alphazed-content-utils (Python, 20+ generator modula)

Generators (nezavisni, složivi):
  ├── amal_level_generator.py
  │   └── Generiše kompletne nivoe za učenje arapskog
  │       (slova → riječi → rečenice)
  │
  ├── prophet_story_generator.py
  │   └── Multimodalne priče za Thurayya
  │       (tekst + ilustracije + naracija)
  │
  ├── quran_tafseer_generator.py
  │   └── Sadržaj tumačenja Kur’ana
  │       (objašnjenja po suri i ajetu)
  │
  ├── distractor_generator.py
  │   └── Pametni netačni odgovori za višestruki izbor
  │       (semantičko podudaranje)
  │
  ├── exercise_generator.py
  │   └── Interaktivne vježbe (45+ tipova)
  │       (odabir tipa vježbe iz kataloga)
  │
  └── image_generator.py
      └── Vizualni sadržaj (DALL-E ili Midjourney API)

Svaki generator prati standardni tok:

[Učitavanje konfiguracije] → [Generisanje] → [Validacija] → [Unos u bazu]

Detaljno o generatoru: Generisanje ometača

Problem

Za vježbe višestrukog izbora, netačni odgovori (ometači) moraju biti:

  • Vjerodostojni (da dijete ne prepozna odmah kao pogrešne)
  • Povezani (semantički ili fonetski slični)
  • Jasno različiti (da se dijete može fokusirati i razlikovati)

Loši ometači:

  • Pitanje: „Koja riječ znači knjiga?“
  • Netačni: „Slon“, „Plavo“, „Sretan“ ← Previše očigledno pogrešni

Dobri ometači:

  • Pitanje: „Koja riječ znači knjiga?“
  • Opcije: „كتاب“ (knjiga), „كاتب“ (pisac), „مكتب“ (ured), „كتب“ (množina knjiga) ← Semantički povezani, zahtijevaju razmišljanje

Implementacija (distractor_generator.py)

  1. Semantičko podudaranje:
    • Izračunati ugrađene reprezentacije (embeddings) za tačan odgovor, koristeći arapske vektorske modele riječi
    • Pronaći riječi s visokom sličnosti (raspon 0.7-0.85)
    • Isključiti previše slične riječi (sinonime)
  2. Fonetska sličnost:
    • Za slova i zvukove, uskladiti prema fonetskim osobinama
    • Primjer: ‘‘ب‘‘ (Ba) ometači: ‘‘ت‘‘ (Ta), ‘‘ث‘‘ (Tha) — zvučne porodice
  3. Težinsko biranje:
    • Prilagoditi za nivo težine vježbe
    • Početničke vježbe dobijaju različite i jasne ometače
    • Napredne vježbe dobijaju suptilnije ometače

Osiguranje kvaliteta: Ljudska i AI kontrola

Automatizovana validacija

  • Provjera gramatike: analize arapske morfologije
  • Dijakritički znakovi: provjera tačnosti tashkeela
  • Set karaktera: isključivanje grešaka kodiranja
  • Duplikacija sadržaja: detektovanje identičnih zapisa

Obavezna ljudska revizija

  • Kur’an/tajvid sadržaj: Provjerava islamski učenjak (volonter)
  • Sigurnost za djecu: Skenira veliki jezički model za neprimjereni jezik
  • Kulturalna osjetljivost: Pregled radi otklanjanja potencijalne uvredljivosti
  • Tačnost: Povremene kontrolne provjere (10% sadržaja)

Politika bez zaobilaznih rješenja

Ako validacija ne prođe, proces se zaustavlja i šalje obavijest preko Slacka. Greške nikada ne prolaze bez nadzora u proizvodnju.

Kategorije generisanog sadržaja

KategorijaKoličinaGeneratorQA kontrolaIzlaz
Arapski vokabular5,000+ stavkiexercise_genAutomatska1. sedmica
Kur’anske sure200+ (37 × 5-7 faza)tafseer_genUčenjak2. sedmica
Priče o poslanicima50+prophet_story_genKultura + sigurnost3. sedmica
Izgovor fonema100+ (28 slova × 3-4 varijante)audio_genAudio inženjer1. sedmica
Interaktivne igre45+ tipova × 1,000+ primjerakagame_content_genTest igreU toku
Ukupno10,000+VišeVišeslojnoPostepeno

Troškovi i efikasnost

Cijena po sadržajnoj jedinici (AI + ljudska revizija):

  • Jednostavna vokabularna vježba: 0,05-0,10 USD
  • Kur’anska sura (4 faze): 5-10 USD (zbog revizije učenjaka)
  • Priče: 1-2 USD

Prosječni trošak za 1.000 stavki: 300-500 USD

Ručna izrada sadržaja koštala bi 5.000-10.000 USD za 1.000 stavki. AI procesi smanjuju cijenu desetostruko, dok povećavaju količinu i konzistentnost.

Zašto je ovo važno

  • Obim: 10.000 stavki zahtijeva ozbiljnu infrastrukturu
  • Arapska stručnost: Gen. ometača za arapski je specifičan izazov
  • Kur’anska osjetljivost: Revizije učenjaka zahtijevaju vrijeme i povjerenje
  • Stalno osvježavanje: Naš proces generira novi sadržaj svake sedmice

Često postavljana pitanja

P: Je li AI sadržaj jednako kvalitetan kao ručno rađeni?
A: Za vježbe — da, često čak i bolji. AI je dosljedan i neumoran. Za tumačenje Kur’ana, obavezna je ljudska revizija. Za priče koristimo mješavinu AI i ljudske dorade. Optimalan omjer ovisi od tipa sadržaja.

P: Primjećuju li djeca da koriste AI-generirani sadržaj?
A: Ne, sadržaj je neprimjetan. Najvažnija je tačnost (validirana) i usklađenost s kurikulumom, a ne autorstvo.

P: Kako sprječavate generisanje grešaka u procesu?
A: Politika bez zaobilaznog prolaza: ako nešto ne prođe validaciju, proces se zaustavlja i šalje upozorenje. Radije imamo 99% verificiranog sadržaja nego 100% s mogućim greškama. Svi kur’anski sadržaji se nerijetko ručno pregledaju.

Povezani članci