Alphazed koristi automatizirane AI procese za kreiranje i uređivanje više od 10.000 edukativnih sadržaja — uključujući vježbe arapskog vokabulara, vježbe izgovora, sekvence za učenje Kur'ana i interaktivne priče. Ovaj proces kombinira OpenAI za generisanje teksta, Google Cloud TTS za zvuk, prilagođene generatore slika i ljudsku kontrolu kvalitete kako bi se proizveli sadržaji usklađeni s obrazovnim programom u velikom obimu.
Stack za generisanje sadržaja
Generisanje teksta
- OpenAI GPT-4o-mini: Generira zadatke, ometače, skripte priča i tumačenja Kur’ana
- Prompt inženjering: Precizno dizajnirani upiti osiguravaju da su rezultati u skladu sa Bloomovom taksonomijom
- Primjer upita: „Generiraj 5 vjerodostojnih ometača za arapsku riječ ‘كتاب’ (knjiga). Ometači moraju biti semantički povezani, ali jasno različiti. Nivo: Srednjoškolac, dob 6-8.“
Generisanje zvuka
- Google Cloud TTS (WaveNet glasovi): Generira zvuk arapskog izvornog kvaliteta
- Više glasova: Muški/ženski glasovi, različite brzine govora, emotivni tonovi
- Prilagođen izgovor: Dijakritički znakovi utiču na odabir fonema za autentičan izgovor Kur’ana
- Ekstrakcija govornih markera: Vremenski pečati fonema za animacije usana (blog #3)
Napredni audio
- ElevenLabs za višejezične glasove: Marketinški video zapisi, uvodne sekvence aplikacija
- Kompozicija muzike: Besplatni pozadinski muzicki zapisi sa Epidemic Sound
Generisanje slika
- Prilagođene slike ometača preko DALL-E ili Midjourney
- Vektorske grafike za UI elemente
- Ilustracije likova za priče
Arhitektura procesa
Repository: alphazed-content-utils (Python, 20+ generator modula)
Generators (nezavisni, složivi):
├── amal_level_generator.py
│ └── Generiše kompletne nivoe za učenje arapskog
│ (slova → riječi → rečenice)
│
├── prophet_story_generator.py
│ └── Multimodalne priče za Thurayya
│ (tekst + ilustracije + naracija)
│
├── quran_tafseer_generator.py
│ └── Sadržaj tumačenja Kur’ana
│ (objašnjenja po suri i ajetu)
│
├── distractor_generator.py
│ └── Pametni netačni odgovori za višestruki izbor
│ (semantičko podudaranje)
│
├── exercise_generator.py
│ └── Interaktivne vježbe (45+ tipova)
│ (odabir tipa vježbe iz kataloga)
│
└── image_generator.py
└── Vizualni sadržaj (DALL-E ili Midjourney API)
Svaki generator prati standardni tok:
[Učitavanje konfiguracije] → [Generisanje] → [Validacija] → [Unos u bazu]
Detaljno o generatoru: Generisanje ometača
Problem
Za vježbe višestrukog izbora, netačni odgovori (ometači) moraju biti:
- Vjerodostojni (da dijete ne prepozna odmah kao pogrešne)
- Povezani (semantički ili fonetski slični)
- Jasno različiti (da se dijete može fokusirati i razlikovati)
Loši ometači:
- Pitanje: „Koja riječ znači knjiga?“
- Netačni: „Slon“, „Plavo“, „Sretan“ ← Previše očigledno pogrešni
Dobri ometači:
- Pitanje: „Koja riječ znači knjiga?“
- Opcije: „كتاب“ (knjiga), „كاتب“ (pisac), „مكتب“ (ured), „كتب“ (množina knjiga) ← Semantički povezani, zahtijevaju razmišljanje
Implementacija (distractor_generator.py)
- Semantičko podudaranje:
- Izračunati ugrađene reprezentacije (embeddings) za tačan odgovor, koristeći arapske vektorske modele riječi
- Pronaći riječi s visokom sličnosti (raspon 0.7-0.85)
- Isključiti previše slične riječi (sinonime)
- Fonetska sličnost:
- Za slova i zvukove, uskladiti prema fonetskim osobinama
- Primjer: ‘‘ب‘‘ (Ba) ometači: ‘‘ت‘‘ (Ta), ‘‘ث‘‘ (Tha) — zvučne porodice
- Težinsko biranje:
- Prilagoditi za nivo težine vježbe
- Početničke vježbe dobijaju različite i jasne ometače
- Napredne vježbe dobijaju suptilnije ometače
Osiguranje kvaliteta: Ljudska i AI kontrola
Automatizovana validacija
- Provjera gramatike: analize arapske morfologije
- Dijakritički znakovi: provjera tačnosti tashkeela
- Set karaktera: isključivanje grešaka kodiranja
- Duplikacija sadržaja: detektovanje identičnih zapisa
Obavezna ljudska revizija
- Kur’an/tajvid sadržaj: Provjerava islamski učenjak (volonter)
- Sigurnost za djecu: Skenira veliki jezički model za neprimjereni jezik
- Kulturalna osjetljivost: Pregled radi otklanjanja potencijalne uvredljivosti
- Tačnost: Povremene kontrolne provjere (10% sadržaja)
Politika bez zaobilaznih rješenja
Ako validacija ne prođe, proces se zaustavlja i šalje obavijest preko Slacka. Greške nikada ne prolaze bez nadzora u proizvodnju.
Kategorije generisanog sadržaja
| Kategorija | Količina | Generator | QA kontrola | Izlaz |
|---|---|---|---|---|
| Arapski vokabular | 5,000+ stavki | exercise_gen | Automatska | 1. sedmica |
| Kur’anske sure | 200+ (37 × 5-7 faza) | tafseer_gen | Učenjak | 2. sedmica |
| Priče o poslanicima | 50+ | prophet_story_gen | Kultura + sigurnost | 3. sedmica |
| Izgovor fonema | 100+ (28 slova × 3-4 varijante) | audio_gen | Audio inženjer | 1. sedmica |
| Interaktivne igre | 45+ tipova × 1,000+ primjeraka | game_content_gen | Test igre | U toku |
| Ukupno | 10,000+ | Više | Višeslojno | Postepeno |
Troškovi i efikasnost
Cijena po sadržajnoj jedinici (AI + ljudska revizija):
- Jednostavna vokabularna vježba: 0,05-0,10 USD
- Kur’anska sura (4 faze): 5-10 USD (zbog revizije učenjaka)
- Priče: 1-2 USD
Prosječni trošak za 1.000 stavki: 300-500 USD
Ručna izrada sadržaja koštala bi 5.000-10.000 USD za 1.000 stavki. AI procesi smanjuju cijenu desetostruko, dok povećavaju količinu i konzistentnost.
Zašto je ovo važno
- Obim: 10.000 stavki zahtijeva ozbiljnu infrastrukturu
- Arapska stručnost: Gen. ometača za arapski je specifičan izazov
- Kur’anska osjetljivost: Revizije učenjaka zahtijevaju vrijeme i povjerenje
- Stalno osvježavanje: Naš proces generira novi sadržaj svake sedmice
Često postavljana pitanja
P: Je li AI sadržaj jednako kvalitetan kao ručno rađeni?
A: Za vježbe — da, često čak i bolji. AI je dosljedan i neumoran. Za tumačenje Kur’ana, obavezna je ljudska revizija. Za priče koristimo mješavinu AI i ljudske dorade. Optimalan omjer ovisi od tipa sadržaja.
P: Primjećuju li djeca da koriste AI-generirani sadržaj?
A: Ne, sadržaj je neprimjetan. Najvažnija je tačnost (validirana) i usklađenost s kurikulumom, a ne autorstvo.
P: Kako sprječavate generisanje grešaka u procesu?
A: Politika bez zaobilaznog prolaza: ako nešto ne prođe validaciju, proces se zaustavlja i šalje upozorenje. Radije imamo 99% verificiranog sadržaja nego 100% s mogućim greškama. Svi kur’anski sadržaji se nerijetko ručno pregledaju.


