Alphazed entwickelte eine vollautomatisierte KI-Marketingpipeline, die arabische Bildungstrends auf YouTube entdeckt, diese auf Relevanz bewertet, Videoskripte auf Arabisch erstellt, Bilder mit DALL-E generiert, Voiceovers mit ElevenLabs synthetisiert, Videos mit FFmpeg komponiert, Sicherheitsüberprüfungen durchführt und schließlich auf YouTube veröffentlicht — alles mit einer menschlichen Genehmigung über Slack, bevor irgendetwas veröffentlicht wird.
Die 13-Schritte-Pipeline
Schritt 1: Trends entdecken
└─ YouTubeAPI: Abrufen von Trends im arabischen Bildungsbereich
Suchanfragen: "تعليم", "أطفال", "تعلم", "عربي"
Extraktion: Titel, Aufrufe, Geschwindigkeit (Aufrufe pro Tag), Kommentare, Abonnentenbindung
Schritt 2: Trends bewerten
└─ TrendScorer: Gewichtete Formel
Score = (views × 0.35) + (velocity × 0.30) + (topic_fit × 0.20) + (region × 0.10) + (safety × 0.05)
Schwelle: Nur Trends mit über 75 Punkten gehen weiter
Schritt 3: Ideengenerierung
└─ ContentIdeator: Videokonzept generieren
Eingabe: Trendthema (z.B. "تحفيز الأطفال على تعلم العربية")
Ausgabe: Videokonzept, Zielalter, Lernziel
Schritt 4: Skripterstellung
└─ GPT-4o: Arabisches Videoskript generieren
Eingabeaufforderung: "Erstelle ein 2-minütiges YouTube-Short-Skript über [Thema] für Kinder im Alter von [Alter] in Arabisch"
Ausgabe: Szenenweises Skript mit Narration
Schritt 5: Hook-Varianten
└─ HookGenerator: Erstelle 3 verschiedene Einstiegshooks
Variante 1: Story-basierter Einstieg
Variante 2: Frage-basierter Einstieg
Variante 3: Herausforderung-basierter Einstieg
Später, A/B-Test, welcher Hook die höchste CTR erhält
Schritt 6: Storyboard
└─ StoryboardGenerator: Visuelle Sequenz erstellen
Eingabe: Skript
Ausgabe: Szenenweiser Ablauf (20-30 Einstellungen für 2-Minuten-Video)
Schritt 7: Bildgenerierung
└─ DALL-E: Visuals für jede Einstellung generieren
Eingabeaufforderung: "Kind lernt arabischen Buchstaben ب in einem bunten Klassenzimmer"
Ausgabe: 20-30 Bilder, in passendem Stil
Schritt 8: Voiceover-Synthese
└─ ElevenLabs: Arabische Narration erzeugen
Stimme: Weibliche Stimme, kindgerecht, klare Artikulation
Sprache: Arabisch (Saudi-Dialekt für breite Anziehungskraft)
Ausgabe: MP3-Audio, Sprachmarken für Lip-Sync-Referenz
Schritt 9: Videokomposition
└─ FFmpeg: Video zusammensetzen
Eingabe: Bilder (Schritt 7) + Audio (Schritt 8) + Hintergrundmusik
Ausgabe: MP4-Video, 1080p, optimiert für YouTube Shorts
Schritt 10: Überprüfung der Konformität
└─ KidsSafetyChecker: LLM-Scan auf unpassende Inhalte
Überprüfung: Keine Gewalt, keine unangemessene Sprache, keine Drittanbieter-IP
Ausgabe: Bestehen/Nichtbestehen + Anmerkungen
Schritt 11: Slack-Genehmigungstor
└─ SlackBot: Videovorschau + Metadaten posten
Team überprüft: Vorschaubild, Titel, Beschreibung, Transkript
Genehmigungsoptionen: ✓ Veröffentlichen | 🔄 Überarbeiten | ✗ Ablehnen
Schritt 12: Veröffentlichen
└─ YouTubeAPI: Hochladen auf Alphazed-Kanal
Titel, Beschreibung, Tags, Vorschaubild
Sichtbarkeit: Öffentlich
Schritt 13: Analyse-Synchronisierung
└─ YouTubeAnalytics: Leistung verfolgen
Metriken: Aufrufe, CTR, durchschnittliche Wiedergabedauer, Shares
Feedback: Nutzung der Metriken zur Verbesserung zukünftiger Skripte
Trendbewertungsalgorithmus (Schritt 2)
Die Formel
def score_trend(trend_data):
"""
trend_data = {
'views': 500000,
'days_since_upload': 7,
'topic': 'تعليم الأطفال العربية',
'language': 'ar',
'age_group': '5-12',
'video_category': 'education'
}
"""
# Komponente 1: Rohe Popularität (Aufrufe)
popularity_score = min(trend_data['views'] / 1_000_000, 1.0) * 100 # Maximal 100
# Maximal bei 1M Aufrufen = 100 Punkte
# Komponente 2: Geschwindigkeit (Wachstumsrate)
velocity = trend_data['views'] / trend_data['days_since_upload']
velocity_score = min(velocity / 100_000, 1.0) * 100 # Maximal 100
# 100k Aufrufe/Tag = 100 Punkte
# Komponente 3: Themenpassung
relevante Schlüsselwörter = ['عربية', 'قرآن', 'أطفال', 'تعليم', 'لغة']
keyword_matches = sum(1 for kw in relevante Schlüsselwörter if kw in trend_data['topic'])
topic_fit_score = (keyword_matches / len(relevante Schlüsselwörter)) * 100
# Komponente 4: Regionale Relevanz
# Videos, die in MENA, Südasien, Malaysia im Trend liegen, punkten höher
region_score = get_region_weight(trend_data.get('region', 'unbekannt')) * 100
# Komponente 5: Sicherheit (schneller LLM-Check)
safety_score = 100 if is_kid_safe(trend_data['title']) else 0
# Gewichtete Summe
final_score = (
popularity_score * 0.35 +
velocity_score * 0.30 +
topic_fit_score * 0.20 +
region_score * 0.10 +
safety_score * 0.05
)
return {
'overall_score': final_score,
'pass_threshold': final_score >= 75,
'breakdown': {
'popularity': popularity_score,
'velocity': velocity_score,
'topic_fit': topic_fit_score,
'region': region_score,
'safety': safety_score
}
}
Beispiel: Bewertung eines Trendvideos
Trend: "Wie man Kindern zu Hause die arabischen Buchstaben beibringt"
Metriken:
- Aufrufe: 500.000
- Tage: 7
- Schlüsselwörter: Enthält "lehret", "Kinder", "Arabisch"
- Region: USA + Kanada
- Sicherheit: Sauber
Bewertung:
- Popularität: 50 (500k/1M gedeckelt)
- Geschwindigkeit: 71 (500k Aufrufe / 7 Tage = ~71k/Tag)
- Themenpassung: 67 (3 von 5 Schlüsselwörtern passen)
- Region: 60 (US Diaspora)
- Sicherheit: 100 (sauber)
Final: (50 × 0.35) + (71 × 0.30) + (67 × 0.20) + (60 × 0.10) + (100 × 0.05)
= 17.5 + 21.3 + 13.4 + 6 + 5
= 63.2 → FAIL (unter 75 Schwellenwert)
Höherbewertetes Beispiel
Trend: "تعليم القرآن للأطفال - طرق فعالة"
Metriken:
- Aufrufe: 2.000.000 (viral)
- Tage: 3 (schnelles Wachstum)
- Schlüsselwörter: "قرآن", "أطفال", "تعليم" (alle passen)
- Region: MENA + Südasien
- Sicherheit: Sauber
Bewertung:
- Popularität: 100 (gedeckelt)
- Geschwindigkeit: 100 (2M/3 Tage = 666k/Tag, gedeckelt)
- Themenpassung: 100 (3 von 3 Schlüsselwörtern)
- Region: 90 (MENA + Diaspora)
- Sicherheit: 100
Final: (100 × 0.35) + (100 × 0.30) + (100 × 0.20) + (90 × 0.10) + (100 × 0.05)
= 35 + 30 + 20 + 9 + 5
= 99 → PASS! (ausgezeichnete Passform)
Mensch-in-der-Schleife: Obligatorische Genehmigung
Bevor ein Video veröffentlicht wird, geht es zur Teamüberprüfung an Slack:
Slack-Benachrichtigung
🎥 [Pipeline] Bereit zur Überprüfung: Video #47
Titel: "كيف تعلم ابنك حروف العربية بسهولة"
Themenbewertung: 89/100
Erwartete Aufrufe (ML-Modell): 85.000-120.000
[Video-Vorschau] [Transkript anzeigen] [Analyse anzeigen]
Konformitätsstatus: ✅ Bestanden
- Keine Gewalt: ✓
- Altersgerecht: ✓
- Keine IP-Verletzungen: ✓
Aktionen: ✓ Veröffentlichen | 🔄 Überarbeiten | ✗ Ablehnen
Sondertore
- Quran-Inhalte: Zusätzliche wissenschaftliche Prüfung
- Neue Trends: Zusätzliche manuelle Prüfung
- Trends mit hoher Geschwindigkeit: Schnellere Pipeline-Priorität
Ports & Adapters Architektur
Die Pipeline ist so gestaltet, dass Anbieter ausgetauscht werden können, ohne die Geschäftslogik zu ändern:
# src/services/content_generation/interfaces.py
class TextGeneratorInterface:
def generate_script(self, topic: str, age_group: str) -> str:
pass
class OpenAIScriptGenerator(TextGeneratorInterface):
def generate_script(self, topic: str, age_group: str) -> str:
# Benutze OpenAI API
pass
class ClaudeScriptGenerator(TextGeneratorInterface):
def generate_script(self, topic: str, age_group: str) -> str:
# Benutze Anthropic API
pass
# Laufzeit, injiziere den richtigen Anbieter
script_generator = ClaudeScriptGenerator() # Einfach zu wechseln
script = script_generator.generate_script('تعليم العربية', '5-7')
Vorteil: Wenn OpenAI ausfällt, wechsle zu Claude mit einer Konfigurationsänderung.
Ergebnisse
Volumen
- Eingabe: 50-100 Trendthemen pro Woche
- Schwellenwert-Durchlaufquote: ~20% (15-20 Trends bestehen das Scoring)
- Veröffentlicht: ~3-4 Videos pro Woche
- Jahresausgabe: 150-200 Videos
Leistung (Tatsächliche Daten)
- Durchschnittliche Aufrufe pro Video: 12.000-45.000
- Durchschnittliche CTR: 8-12% (Branche: 2-5%)
- Durchschnittliche Wiedergabezeit: 65-85% der Videolänge (Branche: 40-50%)
- Konversion (Aufrufe → App-Installationen): 3-5% (Branche: 0,5-1%)
Kosten
- KI-Generierung pro Video: $3-5 (GPT, DALL-E, ElevenLabs)
- Menschliche Überprüfung: 15 Min × $25/Stunde = $6,25
- YouTube-Hosting: Kostenlos
- Total pro Video: ~$10
- Kosten pro Installation: ~$2-3 (berechnet aus 3-5% Konversion)
FAQ
Q: Was, wenn ein generiertes Skript ungenau über Arabisch ist? A: Die menschliche Genehmigung fängt dies ab. Wenn das Skript grammatikalische Fehler oder kulturelle Unempfindlichkeiten aufweist, wählt der Prüfer "Überarbeiten" und gibt Anmerkungen an. Die Pipeline regeneriert mit Feedback.
Q: Verstößt dies gegen YouTubes Automatisierungsrichtlinien? A: Nein. Wir haben eine menschliche Überprüfung vor der Veröffentlichung (obligatorisches Slack-Tor). YouTube erlaubt KI-unterstützte Inhalte, solange sie nicht vollständig automatisiert ohne Überwachung sind.
Q: Können KI-generierte Videos gut im Suchranking abschneiden? A: Ja, wenn sie qualitativ hochwertig sind (wie unsere). Der Algorithmus bestraft nicht die KI-Erstellung — er belohnt Wiedergabezeit, CTR und Engagement. Unsere Videos schneiden besser als der Durchschnitt ab.


