Von Trendentdeckung bis YouTube-Video: Unsere KI im Einsatz
6 Min. LesezeitMohammad Shaker

Von Trendentdeckung bis YouTube-Video: Unsere KI im Einsatz

Alphazed entwickelte eine KI-Marketingpipeline, die arabische Bildungstrends entdeckt und automatisiert Videos erstellt und veröffentlicht.

Engineering

Schnelle Antwort

Alphazed entwickelte eine KI-Marketingpipeline, die arabische Bildungstrends entdeckt und automatisiert Videos erstellt und veröffentlicht.

Alphazed entwickelte eine vollautomatisierte KI-Marketingpipeline, die arabische Bildungstrends auf YouTube entdeckt, diese auf Relevanz bewertet, Videoskripte auf Arabisch erstellt, Bilder mit DALL-E generiert, Voiceovers mit ElevenLabs synthetisiert, Videos mit FFmpeg komponiert, Sicherheitsüberprüfungen durchführt und schließlich auf YouTube veröffentlicht — alles mit einer menschlichen Genehmigung über Slack, bevor irgendetwas veröffentlicht wird.

Die 13-Schritte-Pipeline

Schritt 1: Trends entdecken
  └─ YouTubeAPI: Abrufen von Trends im arabischen Bildungsbereich
     Suchanfragen: "تعليم", "أطفال", "تعلم", "عربي"
     Extraktion: Titel, Aufrufe, Geschwindigkeit (Aufrufe pro Tag), Kommentare, Abonnentenbindung

Schritt 2: Trends bewerten
  └─ TrendScorer: Gewichtete Formel
     Score = (views × 0.35) + (velocity × 0.30) + (topic_fit × 0.20) + (region × 0.10) + (safety × 0.05)
     Schwelle: Nur Trends mit über 75 Punkten gehen weiter

Schritt 3: Ideengenerierung
  └─ ContentIdeator: Videokonzept generieren
     Eingabe: Trendthema (z.B. "تحفيز الأطفال على تعلم العربية")
     Ausgabe: Videokonzept, Zielalter, Lernziel

Schritt 4: Skripterstellung
  └─ GPT-4o: Arabisches Videoskript generieren
     Eingabeaufforderung: "Erstelle ein 2-minütiges YouTube-Short-Skript über [Thema] für Kinder im Alter von [Alter] in Arabisch"
     Ausgabe: Szenenweises Skript mit Narration

Schritt 5: Hook-Varianten
  └─ HookGenerator: Erstelle 3 verschiedene Einstiegshooks
     Variante 1: Story-basierter Einstieg
     Variante 2: Frage-basierter Einstieg
     Variante 3: Herausforderung-basierter Einstieg
     Später, A/B-Test, welcher Hook die höchste CTR erhält

Schritt 6: Storyboard
  └─ StoryboardGenerator: Visuelle Sequenz erstellen
     Eingabe: Skript
     Ausgabe: Szenenweiser Ablauf (20-30 Einstellungen für 2-Minuten-Video)

Schritt 7: Bildgenerierung
  └─ DALL-E: Visuals für jede Einstellung generieren
     Eingabeaufforderung: "Kind lernt arabischen Buchstaben ب in einem bunten Klassenzimmer"
     Ausgabe: 20-30 Bilder, in passendem Stil

Schritt 8: Voiceover-Synthese
  └─ ElevenLabs: Arabische Narration erzeugen
     Stimme: Weibliche Stimme, kindgerecht, klare Artikulation
     Sprache: Arabisch (Saudi-Dialekt für breite Anziehungskraft)
     Ausgabe: MP3-Audio, Sprachmarken für Lip-Sync-Referenz

Schritt 9: Videokomposition
  └─ FFmpeg: Video zusammensetzen
     Eingabe: Bilder (Schritt 7) + Audio (Schritt 8) + Hintergrundmusik
     Ausgabe: MP4-Video, 1080p, optimiert für YouTube Shorts

Schritt 10: Überprüfung der Konformität
  └─ KidsSafetyChecker: LLM-Scan auf unpassende Inhalte
     Überprüfung: Keine Gewalt, keine unangemessene Sprache, keine Drittanbieter-IP
     Ausgabe: Bestehen/Nichtbestehen + Anmerkungen

Schritt 11: Slack-Genehmigungstor
  └─ SlackBot: Videovorschau + Metadaten posten
     Team überprüft: Vorschaubild, Titel, Beschreibung, Transkript
     Genehmigungsoptionen: ✓ Veröffentlichen | 🔄 Überarbeiten | ✗ Ablehnen

Schritt 12: Veröffentlichen
  └─ YouTubeAPI: Hochladen auf Alphazed-Kanal
     Titel, Beschreibung, Tags, Vorschaubild
     Sichtbarkeit: Öffentlich

Schritt 13: Analyse-Synchronisierung
  └─ YouTubeAnalytics: Leistung verfolgen
     Metriken: Aufrufe, CTR, durchschnittliche Wiedergabedauer, Shares
     Feedback: Nutzung der Metriken zur Verbesserung zukünftiger Skripte

Trendbewertungsalgorithmus (Schritt 2)

Die Formel

def score_trend(trend_data):
    """
    trend_data = {
        'views': 500000,
        'days_since_upload': 7,
        'topic': 'تعليم الأطفال العربية',
        'language': 'ar',
        'age_group': '5-12',
        'video_category': 'education'
    }
    """
    
    # Komponente 1: Rohe Popularität (Aufrufe)
    popularity_score = min(trend_data['views'] / 1_000_000, 1.0) * 100  # Maximal 100
    # Maximal bei 1M Aufrufen = 100 Punkte
    
    # Komponente 2: Geschwindigkeit (Wachstumsrate)
    velocity = trend_data['views'] / trend_data['days_since_upload']
    velocity_score = min(velocity / 100_000, 1.0) * 100  # Maximal 100
    # 100k Aufrufe/Tag = 100 Punkte
    
    # Komponente 3: Themenpassung
    relevante Schlüsselwörter = ['عربية', 'قرآن', 'أطفال', 'تعليم', 'لغة']
    keyword_matches = sum(1 for kw in relevante Schlüsselwörter if kw in trend_data['topic'])
    topic_fit_score = (keyword_matches / len(relevante Schlüsselwörter)) * 100
    
    # Komponente 4: Regionale Relevanz
    # Videos, die in MENA, Südasien, Malaysia im Trend liegen, punkten höher
    region_score = get_region_weight(trend_data.get('region', 'unbekannt')) * 100
    
    # Komponente 5: Sicherheit (schneller LLM-Check)
    safety_score = 100 if is_kid_safe(trend_data['title']) else 0
    
    # Gewichtete Summe
    final_score = (
        popularity_score * 0.35 +
        velocity_score * 0.30 +
        topic_fit_score * 0.20 +
        region_score * 0.10 +
        safety_score * 0.05
    )
    
    return {
        'overall_score': final_score,
        'pass_threshold': final_score >= 75,
        'breakdown': {
            'popularity': popularity_score,
            'velocity': velocity_score,
            'topic_fit': topic_fit_score,
            'region': region_score,
            'safety': safety_score
        }
    }

Beispiel: Bewertung eines Trendvideos

Trend: "Wie man Kindern zu Hause die arabischen Buchstaben beibringt"
Metriken:
  - Aufrufe: 500.000
  - Tage: 7
  - Schlüsselwörter: Enthält "lehret", "Kinder", "Arabisch"
  - Region: USA + Kanada
  - Sicherheit: Sauber

Bewertung:
  - Popularität: 50 (500k/1M gedeckelt)
  - Geschwindigkeit: 71 (500k Aufrufe / 7 Tage = ~71k/Tag)
  - Themenpassung: 67 (3 von 5 Schlüsselwörtern passen)
  - Region: 60 (US Diaspora)
  - Sicherheit: 100 (sauber)
  
Final: (50 × 0.35) + (71 × 0.30) + (67 × 0.20) + (60 × 0.10) + (100 × 0.05)
      = 17.5 + 21.3 + 13.4 + 6 + 5
      = 63.2 → FAIL (unter 75 Schwellenwert)

Höherbewertetes Beispiel

Trend: "تعليم القرآن للأطفال - طرق فعالة"
Metriken:
  - Aufrufe: 2.000.000 (viral)
  - Tage: 3 (schnelles Wachstum)
  - Schlüsselwörter: "قرآن", "أطفال", "تعليم" (alle passen)
  - Region: MENA + Südasien
  - Sicherheit: Sauber

Bewertung:
  - Popularität: 100 (gedeckelt)
  - Geschwindigkeit: 100 (2M/3 Tage = 666k/Tag, gedeckelt)
  - Themenpassung: 100 (3 von 3 Schlüsselwörtern)
  - Region: 90 (MENA + Diaspora)
  - Sicherheit: 100
  
Final: (100 × 0.35) + (100 × 0.30) + (100 × 0.20) + (90 × 0.10) + (100 × 0.05)
      = 35 + 30 + 20 + 9 + 5
      = 99 → PASS! (ausgezeichnete Passform)

Mensch-in-der-Schleife: Obligatorische Genehmigung

Bevor ein Video veröffentlicht wird, geht es zur Teamüberprüfung an Slack:

Slack-Benachrichtigung

🎥 [Pipeline] Bereit zur Überprüfung: Video #47

Titel: "كيف تعلم ابنك حروف العربية بسهولة"
Themenbewertung: 89/100
Erwartete Aufrufe (ML-Modell): 85.000-120.000

[Video-Vorschau] [Transkript anzeigen] [Analyse anzeigen]

Konformitätsstatus: ✅ Bestanden
  - Keine Gewalt: ✓
  - Altersgerecht: ✓
  - Keine IP-Verletzungen: ✓

Aktionen: ✓ Veröffentlichen | 🔄 Überarbeiten | ✗ Ablehnen

Sondertore

  • Quran-Inhalte: Zusätzliche wissenschaftliche Prüfung
  • Neue Trends: Zusätzliche manuelle Prüfung
  • Trends mit hoher Geschwindigkeit: Schnellere Pipeline-Priorität

Ports & Adapters Architektur

Die Pipeline ist so gestaltet, dass Anbieter ausgetauscht werden können, ohne die Geschäftslogik zu ändern:

# src/services/content_generation/interfaces.py
class TextGeneratorInterface:
    def generate_script(self, topic: str, age_group: str) -> str:
        pass

class OpenAIScriptGenerator(TextGeneratorInterface):
    def generate_script(self, topic: str, age_group: str) -> str:
        # Benutze OpenAI API
        pass

class ClaudeScriptGenerator(TextGeneratorInterface):
    def generate_script(self, topic: str, age_group: str) -> str:
        # Benutze Anthropic API
        pass

# Laufzeit, injiziere den richtigen Anbieter
script_generator = ClaudeScriptGenerator()  # Einfach zu wechseln
script = script_generator.generate_script('تعليم العربية', '5-7')

Vorteil: Wenn OpenAI ausfällt, wechsle zu Claude mit einer Konfigurationsänderung.

Ergebnisse

Volumen

  • Eingabe: 50-100 Trendthemen pro Woche
  • Schwellenwert-Durchlaufquote: ~20% (15-20 Trends bestehen das Scoring)
  • Veröffentlicht: ~3-4 Videos pro Woche
  • Jahresausgabe: 150-200 Videos

Leistung (Tatsächliche Daten)

  • Durchschnittliche Aufrufe pro Video: 12.000-45.000
  • Durchschnittliche CTR: 8-12% (Branche: 2-5%)
  • Durchschnittliche Wiedergabezeit: 65-85% der Videolänge (Branche: 40-50%)
  • Konversion (Aufrufe → App-Installationen): 3-5% (Branche: 0,5-1%)

Kosten

  • KI-Generierung pro Video: $3-5 (GPT, DALL-E, ElevenLabs)
  • Menschliche Überprüfung: 15 Min × $25/Stunde = $6,25
  • YouTube-Hosting: Kostenlos
  • Total pro Video: ~$10
  • Kosten pro Installation: ~$2-3 (berechnet aus 3-5% Konversion)

FAQ

Q: Was, wenn ein generiertes Skript ungenau über Arabisch ist? A: Die menschliche Genehmigung fängt dies ab. Wenn das Skript grammatikalische Fehler oder kulturelle Unempfindlichkeiten aufweist, wählt der Prüfer "Überarbeiten" und gibt Anmerkungen an. Die Pipeline regeneriert mit Feedback.

Q: Verstößt dies gegen YouTubes Automatisierungsrichtlinien? A: Nein. Wir haben eine menschliche Überprüfung vor der Veröffentlichung (obligatorisches Slack-Tor). YouTube erlaubt KI-unterstützte Inhalte, solange sie nicht vollständig automatisiert ohne Überwachung sind.

Q: Können KI-generierte Videos gut im Suchranking abschneiden? A: Ja, wenn sie qualitativ hochwertig sind (wie unsere). Der Algorithmus bestraft nicht die KI-Erstellung — er belohnt Wiedergabezeit, CTR und Engagement. Unsere Videos schneiden besser als der Durchschnitt ab.

Verwandte Artikel