Zum Hauptinhalt springen

Leistung und Kosten

Verwenden Sie diesen Leitfaden, um Ausgabequalität, Laufzeit und Anbieterausgaben auszubalancieren.

Was die Kosten beeinflusst

Haupttreiber:

  • Anzahl der angeforderten Ausgaben (contentTargets-Zählungen)
  • Modellauswahl für Text- und Bildgenerierung
  • Wiederholungen, die durch vorübergehende Anbieterfehler verursacht werden
  • Höhere Token-Budgets (maxTokens) für lange Ausgaben

Sie können pro-Lauf-Summen in generation.analytics.json inspizieren.

Was die Laufzeit beeinflusst

Haupttreiber:

  • Gesamtausgabeanzahl und Mischung der Inhaltstypen
  • Primärer Inhaltstyp (article-Primär verwendet strukturierten Fluss; Nicht-Artikel-Primär verwendet allgemeinen Fluss)
  • Bildmodellgeschwindigkeit und Wiederholungsverhalten
  • Netzwerklatenz und Anbieter-Backoff-Fenster

Artikelprimäre Läufe führen strukturierte Artikelstufen aus; Nicht-Artikelprimäre Läufe führen allgemeine primäre Stufen aus und rendern dennoch ein primäres Coverbild.

Kostenkontrollmuster

  1. Zuerst mit Trockenlauf validieren:
ideon write --dry-run "Your idea" --primary article=1 --secondary x-thread=1 --secondary x-post=1
  1. Mit weniger Varianten beginnen und dann skalieren:
ideon write "Your idea" --primary article=1 --secondary x-post=1
  1. Verwenden Sie Job-Dateien für wiederholbare Experimente und passen Sie nur eine Variable gleichzeitig an.

  2. Bevorzugen Sie schnellere Modelle während der Exploration und wechseln Sie dann zu qualitätsorientierten Modellen für finale Läufe.

Laufzeitkontrollmuster

  1. Halten Sie contentTargets in frühen Iterationen eng.
  2. Verwenden Sie x-thread nur, wenn die Thread-Struktur wirklich benötigt wird.
  3. Setzen Sie unterbrochene Läufe fort, statt neu zu beginnen:
ideon write resume
  1. Wenn ein Lauf wiederholt bei einer Stufe fehlschlägt, diagnostizieren Sie mit Fehlerbehebung, bevor Sie Zielanzahlen erhöhen.

Praktischer Workflow

  1. Trockenlauf ausführen und Orchestrierung und Ausgaben bestätigen.
  2. Niedrige-Anzahl Live-Generierung ausführen.
  3. Markdown-Qualität und generation.analytics.json inspizieren.
  4. Zählungen erhöhen oder Modelle wechseln.
  5. Die aufgelöste job.json für reproduzierbare zukünftige Läufe speichern.

Verwandte Leitfäden