Leistung und Kosten
Verwenden Sie diesen Leitfaden, um Ausgabequalität, Laufzeit und Anbieterausgaben auszubalancieren.
Was die Kosten beeinflusst
Haupttreiber:
- Anzahl der angeforderten Ausgaben (
contentTargets-Zählungen) - Modellauswahl für Text- und Bildgenerierung
- Wiederholungen, die durch vorübergehende Anbieterfehler verursacht werden
- Höhere Token-Budgets (
maxTokens) für lange Ausgaben
Sie können pro-Lauf-Summen in generation.analytics.json inspizieren.
Was die Laufzeit beeinflusst
Haupttreiber:
- Gesamtausgabeanzahl und Mischung der Inhaltstypen
- Primärer Inhaltstyp (
article-Primär verwendet strukturierten Fluss; Nicht-Artikel-Primär verwendet allgemeinen Fluss) - Bildmodellgeschwindigkeit und Wiederholungsverhalten
- Netzwerklatenz und Anbieter-Backoff-Fenster
Artikelprimäre Läufe führen strukturierte Artikelstufen aus; Nicht-Artikelprimäre Läufe führen allgemeine primäre Stufen aus und rendern dennoch ein primäres Coverbild.
Kostenkontrollmuster
- Zuerst mit Trockenlauf validieren:
ideon write --dry-run "Your idea" --primary article=1 --secondary x-thread=1 --secondary x-post=1
- Mit weniger Varianten beginnen und dann skalieren:
ideon write "Your idea" --primary article=1 --secondary x-post=1
-
Verwenden Sie Job-Dateien für wiederholbare Experimente und passen Sie nur eine Variable gleichzeitig an.
-
Bevorzugen Sie schnellere Modelle während der Exploration und wechseln Sie dann zu qualitätsorientierten Modellen für finale Läufe.
Laufzeitkontrollmuster
- Halten Sie
contentTargetsin frühen Iterationen eng. - Verwenden Sie
x-threadnur, wenn die Thread-Struktur wirklich benötigt wird. - Setzen Sie unterbrochene Läufe fort, statt neu zu beginnen:
ideon write resume
- Wenn ein Lauf wiederholt bei einer Stufe fehlschlägt, diagnostizieren Sie mit Fehlerbehebung, bevor Sie Zielanzahlen erhöhen.
Praktischer Workflow
- Trockenlauf ausführen und Orchestrierung und Ausgaben bestätigen.
- Niedrige-Anzahl Live-Generierung ausführen.
- Markdown-Qualität und
generation.analytics.jsoninspizieren. - Zählungen erhöhen oder Modelle wechseln.
- Die aufgelöste
job.jsonfür reproduzierbare zukünftige Läufe speichern.