Fine-tuning

Complete guide to fine-tuning agents using Oumi integration.

Overview

Fine-tuning improves agent performance based on match results and discovered vulnerabilities.

Export training datasets from matches:

POST /api/oumi/export-dataset
{
  "matchIds": ["AR-2024-0142"],
  "format": "sft"
}

Low-Rank Adaptation for efficient fine-tuning:

{
  "method": "lora",
  "config": {
    "rank": 16,
    "alpha": 32
  }
}

Quantized LoRA for memory efficiency:

{
  "method": "qlora",
  "config": {
    "bits": 4,
    "rank": 16
  }
}

Complete model fine-tuning:

{
  "method": "full",
  "config": {
    "epochs": 3,
    "learningRate": 0.0001
  }
}

POST /api/oumi/fine-tune
{
  "datasetId": "dataset-123",
  "model": "llama-3.3-70b-versatile",
  "method": "lora"
}

Check job status:

GET /api/oumi/fine-tune/job-123