Name: experiments/eval-improve
Rating: 0.94 (1 reviews)
Author: experiments

experiments/eval-improve

Analyze eval results, diagnose low-scoring criteria, fix tile content, and re-run evals — the full improvement loop automated

1.02x

Review — 90%

Does it follow best practices?

Validation — 11 / 11 Passed

Validation for skill structure

{
  "name": "experiments/eval-improve",
  "version": "0.5.0",
  "summary": "Analyze eval results, diagnose low-scoring criteria, fix tile content, and re-run evals — the full improvement loop automated",
  "private": false,
  "skills": {
    "eval-improve": {
      "path": "skills/eval-improve/SKILL.md"
    }
  }
}

Install with Tessl CLI

npx tessl i experiments/eval-improve

evals

skills

README.md

tile.json