Name: experiments/eval-improve
Author: experiments

experiments/eval-improve

Analyze eval results, diagnose low-scoring criteria, fix tile content, and re-run evals — the full improvement loop automated

Review — 71%

Does it follow best practices?

Evaluation — 100%

↑ 1.02x

Agent success when using this tile

Validation — 11 / 11 Passed

Validation for skill structure

{
  "name": "experiments/eval-improve",
  "version": "0.4.0",
  "summary": "Analyze eval results, diagnose low-scoring criteria, fix tile content, and re-run evals — the full improvement loop automated",
  "private": false,
  "skills": {
    "eval-improve": {
      "path": "skills/eval-improve/SKILL.md"
    }
  }
}

Install with Tessl CLI

npx tessl i experiments/eval-improve@0.4.0

evals

skills

README.md

tile.json