Name: tessl-labs/eval-setup
Rating: 90.1 (1 reviews)
Author: tessl-labs

tessl-labs/eval-setup

Generate eval scenarios from repo commits, configure multi-agent runs, execute baseline + with-context evals, and compare results — the full setup pipeline before improvement begins

3.37x

Quality

90%

Does it follow best practices?

Impact

91%

3.37x

Average score across 2 eval scenarios

Securityby

Advisory

Suggest reviewing before use

Evaluation results

79%

50%

Scenario 1

Criteria

Without context

With context

checks_prerequisites

50%

100%

browses_commits

16%

auto_detects_context_files

100%

uses_context_flag

50%

100%

workspace_in_eval_run

100%

explains_baseline_vs_context

100%

95%

70%

Scenario 2

Criteria

Without context

With context

does_not_use_last_only

100%

finds_generation_ids

75%

100%

downloads_each_separately

33%

100%

explains_why

75%

Evaluated: about 1 month ago
Agent: Claude Code
Model: Claude Sonnet 4.6

Table of Contents

Scenario 1 Scenario 2