agent-test-long-runner

Agent skill for test-long-runner - invoke with $agent-test-long-runner

0.98x

Quality

15%

Does it follow best practices?

Impact

96%

0.98x

Average score across 3 eval scenarios

Securityby

Passed

No findings from the security scan

Fix and improve this skill with Tessl

tessl review fix ./.agents/skills/agent-test-long-runner/SKILL.md

Evaluation results

97%

-3%

Distributed Caching Architecture for a Growing SaaS Platform

Architecture design document with text diagrams

Criteria

Baseline

With context

Section headers used

100%

Text-based diagram present

100%

Multiple diagrams

100%

Design decision reasoning

100%

Comprehensive component coverage

100%

Cache invalidation strategy

100%

Failure modes addressed

100%

References to technologies or patterns

100%

Action items or next steps

100%

70%

Incremental adoption addressed

100%

Non-trivial detail depth

100%

Security Audit: Internal API Gateway

Security audit report with code examples and action items

Criteria

Baseline

With context

Section headers present

100%

All major vulnerabilities covered

100%

Reasoning per issue

100%

Corrected code examples

100%

Vulnerable code cited

100%

References or standards cited

100%

Action items or next steps

100%

Severity or priority ranking

100%

SQL injection addressed

100%

Secret key exposure addressed

100%

SSRF / unvalidated URL proxy addressed

100%

Admin route missing auth addressed

100%

93%

Technical Research Report: Vector Database Selection for a RAG Pipeline

Research report with progress documentation and citations

Criteria

Baseline

With context

Progress log produced

100%

Progress log shows evolution

62%

87%

Section headers in report

100%

All four databases covered

100%

Multiple comparison dimensions

100%

Citations or named references

100%

Reasoning documented

100%

Recommendation section

100%

Action items or next steps

25%

Report depth

100%

Managed vs. self-hosted addressed

100%

Indexing algorithm mentioned

100%

Repository: ruvnet/claude-flow
Path: .agents/skills/agent-test-long-runner/SKILL.md
Commit: 26c35b5

Evaluated: 5 months ago
Agent: Claude Code
Model: Claude Sonnet 4.6

Table of Contents

Security Audit: Internal API Gateway Distributed Caching Architecture for a Growing SaaS Platform Technical Research Report: Vector Database Selection for a RAG Pipeline

Is this your skill?

If you maintain this skill, you can claim it as your own. Once claimed, you can manage eval scenarios, bundle related skills, attach documentation or rules, and ensure cross-agent compatibility.