stable-baselines3

Production-ready reinforcement learning algorithms (PPO, SAC, DQN, TD3, DDPG, A2C) with scikit-learn-like API. Use for standard RL experiments, quick prototyping, and well-documented algorithm implementations. Best for single-agent RL with Gymnasium environments. For high-performance parallel training, multi-agent systems, or custom vectorized environments, use pufferlib instead.

1.07x

Quality

86%

Does it follow best practices?

Impact

95%

1.07x

Average score across 6 eval scenarios

Securityby

Passed

No known issues

No security issues found

Scanned 2 months ago

Repository: K-Dense-AI/claude-scientific-skills
Commit: 75c41d7

Audited: 2 months ago
Security analysis

Is this your skill?

If you maintain this skill, you can claim it as your own. Once claimed, you can manage eval scenarios, bundle related skills, attach documentation or rules, and ensure cross-agent compatibility.