distributed-training-setup

Distributed Training Setup - Auto-activating skill for ML Training. Triggers on: distributed training setup, distributed training setup Part of the ML Training skill category.

0.97x

Quality

Does it follow best practices?

Impact

93%

0.97x

Average score across 3 eval scenarios

Securityby

Passed

No known issues

Optimize this skill with Tessl

npx tessl skill review --optimize ./planned-skills/generated/07-ml-training/distributed-training-setup/SKILL.md

Evaluation results

93%

-7%

Scaling a PyTorch Image Classifier to Multiple GPUs

PyTorch DDP best practices

Criteria

Without context

With context

Process group init

100%

Backend selection

100%

DDP model wrapping

100%

Rank/world_size from env

100%

62%

Distributed sampler

100%

Rank-0 only output

100%

Process group cleanup

100%

75%

torchrun compatible

100%

Step-by-step launch guide

100%

66%

Validation output present

100%

No large file downloads

100%

Device placement

100%

87%

Multi-GPU Training Acceleration for a TensorFlow NLP Model

TensorFlow distributed strategy

Criteria

Without context

With context

Distribution strategy used

100%

Model inside strategy scope

100%

Global batch size scaling

100%

80%

Config file present

75%

100%

Config consistency

50%

100%

No large downloads

100%

Validation output present

100%

Step-by-step structure

100%

Production error handling

100%

62%

Pip-installable deps

100%

Checkpoint or save

100%

Setting Up a Reproducible Distributed ML Training Pipeline

Full ML pipeline with experiment tracking

Criteria

Without context

With context

Data prep module

100%

Distributed training used

100%

Imports data_prep

100%

Hyperparameter config

100%

Config loaded in training

100%

Experiment tracking

100%

Experiment log written

100%

Reproducibility info

100%

Validation run captured

100%

Synthetic data only

100%

Step-by-step structure

100%

Large file cleanup

100%

Repository: jeremylongshore/claude-code-plugins-plus-skills
Commit: 3076d78

Evaluated: about 2 months ago
Agent: Claude Code
Model: Claude Sonnet 4.6

Table of Contents

Scaling a PyTorch Image Classifier to Multiple GPUs Multi-GPU Training Acceleration for a TensorFlow NLP Model Setting Up a Reproducible Distributed ML Training Pipeline

Is this your skill?

If you maintain this skill, you can claim it as your own. Once claimed, you can manage eval scenarios, bundle related skills, attach documentation or rules, and ensure cross-agent compatibility.