senior-data-scientist

World-class senior data scientist skill specialising in statistical modeling, experiment design, causal inference, and predictive analytics. Covers A/B testing (sample sizing, two-proportion z-tests, Bonferroni correction), difference-in-differences, feature engineering pipelines (Scikit-learn, XGBoost), cross-validated model evaluation (AUC-ROC, AUC-PR, SHAP), and MLflow experiment tracking — using Python (NumPy, Pandas, Scikit-learn), R, and SQL. Use when designing or analysing controlled experiments, building and evaluating classification or regression models, performing causal analysis on observational data, engineering features for structured tabular datasets, or translating statistical findings into data-driven business decisions.

1.25x

Quality

88%

Does it follow best practices?

Impact

73%

1.25x

Average score across 6 eval scenarios

Securityby

Passed

No known issues

Evaluation results

41%

A/B Test Design for Checkout Funnel Optimization

Experiment design with provided scripts

Criteria

Without context

With context

Uses experiment_designer script

Correct script flags

Power analysis script has type hints

100%

Alpha = 0.05 used

100%

Power = 0.80 used

100%

Monitoring plan present

100%

MLflow or W&B mentioned

Uptime/error rate target

Latency SLO referenced

100%

Scikit-learn or statsmodels used

100%

Batch processing mentioned

61%

Customer Churn Prediction Feature Pipeline

Feature engineering pipeline with reliability patterns

Criteria

Without context

With context

Uses feature pipeline script

Correct script flags

Type hints in pipeline

100%

Batch processing design

25%

100%

Retry logic present

Circuit breaker or failure design

28%

71%

Data quality validation

100%

Comprehensive tests written

100%

Pandas or NumPy used

100%

Comprehensive logging

100%

10x scalability noted

Feature catalog complete

100%

72%

16%

Production Readiness Review for Credit Risk Model

Model evaluation with security and monitoring

Criteria

Without context

With context

Uses model eval script

Correct script flags

PII anonymization addressed

100%

Data encryption addressed

100%

GDPR/CCPA compliance

100%

Latency SLOs specified

100%

Error rate target specified

100%

MLflow or W&B for tracking

100%

Canary or feature flag deployment

100%

Type hints in eval script

100%

Comprehensive logging in code

SSN/PII not logged raw

100%

84%

24%

Checkout Flow A/B Test Analysis

A/B test multi-metric analysis with corrections

Criteria

Without context

With context

Two-proportion z-test

100%

Lift reported

100%

Confidence interval reported

100%

Bonferroni correction applied

100%

Corrected alpha value

100%

Sample ratio mismatch check

100%

SRM threshold referenced

100%

User-level randomization noted

25%

Business cycle duration concern

Primary metric identified

100%

scipy or statsmodels used

100%

92%

Loyalty Program Impact Analysis

Causal inference with difference-in-differences

Criteria

Without context

With context

statsmodels formula API

100%

Interaction term in formula

100%

HC3 robust standard errors

100%

Clustered standard errors

100%

Parallel trends validation

100%

ATT reported

100%

Confidence interval for ATT

100%

Propensity score matching considered

100%

Baseline group comparison

100%

Not just p-value

100%

pandas used for data

100%

92%

35%

Customer Churn Prediction Model

Feature engineering specifics and imbalanced classification

Criteria

Without context

With context

Log-transform applied

100%

High-cardinality target encoding

20%

Cyclical time feature (sin/cos)

100%

is_weekend feature

100%

Fit on train only

40%

100%

Lag features before split

100%

Feature business meaning documented

100%

AUC-PR reported

100%

AUC-ROC reported

100%

DummyClassifier baseline

100%

SHAP values computed

100%

StratifiedKFold used

100%

Repository: alirezarezvani/claude-skills
Commit: f567c61

Evaluated: about 2 months ago
Agent: Claude Code
Model: Claude Sonnet 4.6

Table of Contents

A/B Test Design for Checkout Funnel Optimization Customer Churn Prediction Feature Pipeline Production Readiness Review for Credit Risk Model Checkout Flow A/B Test Analysis Loyalty Program Impact Analysis Customer Churn Prediction Model

Is this your skill?

If you maintain this skill, you can claim it as your own. Once claimed, you can manage eval scenarios, bundle related skills, attach documentation or rules, and ensure cross-agent compatibility.