umap-learn

UMAP dimensionality reduction. Fast nonlinear manifold learning for 2D/3D visualization, clustering preprocessing (HDBSCAN), supervised/parametric UMAP, for high-dimensional data.

2.11x

Quality

66%

Does it follow best practices?

Impact

89%

2.11x

Average score across 6 eval scenarios

Securityby

Passed

No known issues

Optimize this skill with Tessl

npx tessl skill review --optimize ./scientific-skills/umap-learn/SKILL.md

Evaluation results

95%

60%

Customer Behavioral Segmentation Pipeline

UMAP clustering preprocessing

Criteria

Without context

With context

StandardScaler preprocessing

100%

Clustering n_neighbors

100%

Clustering min_dist=0.0

100%

Clustering n_components 5-10

100%

HDBSCAN algorithm used

100%

Reproducibility seed

100%

Separate 2D visualization UMAP

100%

Cluster statistics reported

100%

Clustering evaluation

100%

45%

Research Paper Discovery and Visualization Tool

Cosine metric for document embeddings

Criteria

Without context

With context

Cosine distance metric

100%

StandardScaler preprocessing

100%

Reproducibility seed

50%

100%

2D visualization output

100%

Fit then transform for queries

100%

Corpus and queries separated before fit

100%

Embedding output saved

100%

Visualization produced

100%

min_dist for visualization

100%

Query neighbor search implemented

100%

51%

Disease Subtype Classification from Genomic Profiles

Semi-supervised UMAP feature extraction

Criteria

Without context

With context

Unlabeled marked as -1

100%

Labels passed to UMAP fit

100%

Unlabeled samples in UMAP fit

40%

100%

StandardScaler preprocessing

100%

n_components for feature engineering

33%

100%

Downstream classifier trained

100%

transform() on test data

100%

Labeled-only classifier training

100%

Reproducibility seed

100%

76%

24%

Multi-Class Flower Species Classification Pipeline

Supervised UMAP with sklearn Pipeline

Criteria

Without context

With context

sklearn Pipeline used

100%

StandardScaler in pipeline

100%

UMAP in pipeline

100%

Labels passed to pipeline fit

66%

100%

target_weight set explicitly

n_components for feature engineering

Reproducibility seed

100%

Train/test split

100%

Pipeline predict on test set

100%

Accuracy reported

100%

target_metric set for classification

100%

90%

62%

Longitudinal Cell Population Trajectory Analysis

AlignedUMAP for temporal datasets

Criteria

Without context

With context

AlignedUMAP import

100%

List of datasets passed to fit

100%

embeddings_ attribute accessed

100%

StandardScaler preprocessing

100%

alignment_regularisation set

Reproducibility seed

100%

Visualization per timepoint

100%

Multiple timepoint datasets

100%

Embeddings output saved

100%

n_components=2 for visualization

100%

73%

35%

High-Density Region Analysis for Single-Cell Proteomics

DensMAP density preservation and inverse transform

Criteria

Without context

With context

densmap=True enabled

100%

output_dens=True set

100%

rad_orig_ accessed

100%

rad_emb_ accessed

100%

inverse_transform called

StandardScaler preprocessing

100%

Reproducibility seed

100%

Density comparison output

50%

100%

dens_lambda set explicitly

Reconstruction error reported

62%

50%

Repository: K-Dense-AI/claude-scientific-skills
Commit: cbcae7b

Evaluated: 2 months ago
Agent: Claude Code
Model: Claude Sonnet 4.6

Table of Contents

Customer Behavioral Segmentation Pipeline Research Paper Discovery and Visualization Tool Disease Subtype Classification from Genomic Profiles Multi-Class Flower Species Classification Pipeline Longitudinal Cell Population Trajectory Analysis High-Density Region Analysis for Single-Cell Proteomics

Is this your skill?

If you maintain this skill, you can claim it as your own. Once claimed, you can manage eval scenarios, bundle related skills, attach documentation or rules, and ensure cross-agent compatibility.