deduplication

Event deduplication with canonical selection, reputation scoring, and hash-based grouping for multi-source data aggregation. Handles both ID-based and content-based deduplication.

1.58x

Quality

66%

Does it follow best practices?

Impact

98%

1.58x

Average score across 3 eval scenarios

Securityby

Advisory

Suggest reviewing before use

Optimize this skill with Tessl

npx tessl skill review --optimize ./skills/data-access/deduplication-dadbodgeoff-drift/SKILL.md

Evaluation results

100%

62%

Multi-Source News Aggregation Pipeline

Content-based dedup with canonical selection

Criteria

Without context

With context

Semantic dedup key

50%

100%

Title normalization

100%

Title length limit

100%

Tiered reputation scoring

100%

Canonical uses reputation + tone

30%

100%

Source attribution

75%

100%

DeduplicationResult interface

100%

duplicateGroups in result

100%

Dedup log output

100%

No URL-only dedup

100%

Groups by content similarity

100%

reductionPercent calculation

100%

96%

48%

Event Pipeline Deduplication Module

ID-based dedup with preferFn and metrics

Criteria

Without context

With context

Map-based ID dedup

100%

preferFn callback pattern

100%

MD5 URL hash for ID

100%

12-char hex ID

100%

DeduplicationResult fields

100%

reductionPercent rounded

100%

Dedup log output

50%

preferFn used in demo

100%

Best version kept

100%

Output file written

33%

100%

Configurable Content Deduplication Engine

Configurable reputation scoring and normalization

Criteria

Without context

With context

Configurable tier lists

100%

At least 3 reputation tiers

100%

Default fallback score

100%

Lowercase normalization

100%

Punctuation removal

100%

Score-based canonical selection

100%

No random selection

100%

Config externalized

100%

Custom tiers applied

100%

Result written to file

100%

Repository: majiayu000/claude-skill-registry
Commit: d156cd1

Evaluated: about 2 months ago
Agent: Claude Code
Model: Claude Sonnet 4.6

Table of Contents

Multi-Source News Aggregation Pipeline Event Pipeline Deduplication Module Configurable Content Deduplication Engine

Is this your skill?

If you maintain this skill, you can claim it as your own. Once claimed, you can manage eval scenarios, bundle related skills, attach documentation or rules, and ensure cross-agent compatibility.