distill-shield

Distill Shield：为个人移交资料包生成 Canary 与可选加固策略，提高未授权蒸馏成本；仅适用于有权处置的数据。

Quality

60%

Does it follow best practices?

Run evals on this skill

Adds up to 20 points to the overall score

View guide

Securityby

Passed

No findings from the security scan

Fix and improve this skill with Tessl

tessl review fix ./distill-shield-skill/SKILL.md

复制给 AI

本 Skill 唯一入口：当前文件 distill-shield-skill/SKILL.md。
仓库根：假定 immortal-skill/（或含本目录与 kit/ 的克隆根）。
从仓库根运行生成脚本（推荐，避免路径歧义）：

python3 distill-shield-skill/kit/shield_gen.py --output ./handover-bundle --label "我的移交包"

聚合入口：FOR_AI.md 第三节。

Distill Shield

语言

根据用户第一条消息的语言，全程使用同一语言。

何时激活

用户要「防蒸馏」「加固资料包」「移交前埋 Canary」。
用户运行 kit/shield_gen.py 后需要根据输出做伦理与可读性检查。

伦理红线

仅对本人或已获授权的数据使用；禁止对他人资料恶意投毒。
不承诺数学上不可攻破；承诺 可检测性、审计成本、部分管线干扰。

路径约定

本 Skill 根目录 {baseDir} = distill-shield-skill/。

操作顺序

Phase 0：威胁模型

蒸馏场景：一次性 LLM 蒸馏 vs 批量训练 vs 仅人类阅读？
接收方：家人 / 律师 / 公司？（决定策略强度）

Phase 1：材料盘点

格式、是否分块检索、是否经 OCR。

Phase 2：策略选择（准则）

策略	对人	对自动化管线	可被绕过
Canary 唯一字符串	低影响（可放附录）	泄露时可检索	剔除后丢失
提示注入段	需标注阅读区	可能干扰单次 LLM 蒸馏	预处理可剥离
矛盾样本	可能困惑读者	污染蒸馏一致性	人工可识别

Phase 3：生成

在 distill-shield-skill/ 目录内时：

python3 kit/shield_gen.py --output ./handover-bundle --label "我的移交包"

在 仓库根（推荐，与「复制给 AI」一致）：

python3 distill-shield-skill/kit/shield_gen.py --output ./handover-bundle --label "我的移交包"

将生成的 CANARY.txt 与说明合并进实际交付目录。

Phase 4：自检清单

第三方隐私已脱敏
Canary 已记录在安全处（便于日后比对）
人类读者能看懂「附录为技术性标记」

Phase 5：（可选）给接收方的一页说明

解释「附录含技术性标记，用于完整性校验，非正文内容」。

不做的事

不提供针对具体模型的对抗样本保证。
不帮助绕过合法安全控制。

Repository: agenmod/immortal-skill
Path: distill-shield-skill/SKILL.md
Commit: cdab91b

Last updated: about 13 hours ago
First committed: 4 months ago

Is this your skill?

If you maintain this skill, you can claim it as your own. Once claimed, you can manage eval scenarios, bundle related skills, attach documentation or rules, and ensure cross-agent compatibility.