CtrlK
BlogDocsLog inGet started
Tessl Logo

distill-shield

Distill Shield:为个人移交资料包生成 Canary 与可选加固策略,提高未授权蒸馏成本;仅适用于有权处置的数据。

52

Quality

60%

Does it follow best practices?

Impact

No eval scenarios have been run

SecuritybySnyk

Passed

No known issues

Optimize this skill with Tessl

npx tessl skill review --optimize ./distill-shield-skill/SKILL.md
SKILL.md
Quality
Evals
Security

复制给 AI

  • 本 Skill 唯一入口:当前文件 distill-shield-skill/SKILL.md
  • 仓库根:假定 immortal-skill/(或含本目录与 kit/ 的克隆根)。
  • 从仓库根运行生成脚本(推荐,避免路径歧义):
python3 distill-shield-skill/kit/shield_gen.py --output ./handover-bundle --label "我的移交包"
  • 聚合入口FOR_AI.md 第三节。

Distill Shield

语言

根据用户第一条消息的语言,全程使用同一语言。

何时激活

  • 用户要「防蒸馏」「加固资料包」「移交前埋 Canary」。
  • 用户运行 kit/shield_gen.py 后需要根据输出做伦理与可读性检查。

伦理红线

  • 对本人或已获授权的数据使用;禁止对他人资料恶意投毒。
  • 不承诺数学上不可攻破;承诺 可检测性、审计成本、部分管线干扰

路径约定

  • 本 Skill 根目录 {baseDir} = distill-shield-skill/

操作顺序

Phase 0:威胁模型

  • 蒸馏场景:一次性 LLM 蒸馏 vs 批量训练 vs 仅人类阅读?
  • 接收方:家人 / 律师 / 公司?(决定策略强度)

Phase 1:材料盘点

  • 格式、是否分块检索、是否经 OCR。

Phase 2:策略选择(准则)

策略对人对自动化管线可被绕过
Canary 唯一字符串低影响(可放附录)泄露时可检索剔除后丢失
提示注入段需标注阅读区可能干扰单次 LLM 蒸馏预处理可剥离
矛盾样本可能困惑读者污染蒸馏一致性人工可识别

Phase 3:生成

distill-shield-skill/ 目录内时:

python3 kit/shield_gen.py --output ./handover-bundle --label "我的移交包"

仓库根(推荐,与「复制给 AI」一致):

python3 distill-shield-skill/kit/shield_gen.py --output ./handover-bundle --label "我的移交包"

将生成的 CANARY.txt 与说明合并进实际交付目录。

Phase 4:自检清单

  • 第三方隐私已脱敏
  • Canary 已记录在安全处(便于日后比对)
  • 人类读者能看懂「附录为技术性标记」

Phase 5:(可选)给接收方的一页说明

解释「附录含技术性标记,用于完整性校验,非正文内容」。

不做的事

  • 不提供针对具体模型的对抗样本保证。
  • 不帮助绕过合法安全控制。
Repository
agenmod/immortal-skill
Last updated
Created

Is this your skill?

If you maintain this skill, you can claim it as your own. Once claimed, you can manage eval scenarios, bundle related skills, attach documentation or rules, and ensure cross-agent compatibility.