“克隆版”开源AI编码代理ClawCode:开源社区如何48小时跑赢DMCA
Anthropic的Claude Code源码意外泄露后,社区在一天内完成了所谓的“干净室重写”ClawCode,但这个重写是否真正合法,本身就是个悬而未决的问题。100k GitHub星标、DMCA下架、版权争议,事情比看上去复杂得多。
前两天,Anthropic在一次npm包更新中犯了个低级错误:调试文件没删干净,51万行TypeScript源码就这样跟着包一起出了门。等他们反应过来开始发DMCA下架通知,代码早已传遍GitHub。
有意思的部分从这里才开始。
一个叫Sigrid Jin的韩国开发者(之前因过度使用Claude Code被《华尔街日报》点名报道)在代码泄露后用了大概一个晚上,做出了ClawCode,宣称是“干净室重写”。不是复制泄露代码,而是基于架构重新实现,先Python后Rust。仓库在24小时内冲到了10万stars。
这个速度本身就足够可疑。有观点认为这些stars大量来自“看热闹的人”,不是真正的竞争工程师,AI领域虽然过热,但真的没有10万个agent工程师在追这个仓库。也有人反驳说,很多账号创建于2015年,不太像机器人,更可能是Claude Code泄露进入新闻周期后带来的真实流量。也许两者都有。
“干净室重写”这个说法本身有没有法律效力,社区吵得很凶。经典的干净室实现需要:一个“脏团队”看代码写功能规格说明,再把规格交给从未见过原代码的“干净团队”去实现,两个团队完全隔离。这样版权保护的是具体代码,不是功能思想,新实现就合法了。
有网友提到,今天完全可以用AI来做这件事:一个代理会话分析原码写规格,另一个会话只看规格来写实现。但前提是每一步都要有密码学级别的不可篡改日志、版本控制证明、时间戳审核记录。ClawCode显然没来得及做这些,“在提示词里说了要干净室实现”,充其量是“相信我”。
还有一个角度让整件事更混乱:Anthropic自己说过,他们几乎100%的代码已经是AI写的。有观点认为,AI生成的代码在美国版权法下无法受到版权保护,那这些代码严格来说应当属于公共领域。不过即便如此,商业秘密的保护还在,泄露行为本身不因此合法化,只是让版权这条路堵死了。
ClawCode的仓库后来被锁,但ZIP镜像、Python版、Rust版已经传开了。有人做了桌面仪表板产品,有人做了移动端,Solana上甚至出现了$ClawCode代币。
最值得关注的,也许不是某个具体仓库能活多久,而是有网友说的:与其争第一个做出来,不如真正把这个架构拆清楚,写成可以学习的东西。agent harness的持久执行循环、工具调用模式、跨文件理解能力,这些才是ClawCode事件留下的真正遗产。
到底谁有资格把泄露的架构思路付诸实现,法院还没说过话。
Anthropic的Claude Code源码意外泄露后,社区在一天内完成了所谓的“干净室重写”ClawCode,但这个重写是否真正合法,本身就是个悬而未决的问题。100k GitHub星标、DMCA下架、版权争议,事情比看上去复杂得多。
前两天,Anthropic在一次npm包更新中犯了个低级错误:调试文件没删干净,51万行TypeScript源码就这样跟着包一起出了门。等他们反应过来开始发DMCA下架通知,代码早已传遍GitHub。
有意思的部分从这里才开始。
一个叫Sigrid Jin的韩国开发者(之前因过度使用Claude Code被《华尔街日报》点名报道)在代码泄露后用了大概一个晚上,做出了ClawCode,宣称是“干净室重写”。不是复制泄露代码,而是基于架构重新实现,先Python后Rust。仓库在24小时内冲到了10万stars。
这个速度本身就足够可疑。有观点认为这些stars大量来自“看热闹的人”,不是真正的竞争工程师,AI领域虽然过热,但真的没有10万个agent工程师在追这个仓库。也有人反驳说,很多账号创建于2015年,不太像机器人,更可能是Claude Code泄露进入新闻周期后带来的真实流量。也许两者都有。
“干净室重写”这个说法本身有没有法律效力,社区吵得很凶。经典的干净室实现需要:一个“脏团队”看代码写功能规格说明,再把规格交给从未见过原代码的“干净团队”去实现,两个团队完全隔离。这样版权保护的是具体代码,不是功能思想,新实现就合法了。
有网友提到,今天完全可以用AI来做这件事:一个代理会话分析原码写规格,另一个会话只看规格来写实现。但前提是每一步都要有密码学级别的不可篡改日志、版本控制证明、时间戳审核记录。ClawCode显然没来得及做这些,“在提示词里说了要干净室实现”,充其量是“相信我”。
还有一个角度让整件事更混乱:Anthropic自己说过,他们几乎100%的代码已经是AI写的。有观点认为,AI生成的代码在美国版权法下无法受到版权保护,那这些代码严格来说应当属于公共领域。不过即便如此,商业秘密的保护还在,泄露行为本身不因此合法化,只是让版权这条路堵死了。
ClawCode的仓库后来被锁,但ZIP镜像、Python版、Rust版已经传开了。有人做了桌面仪表板产品,有人做了移动端,Solana上甚至出现了$ClawCode代币。
最值得关注的,也许不是某个具体仓库能活多久,而是有网友说的:与其争第一个做出来,不如真正把这个架构拆清楚,写成可以学习的东西。agent harness的持久执行循环、工具调用模式、跨文件理解能力,这些才是ClawCode事件留下的真正遗产。
到底谁有资格把泄露的架构思路付诸实现,法院还没说过话。