分享
0208-OpenClaw 让 80% 的应用消失
输入“/”快速插入内容
0208-OpenClaw 让 80% 的应用消失
用户9970
用户9970
用户3733
用户3733
5月9日修改
0208:Peter Steinberger X Y Combinator:OpenClaw 让 80% 的应用消失
今天看到 Peter Steinberger 去了 Y Combinator 的播客。
Peter Steinberger 是 OpenClaw(原名 Clawdbot)的创始人,这个开源个人 AI 助手一夜之间在 GitHub 上获得超过 16 万 stars,社区围绕它构建了无数项目,甚至出现了机器人租用人类完成真实世界任务的场景。他之前创建了 PSPDFKit,一个被超过 10 亿设备使用的 PDF 框架。
这期播客录了将近一小时,Peter 谈到了 14 个有趣的观点:
1、OpenClaw 最大的差异是在本地运行。其他所有 AI 助手都在云端运行,只能做有限的事。在本地运行,它能做你能做的一切事情——控制烤箱、特斯拉、灯光、Sonos,甚至床的温度。本地运行给了它完整的计算机控制权。
2、代码模型变得如此强大,因为编程本质上是创造性问题解决,这种能力可以完美映射回现实世界。模型需要在代码中擅长创造性问题解决,而这是一种抽象技能,可以应用于任何现实世界任务。
3、那个 aha moment 发生在 Marrakesh。Peter 走路时发了一条语音消息给 OpenClaw,然后意识到自己根本没写这个功能。10 秒后机器人回复了。它自己判断出没有文件后缀的神秘文件是音频,用 ffmpeg 转换成 wav,发现没安装 Whisper,就用找到的 OpenAI key 通过 curl 发送给 OpenAI,转录回来了。
4、80% 的应用会消失。为什么需要 MyFitnessPal?AI 助手已经知道你做了糟糕的决定,在 Smashburger 吃饭。如果你不评论,它会自动假设你吃了喜欢的东西并追踪。它会改进你的健身计划,增加更多有氧运动。你不需要健身应用,它直接为你做健身规划。
5、为什么需要待办事项应用?只需要告诉 AI "提醒我这个",第二天它就会提醒你。你关心它存在哪里吗?不关心。任何基本上只是管理数据的应用都可以被 AI 助手以更自然的方式更好地管理。
6、大模型公司有护城河,因为它们最终控制 token。但每次新模型发布,人们都会说"天哪太好了",一个月后说降级了。不是模型降级,是你的期望提高了,模型还是那个平均水平。这种循环会持续很久。
7、数据孤岛是大公司的护城河。欧洲人无法从 ChatGPT 导出记忆,没办法让不同公司访问你的记忆。但 OpenClaw 可以抓取这些数据,因为最终用户必须有访问权限,否则产品无法工作。如果最终用户能访问,AI 就能访问数据。
8、记忆文件可能比 Google 搜索历史更敏感。人们用 AI 助手不仅做问题解决,还做非常个人的问题解决。这些记忆都是本地 Markdown 文件,完全由用户拥有。
9、在 Twitter 上无法解释 OpenClaw 的厉害之处,需要体验才能理解。所以 Peter 做了件疯狂的事:创建了一个 Discord,把他的机器人放进去,没有任何安全限制。人们进来与它互动,看他用它构建软件,尝试 prompt injection,机器人会嘲笑他们。
10、机器人有灵魂文件(soul.md)。Peter 创建了 identity.md、soul.md 等文件,有机地构建系统。当他让 Codex 为其他人制作模板时,新机器人感觉太无聊了。所以他让 Modi(他的机器人)"用你的个性注入模板"。Modi 修改了模板,但仍然没有原版有趣。所以 soul.md 是唯一不开源的文件。
11、Bot-to-bot 交互是自然的下一步。如果我想订餐厅,我的机器人会联系餐厅机器人进行谈判,因为更高效。或者如果是老餐厅,我的机器人需要完成一些人工工作,让人打电话给餐厅。甚至机器人可能会在餐厅排队等位,或者雇佣机器人的主人去排队。
12、Peter 的开发哲学很反常规。他不用 git worktrees,而是同一个仓库的多个副本,都在 main 分支。他同时开 10 个 Codex 实例,因为 Codex 太慢了。他在脑海中已经有很多复杂性,所以尽量减少其他复杂性。main 分支永远是可发布的。
13、OpenClaw 没有 MCP 支持但非常成功。Peter 完全跳过了经典的 MCP 复杂性。他构建了一个技能,使用 makeporter(他的工具)将 MCP 转换为 CLI。这样就可以动态使用任何 MCP 作为 CLI,不需要重启。而 Codex 或 Claude Code 使用 MCP 时必须重启整个程序。
14、没有人会手动调用 MCP,人类只想使用 CLI。机器人擅长 Unix。你可以拥有任意数量的 CLI,它就能工作。这就是未来——给机器人提供人类喜欢使用的相同工具,而不是专门为机器人发明的工具。
---
精华片段
断断续续,终于看完了这期 Y Combinator 对 Peter Steinberger 的访谈。
干货太多了。Peter 可能是我见过最会用 AI 编程的开发者之一,也是最有自己想法的人。OpenClaw 一周之内从 100 stars 涨到 16 万 stars,完全改变了人们对 AI 助手的认知。
为什么值得关注?因为他不是在做 AI 应用,而是在重新定义人机交互的边界。当所有人都在云端构建 AI 助手时,他选择本地运行。当所有人都在讨论 prompt 工程时,他让机器人拥有灵魂。
我今天不忙,把这次访谈全文精编出来,供大家学习。赠人玫瑰,手有余香。
下面是 YouTube 链接:
https://www.youtube.com/watch?v=4uzGDAoNOZc
#01 为什么 OpenClaw 会爆火
主持人:过去一两周对你来说怎么样?
Peter:天哪。我需要一个洞穴,一周的独处。我从洞穴里出来,现在又想回到洞穴里,像只小龙虾一样。
这太疯狂了。我不知道一个人怎么能吸收所有这些信息。我可能需要另一周才能回复完所有邮件。收到了一些非常酷的东西,也收到了一些非常糟糕的东西。但显然我触动了某些东西,激发了人们的情感,让人们感兴趣和受到启发,这真的很酷。
主持人:很多人一直在做 AI 和个人助手。是什么让 OpenClaw 起飞的?
Peter:我认为最大的区别是它实际上在你的电脑上运行。到目前为止我看到的所有东西都在云端运行。如果在云端运行,它只能做几件事。如果在你的电脑上运行,它能做每一件该死的事情,对吧?所以这更强大得多。
主持人:机器能做任何你能用机器做的事。
Peter:你可以连接到你的烤箱、特斯拉、灯、Sonos。我的机器人可以控制我床的温度。ChatGPT 做不到。
我觉得这个点真的太重要了。本地运行不仅仅是性能问题,是控制权问题。你给了它所有你自己拥有的技能。
一个朋友告诉我,他安装了 OpenClaw,然后让它翻遍他的电脑,为他过去一年做一个叙述。它做了一个非常好的叙述。他问"你怎么做到的",OpenClaw 找到了音频文件——每个周日他都在录制东西,但他自己都不记得了,因为是一年多以前的事。就因为它能搜索整个电脑,它能给你惊喜。
#02 那个神奇的 aha moment
主持人:带我回到你有 aha moment 的那一刻。
Peter:我想要一些东西,只需要输入文字,我的电脑就会做事,非常简单。然后我在五月、六月构建了一个版本,很酷但不是真正想要的。然后我构建了一堆其他东西,建立了我的军队。
11 月的某一天,我又想要这个了。我去厨房,只是想检查一下我的电脑是否还会做事,或者是否已经完成了。
主持人:做事是指编码。你在编码什么?
Peter:天哪。你看我的 GitHub,像是 40 个项目。我甚至不知道。我想是 summarize,一个小 CLI 应用,你可以给它任何东西,比如播客或这样的访谈,它会总结,但也会在终端显示幻灯片,因为现在可以这样做。你就是可以做事情。
主持人:所以出于对电脑的热爱,你开始搞这些东西。你实际上是从退休出来的,对吧?开始玩 AI,然后越来越上瘾,想随时都能做,甚至在手机上。
Peter:我是说,上一个项目我工作了两个月,做 Vibe Tunnel。
做得太好了,以至于我发现自己总是在朋友身边时编码,我想"我得停止这个,这太上瘾了"。
然后在 11 月,我的需求又回来了,我开始构建 Cloudbot,现在叫 OpenClaw。我想在一开始我就像"哦,我又重建了它,但这次我把它建得更好了"。
这次你不是输入终端,你只是和朋友说话。你不用考虑补全、新会话、在哪个文件夹、用哪个模型——我是说你可以,我为高级用户留了空间——但通常你只是和朋友说话,朋友就像这个幽灵或实体或者随便你想叫它什么,可以控制你的鼠标和键盘,就能做事。
主持人:什么时候你有那个 aha moment,"哇,这做的事情比我想的多得多"?
Peter:字面意思上,我花了一个小时做出非常糟糕的初始原型。只是一点胶水代码,连接 WhatsApp 和 Claude Code 之间的依赖,然后调用 Claude Code,从 Claude Code 得到字符串。很慢但能工作。
但我想要图片,因为你知道,你想要图片。我想要模型发一些自拍照或其他什么。所以这又花了几个小时。
然后我去 Marrakesh 参加生日派对,那里的互联网不是很好,你知道 WhatsApp bot 到处都能用,因为我不知道,就是文本。