新智元 26-05-12 15:19
微博认证:新智元官方微博

北大校友翁荔首次出镜,介绍了Thinking Machines的又一产品——交互模型!

200毫秒神同步,能听懂你的犹豫,更能实时感知协作。AI不再是冷冰冰的回复机器,更是同频呼吸的灵魂队友。OpenAI前高管天团,终于又有新作亮相了。

作为OpenAI前安全负责人、如今Thinking Machines Lab的联合创始人,Lilian Weng献出了她的出镜首秀。

在这段备受瞩目的视频中,她展示了AI如何从一个「只会对话的工具」进化为「能实时协作的伙伴」。

在视频中,Lilian Weng提了一个要求:每听到一次动物的名字,都计数一次。

而且,非常难得的是,即使她在喝水或思考而停止说话时,AI也并没有打断。

最后,当她讲完,AI给出正确答案:鹿出现一次,绵羊一次,郊狼一次,卡皮巴拉一次。

注意,这个交互模型可以隐式地追踪她是在思考、让步、自我纠正还是邀请回应,这个过程中,并没有专门内置的对话管理组件!

此前,这家由前OpenAI CTO Mira Murati创办的明星公司,在0产品、0论文的情况下,就凭借全明星创始团队完成了高达20亿美元的种子轮融资,由a16z领投,英伟达、AMD、微软等巨头跟投,估值直接冲上120亿美元,刷新了硅谷早期融资纪录。

继去年10月发布首个开发者平台Tinker(一个让大模型微调变得像呼吸一样简单的工具)之后,这一次,他们又交出了一份让业界刮目相看的成绩单。

当交互带宽被拉满,AI 就不再是我们的工具,而是我们意识的实时延伸。这或许彻底改变人类与AI互动的方式,取得通往AGI路径上又一次胜利的里程碑!

想象一下,你正在和一位博学的朋友聊天。你话还没说完,只是稍作停顿,在脑海中搜寻一个词,他便敏锐地捕捉到了你的犹豫,轻声给出了那个词。

或者当你正兴奋地描述一个构思时,他眼神微动,在恰当的时机发出一声赞叹。

这种「同频呼吸」的节奏感,是我们作为人类最习以为常、也最珍视的协作体验。

但在过去两年里,尽管AI的智力在指数级增长,我们与它的交互却始终像是在进行一场跨世纪的电邮往来。

无论ChatGPT多么博学,你必须打包好你的思想,点击发送,然后屏息凝神,等待反馈。

这种尴尬的「回合制」(Turn-based)残余,正是阻碍人机真正融合的那层障碍。

除了Lilian Weng展示的无缝对话管理功能之外,这个AI还有以下令人深刻的记忆点。

它会根据上下文按需介入,而不仅仅是在用户说完话之后。

用户和模型可以同时说话,这样就能实现实时翻译这类功能。

令人惊讶的是,这个模型还具有对时间流逝的直接感知。

在与用户对话和聆听的同时,它可以同时进行搜索、浏览网页或生成用户界面,并根据需要将搜索结果融入对话中。

在更长的真实会话中,这些过程都会持续进行,让你感觉更像是在和它合作,而不是在提示它。