豆包大模型2.0发布实测

我:洗车是腿儿着还是开车? seed2.0:不是你车搁哪呢?

豆包刚刚更新了字节跳动今天发布的新模型 seed-2.0, 赶紧试了下网红问题哈哈哈

回答的很棒, 甚至有种"预判了我的预判"这种感觉.

稍晚点给大家带来 seed-2.0 编程,Agent,长上下文实测~ 之前 seed-1.8 Agent 能力就很猛, 200K上下文跑我那个让AI送外卖的硅基骑手测试, 跑了7个小时(现实世界的7小时啊)送外卖一点也没出现过半场开香槟的问题.

进入到今年Agent能力会越来越重要, 去年AI还在忙于给大家解决"纸面上的问题", 今年感觉就要进入大家的生活了.

我甚至还在刷短视频的时候就看到让豆包帮忙看学生,看宠物的视频哈哈哈, 这种真实世界的场景对普通人来说才是最需要AI的, 想要让AI帮忙跑腿, 帮我擦皮鞋(棒读), 而不是干了我的活让我无活可干(.

seed-2.0 能力的进步才能催化豆包的能力, 让大家在生活中拥有更多的使用场景, 另外我看了眼技术报告, 他们是直接自建benchmark的, 我去年甚至还专门看了他们的一个前端代码评估benchmark, 写得很专业且贴近真实的工程场景. 这样下功夫打磨才能给模型带来真正的质变, 点赞👍.

#HOW I AI##豆包大模型2.0发布#

发布于北京