#豆包大模型2.0发布#
在Seedance 2.0和Seedream 5.0 Lite,一波接一波爆火之后,豆包把完全体拿出来了——豆包大模型2.0。
这是时隔21个月以来的最大版本的更新。
像Seedance 2.0已经成为全民玩转的AI,我们也试着做了一个视频:【图1】。
短短5秒钟,效果确实是足够逼真。
也难怪老外也开始研究怎么注册中国手机号来体验了……【图2】
再如Seedream 5.0 Lite,首次支持联网检索,生成的图片也达到了商业化的水平:【图3】。
而就在今天,在视觉模型火爆之后,豆包终于把那个最核心的大脑拿出来了——豆包大模型2.0。
整体来看,这次豆包大模型2.0在多模态理解、企业级Agent、推理和代码能力上都有了不少的提升:
- 更强多模态理解:在多模态感知、高精度文字提取、图表理解、空间理解、运动理解、视觉知识和推理、长视频理解等方面表现出色。
- 企业级Agent能力:模型能更好支持对技能(Skills)的理解和应用,Function Call 、多轮指令遵循、搜索和工具调用能力显著增强,格式输出更稳定,支持灵活的上下文管理,更好地支持企业级复杂、长程任务,在数据分析和客服Agent等企业场景中表现出色。
- 数学和代码推理能力:模型具备更强推理能力,支持思考长度可调节,且各思考长度下,Tokens效率都有大幅提升。在ICPC、IMO、CMO测试中均获得金牌成绩。
更直观的提升,体现在榜单测评中。
例如在MathVista、MathVision、MathKangaroo、MathCanvas等数学推理基准上达到业界最优水平。同时,在 LogicVista、VisuLogic等视觉解谜与逻辑推理基准上,Seed2.0 Pro得分较Seed1.8显著提升。【图3】
并且在VLMsAreBiased、VLMsAreBlind、BabyVision等基准中,豆包大模型2.0取得了业界最高分!【图4】
那么接下来,还是老规矩,一波实测,走起~http://t.cn/AXtcbqek
