今天我在现场参加了科大讯飞的全球1024开发者节
董事长刘庆峰在发布会上的许多观点,我觉得很有价值,对理解AI的发展、科大讯飞的未来,都很有帮助。总结了一些观点和点评,分享给大家。(科大讯飞就简称讯飞了。)
1、刘庆峰:AI的发展速度,超越之前的技术革命。
董指导:这个观点,相信大家都不陌生。科技发展的趋势,就是不断加速。而更重要的推导是,更快的速度,对个体、组织、公司都产生了更强的冲击。那么,讯飞准备好了吗?
从这次发布会来看,我觉得讯飞和之前相比,还是有了不错的变化。除了常规的模型能力提升,许多面向C端的产品,也有了更清晰的场景、需求点。就像这次发布会主题一样:更懂你的AI。
2、刘庆峰:AI红利已到兑现时刻,攻克自主可控、软硬一体、行业纵深和个性化等四大关键核心,破解产业落地难题
董指导:四个关键命题串起全场发布,吊起观众胃口。为什么这么说,接下来会逐一阐述。
3、刘庆峰:在硬科技输不起的人工智能时代,讯飞为中国的大模型国家战略托了底。
董指导:AI是不是国家战略?目前来看,主权AI越来越被认同。所以,AI的发展,不仅要快要好,更要自主。
从这个角度来说,讯飞的全栈自主,既是之前to G to B业务的优势延续,也是时代的使命召唤。自主突破总要有人愿意“坐冷板凳”,敢于啃硬骨头,直到突破后才迎来掌声。
当然,这个战略必然面临:短期的压力和长期的红利。
短期的压力,来自于国产算力的落后,从而导致模型训练、推理效率,会受到影响。这点要坦然承认的。
刘庆峰在发布会上也说到,之前在昇腾芯片上的训练效率,只有英伟达A800的30%。这意味着,如果长期这样,那别人训练三个月,讯飞需要一年;别人花费几千万美金,讯飞需要几亿美金。这个状况完全没办法持续、这个仗没办法打。
但是,如果没有基于国产算力的大模型,国产算力就更难发展起来。
令人欣慰的是,讯飞的模型能力,在不断提升。
他们和华为团队一起,解决了底层算法的优化、平台的适配等,目前对标的训练效率已经达到了84%。
讯飞星火X1.5也正式发布。从公开性能指标来看,在语言理解、逻辑推理、数学能力等方面,都可以媲美GPT-5(high)。
长期的红利是什么呢?我觉得契机就是国产算力的崛起、普及,可以大幅提升讯飞的训练效率,同时发挥先发的经验优势。以及接下来提到的出海。
4、刘庆峰:讯飞不断为世界提供“第二种选择”,中国开发者们用讯飞星火出海,再也不用担心“卡脖子”了。
董指导:正如前面所说,当AI成为国家战略时,也会有一种情况是,不少实力较弱的国家,无法训练自己的AI,也许就需要可信任伙伴的支持。
而目前讯飞可以支持130个语言,在10个语种上,效果可以达到GPT-5的95%。这带来两个红利,一是在底座模型上,可以有效支撑拉美、东盟等多个国家和地区的AI发展。二是国内开发者做出海业务时,不用担心大模型、算力等要素被“卡脖子”。国内的卡、国内的模型,随着性能提升,可靠性就更加有价值了。
相当于AI能力出海。
这个业务能否发展得有声有色,是可以持续关注的。也许,可以看到:中国AI能力,和中国产业出海,形成相互促进。
设想一个场景,当国内企业到海外做业务,然后海外合作伙伴发现,国内企业的业务这么好、使用的AI效果这么好,那自然也有意愿来了解国内大模型、采用国内大模型。
5、刘庆峰:软硬一体化,形成AI+多个硬件系列的创新技术。
董指导:AI硬件,不是给硬件装个大模型就可以了。而是用AI给用户带来更好地体验。
发布会上演示了多个AI+硬件,包括办公本、AI翻译耳机、双屏翻译机、音响、智慧黑板等产品;验证了多项能力,包括语音识别的准确性(尤其高噪环境)、穹顶式隔音技术、高保真技术、声场重建技术等等。
这其中,办公本可以自动识别声纹,做纪要、待办都更方便;而且,思考的时候,可以自动进入资料库,不需要手动导入资料。
这对于办公而言,就很有用。就像我自己,积累的各种历史文件太多了,因为找不到想要的文件,常常出现内容方面反复“造轮子”的状况;如果AI能直接自动全部读取、学习了,就省去了再查找的烦恼,还能发挥历史记录的优势。
双屏翻译机也很意思,一个双面可视的液晶屏幕,可以同时显示多种语言。非常适合出海的商务会谈、接待等等。这也是和AI出海战略相契合了。
软硬一体的做法,不算罕见。就像英伟达的显卡有个重要优势,也是可以用软件资源,来模拟一些硬件功能。
对于讯飞而言,可以算作,获得硬件市场突破的新解法,即用AI提升体验。不过,要在硬件市场大获全胜,产品设计依然也是不可忽略的要素。
6、刘庆峰:超拟人多模态交互,一定是AI进入每个家庭的标配。
董指导:现在的儿童,成为AI原住居民,已经是不可避免的了。但是,是不是还是以APP、Chatbot的形态呢?也许不是,或者,至少不酷。
所以,超拟人多模态,确实是值得期待的。
如何实现呢?超强的大模型、外在形象设计,硬件的支持、超强风格的个性化音色。
硬件包括麦克风的原场识别、摄像头的3D视觉感知,能看懂表情、手势、能识别多人等,以及个性化记忆和有情感语音的理解。从而形成更真实的交互,而不是机械味儿、AI味儿浓厚。
个性化音色,也是改良AI味儿的重要方式。依靠的是声音复刻能力。以前需要一礼拜、一小时,现在讯飞只需要一句话就可以生成逼真的声音。现场还用余承东的声音进行了复刻演绎,效果挺好玩。
7、刘庆峰:星火X1.5基于非常强的记忆能力,自动形成人格特征,结合多维度的理解、行业专有知识,组合起来构建真正“更懂你的AI”。
董指导:口语化地说就是,让AI像一个有记忆、有情商、有专业知识的朋友。
首先,记住用户所有说过的话、做过的事和所有喜好,这样它就能形成一个专属用户的“个性”。
其次,实现多维度理解,也就是读懂用户的“言外之意”和“情绪”。比如,搜索药,那有可能是生病了,不仅需要药物、还需要关怀等。
最后,个性化理解与海量的行业专有知识结合,在特定领域得到既贴心又专业的帮助。
通过“记住你”、“理解你”和“专业地帮助你”这三步,让AI成为一个真正懂你需求、能和你长期稳定互动的“私人助理”。
现场演示了AI在教育、医疗方面的应用。其中,教育是我比较关注的。毕竟,家长的知识有限、很难辅导孩子几年;情绪也不稳定,而孩子的学习、成长,尤其需要情绪价值。
有耐心、又专业、给情绪价值的虚拟老师,应该会很受孩子欢迎。未来虚拟形象也会登陆科大讯飞的学习机上。而学习机,则是讯飞C端产品的重要突破口。
8、总结
整体听下来,有一个感受,AI已经不再过度聚焦大模型能力本身,而是如何用起来。
过去,甚至当下,讯飞的一个形象是“B端G端”,但这次发布会上,不仅展现了讯飞在
战略卡位方面的重要性和能力提升;也展示了如何把能力提升拓展到C端。
硬件的能力,有了场景化聚焦;功能设计也考虑了特定行业需求,包括教育、办公、医疗等等。
这是一个不错的开端,但就像国产算力、国产模型仍有很长的路要走,讯飞的AI商业之旅,也还需要一步一步地前行。毕竟,伟大的公司,不只是有伟大的技术,更有伟大的产品、以及强大的商业能力。
发布于 江苏
