看完讯飞星火发布会后,我看到了国产大模型的未来(上)
摘自 雷科技 雷科技
讯飞董事长刘庆峰表示:“我们要向OpenAI致敬和学习,同时也要快速追赶并努力超越,而这需要一套科学系统的评测体系“。
正因如此,作为人工智能“国家队”之一,科大讯飞通过认知智能全国重点实验室牵头设计了通用认知大模型评测体系,并与中科院人工智能产学研创新联盟和长三角人工智能产业链联盟共同探讨形成了覆盖7大类481个细分任务类型。在科学的评测体系中,推动大模型的发展。
至于讯飞“星火”能做什么?
和目前市面上已知的通用大模型一样,讯飞“星火”具有和人类进行自然对话的能力,能够结合上下文语境,流畅准确地回答各类问题,还具备超长文本理解能力,可以从复杂文档中提取和概括信息,在理解需求的情况下完成各种任务,诸如机器翻译、吟诗作词、逻辑推算、文案创作等。
在发布会现场,讯飞研究院院长刘聪特地进行了功能的展示。值得一提的是,这些演示并非录播,而是国内少有的全程真机互动、现场实测。
首先是讯飞“星火”的文学创作能力,刘庆峰连续对讯飞“星火”提出了包括自我介绍、编写故事在内的若干问题,就好比“孙悟空和奥特曼也偷偷潜入了会场,他们都争着想做讯飞星火认知大模型的代言人,还为此吵了一架,请根据上述信息创作一个故事。”
至于回答嘛,别说,还挺像样的。
讯飞还能用它生成今天发布会的欢迎语、新闻稿,可以说是把人工智能从头用到脚,很符合“人工智能国家队”的定位。
再来看看逻辑方面,尽管偶有出错,但是讯飞“星火”能够迅速更正过来,还是很有意思的。
讯飞最后甚至放出了二维码,现场收集观众问题进行答复,可见他们对于讯飞“星火”的信心。
从现场体验来看,讯飞“星火”总体表现可圈可点。在日常应用以及学习工作中,“星火”的表现十分稳定,应对不少逻辑问题都能给出准确的答复,使用语音输入进行交互的特性,搭配独有的“图片内容翻译”功能,更是充分发挥了科大讯飞的特长。
按照通用认知大模型的评测体系来看,讯飞在文本生成、知识问答、数学能力三大能力上已超ChatGPT,同时科大讯飞还进一步公布大模型年内三次升级时间点,预计10月底将整体赶超ChatGPT。
讯飞“星火”能在推出伊始便达到这个水平,和科大讯飞自身的技术实力拉不开关系。
作为中国领先的人工智能企业,科大讯飞不但拥有丰富的技术积累和经验,建设了目前建有业界一流的AI数据中心,,还在中文语料积累方面有着巨大的优势,拥有海量的文本、代码和知识数据,为训练大模型提供了强有力的支撑,让讯飞“星火”实现了更自然、更智能的对话交互。
最重要的是,得益于独特的“1+N”模式,讯飞“星火”率先在细分行业实现深度应用成了国内率先应用落地的AI大模型 。科大讯飞通过对教育、医疗、交互和办公领域的深度训练生成的专用大模型,显著提高了认知大模型在细分领域的实用性,力求让自身的能力能够被各行各业低门槛地应用。
在大模型的影响下,某些应用已经开始发生了变化。
