姬永锋 23-03-26 16:43
微博认证:财经博主

国内AI大模型展望(1)
摘自投研信息圈

- 嘉宾:某互联网公司AI大模型产品负责人

国内互联网大厂及AI厂商大模型进展和落地现状:

目前我们可以看到在这一轮ChatGPT所带来的语言大模型热潮,不但在全球领域,包括像OpenAI的ChatGPT、GPT1-4、Google 的LaMDA、PaLM以及 Meta AI 等。目前在海外的发展已经是非常火热。

国内发展情况:1)迎头赶上的趋势,大厂都在做积极投入,强势的应用也在积极酝酿中。包括昨天百度文心一言的发布。目前BAT、字节、华为等的国内大模型有很多令人期待的地方,比如21年年初发布的阿里通义M6大模型,是过千亿的中文参数语义大模型;去年10月发布的腾讯混元,也是破千亿的语言大模型,近日腾讯宣布要发布腾讯版的chatgpt,叫做腾讯混元助手。后续可能会在微信社交对话,广告广点通或者腾讯新闻内部的二方业务中有令人期待的落地。2)百度文心一言是国内首个语义大模型的终端应用,NLP技术上在国内处于第一梯队。昨天文心一言发布了关于数据层的信息、下游生态的展望与商业前景。相对处于先发优势地位。3)除了大型科技公司,包括二线厂商和start-up,比如玄机、360、京东(ChatJD)、AI四小龙(商汤、旷视)、国内高校或科研院所(复旦的MOSS、智源研究院悟道)都有比较好或者前沿的技术层投入。4)国内没有能直接对标chatgpt的应用,文心一言随着对公有云PaaS的调用,做付费的商用接口,下半年应用层的竞争格局会逐渐明朗。包括像创新搜索的业务场景,以及目前在海外很火热的应用产品,比如Jasper、微软基于GPT-4的office系列、Google的workspace。后续再国内应用层,比如办公、创作者工具、智能硬件、客服等领域会迎来强有力的竞争。

Q&A:

Q1:百度模型的状况是什么,性能上能对标GPT大概多少?

百度的ERNIE模型,最新是ERNIE 3.0,是在中文语义方面的大模型,参数量2600亿,性能表现上:1)文心一言主要是中文语义方面的应用,比如长语句、复杂语句、模糊指令等上游任务的理解能力还是非更多定制内容添加微start20160903常不错2)数学、逻辑推理方面有非常不错的表现3)多模态能力,包括text-to-text/text-to-image,这是相对GPT来说比较突出的一个点。GPT-4主要还是以text为主。整体的输入、中文理解领域,文心主要对标GPT-3.5。

Q2:哪些方面能达到3.5,哪些弱一些,哪些优秀一些?

从不同benchmark上对标:1)语言语种。ERNIE是local产品,文心所支持的语言语种理解以中文为主加小部分英文。面向的还是中文用户全体,chatgpt是global的大产品,主要支持英文,除了英文也支持中文,还支持德语、法语、西语、葡语、阿拉伯语,不仅支持语言学的知识,以及这些语言学下的各种区域性知识和事实性知识。就像昨天文心一言在秀遣词造句和古文的生成能力,是拥有中文语言的能力,chatgpt在多地区多语言下也有类似这种区域性知识。最大的benchmark差距点还是在支持的用户群体上,两者有很大的差别。2)中文语言下的功能,下游的知识生成和理解方面,从各渠道内部测评上,中文语义生成知识的内容准确性和丰富性,两者是在不同的 feature 上各有优劣,整体处在一个水平线上,ERNIE在遣词造句、引经据典、文本的丰富性和多样性上比chatgpt好。多轮对话、连续对话的稳定、准确性,文心一言不如chatgpt,数理、逻辑推理、代码生成、补全查漏补缺,文心和chatgpt有差距。差距是因为chatgpt模型上线,用户数据持续不断回流,模型多轮迭代,模型表现变好。虽然文心发布较晚,但随着中文互联网环境上被用户不断使用是会持续迭代和变好的。

Q3:未来商业化变现途径?

1)基于B端公有云服务,向下游商业生态进行技术赋能。主要的商业逻辑或者思路包括两大类,1)像 Openai 将GPT模型家族的base模型部署到Microsoft Azure云上做公有云的PaaS级产品,以未调用的 API 的方式在下游按生成量、按 token 进行付费输出。后续文心一言在百度智能云或者是百度大脑上也有类似这种商业接口付费调用模式的计划。2)行业或产业解决方案。国内央国企、大B、大K客户,对数据安全有布局要求,以项目制自由化交付,线下的客户case by case收费。

2)C端业务场景。办公场景,比如Microsoft office、Google workspace,后续国内商业办公、商业文档等类似企业服务产品,或者对于new bing、news browser创新的搜索引擎,还有比如GPT Pro会员付费模式、知识内容平台、内容营销服务平台、百度音箱、或者小米小爱这种结合了内嵌gpt版本产生的增强对话理解智能硬件产品,这种智能硬件产品也会有新的产品型号,或者是以硬件的采购或者消费类电子购买为主的商业形式。应用层的应用会非常多样。

发布于 河南