#李沐用1000万小时训练语音大模型##李沐语音模型参数预计达100亿#
活久见系列:李沐B站更新了!【图1】
本期视频不讲论文,李沐老师来手把手教大家怎样玩转他们团队最新研发的Higgs Audio V2模型,不仅能处理文本,还能同时理解并生成语音。【视频2】
这次模型最硬核的地方,就是训练数据量:整整1000万小时语音,堪称“大力出奇迹”。
参数量方面,从【图3】可以看出,这个语音模型的参数量达30亿,而李沐的视频标题有“100亿模型计划”字样,网友猜测预计后续会将模型扩展到百亿规模。
令人惊喜的是,鬼畜视频以后不用手搓了,看看李沐老师直接用算力帮大伙做的效果:【视频3】。
网友:醒醒,开组会了。
视频地址:www.bilibili.com/video/BV1LGbozkEDY
模型全部开源:http://t.cn/A6kkpU82
