这段 wsj对OpenAI首席技术官米拉·穆拉蒂的采访透露了很多重要的信息。
米拉·穆拉蒂(Mira Murati)来自阿尔巴尼亚工。2018 年作为研究员加入OpenAI,后来成为其首席技术官,领导公司在 ChatGPT、Dall-E和Codex方面的工作,同时监督公司的研究、产品和安全团队。这段访谈讨论了OpenAI视频生成模型“Sora”的能力、挑战和未来的发展方向。
1. Sora通过分析大量视频数据,利用扩散模型从文本提示生成精美逼真的视频。尽管在细节处理、连贯性和真实感方面取得了显著成就,但仍存在一些技术缺陷和挑战,例如手部细节的处理以及画面一致性的问题。
2. 目前,【Sora不支持音频生成,但计划未来加入此功能】。
3. Sora训练数据来源于公开可用和被授权的数据,包括与Shutterstock的合作。当主持人问到是否用了油管、脸书以及IG的数据时。米拉显得闪烁其辞,不置可否。
4. 由于Sora还处于开发阶段,成本很高,目前尚未对公众开放,但OpenAI计划优化其技术,以降低成本并提高易用性。【在价格方面会接近Dall·E】。
5. 目前OpenAI正通过红队测试仔细评估Sora的安全性和可靠性,以确保其不会对社会造成负面影响,特别是在全球选举和公众信息方面,【预计会在今年内发布】。
6. OpenAI还考虑如何在保证创意自由的同时限制某些内容的生成,避免产生不良社会影响。包括是否允许生成视频中存在暴露的内容。
7. 最后米拉强调,AI技术的发展将极大扩展人类的创造力和集体想象力,虽然存在很多问题,但绝对值得探索和发展。
#Sora[超话]##openai##ai##aigc# http://t.cn/A6YsG5O8
发布于 上海
