DeepSeek是杭州深度求索人工智能基础技术研究有限公司开发的人工智能项目,在大语言模型领域有较高的知名度,以下是关于它的介绍:
• 公司背景:成立于2023年7月17日,与幻方量化关系紧密,继承了其技术研发底蕴。公司专注于开发先进的大语言模型和相关技术,致力于为各行业智能化升级提供技术支持。
• 模型特点:该公司推出了多个模型,如DeepSeek - V3仅用557.6万美元便实现了与GPT - 4 Turbo相当的性能,通过蒸馏训练策略等提高算力利用率、降低能耗,展现出低成本与高性能结合的特点。在自然语言处理方面,能准确理解和生成自然语言;在机器学习与深度学习领域,对模型架构和训练算法进行深度优化,缩短训练周期、降低成本,还注重模型泛化能力。
• 相关产品:2025年1月10日,DeepSeek App正式发布,上线多个平台,用户安装后可免费体验与DeepSeek - R1模型互动交流。该应用支持多种登录方式,历史对话记录与网页端同步,现有功能也与网页端全面对齐,支持联网搜索、深度思考模式及文件上传等功能。
• 市场表现:DeepSeek - R1模型推出后表现出色,2025年1月27日,DeepSeek - R1在美国iOS应用商店超越ChatGPT成为下载量最高的免费应用。2月1日,DeepSeek日活跃用户数突破3000万大关,截至2月9日,DeepSeek App的累计下载量超1.1亿次。
不过,DeepSeek也面临一些问题,如服务稳定性有待提高,自春节爆火以来,其服务器常出现繁忙情况,多次出现服务不可用的问题。
发布于 山东
