查看“DeepSeek-R1 发布,性能对标 OpenAI o1 正式版”的源代码
←
DeepSeek-R1 发布,性能对标 OpenAI o1 正式版
跳转至:
导航
、
搜索
因为以下原因,您没有权限编辑本页:
您所请求的操作仅限于该用户组的用户使用:
用户
您可以查看与复制此页面的源代码。
{{4}} '''DeepSeek-R1 发布,性能对标 OpenAI o1 正式版''' 今天,我们正式发布 DeepSeek-R1,并同步开源模型权重。 DeepSeek-R1 遵循 [[MIT]] License,允许用户通过蒸馏技术借助 R1 训练其他模型。 DeepSeek-R1 上线 API,对用户开放思维链输出,通过设置 model='deepseek-reasoner' 即可调用。 DeepSeek 官网与 App 即日起同步更新上线。 '''性能对齐 OpenAI-o1 正式版''' DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。 [[文件:deepseek_r1_benchmark.png]] 在此,我们将 DeepSeek-R1 训练技术全部公开,以期促进技术社区的充分交流与创新协作。 论文链接: [https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf] '''蒸馏小模型超越 OpenAI o1-mini''' 我们在开源 DeepSeek-R1-Zero 和 DeepSeek-R1 两个 660B 模型的同时,通过 DeepSeek-R1 的输出,蒸馏了 6 个小模型开源给社区,其中 32B 和 70B 模型在多项能力上实现了对标 OpenAI o1-mini 的效果。 [[文件:deepseek_r1_benchmark_table.png]] HuggingFace 链接: [https://huggingface.co/deepseek-ai https://huggingface.co/deepseek-ai] [[文件:deepseek_r1_hf.png]] '''开放的许可证和用户协议''' 为了推动和鼓励开源社区以及行业生态的发展,在发布并开源 R1 的同时,我们同步在协议授权层面也进行了如下调整: 模型开源 License 统一使用 MIT。我们曾针对大模型开源的特点,参考当前行业的通行实践,特别引入 DeepSeek License 为开源社区提供授权,但实践表明非标准的开源 License 可能反而增加了开发者的理解成本。为此,此次我们的开源仓库(包括模型权重)统一采用标准化、宽松的 MIT License,完全开源,不限制商用,无需申请。 产品协议明确可“模型蒸馏”。为了进一步促进技术的开源和共享,我们决定支持用户进行“模型蒸馏”。我们已更新线上产品的用户协议,明确允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。 '''App与网页端''' 登录DeepSeek官网或官方App,打开“深度思考”模式,即可调用最新版 DeepSeek-R1 完成各类推理任务。 [[文件:deepseek_r1_example.gif]] '''API 及定价''' DeepSeek-R1 API 服务定价为每百万输入 tokens 1 元(缓存命中)/ 4 元(缓存未命中),每百万输出 tokens 16 元。 [[文件:deepseek_r1_price.jpeg]] [[文件:deepseek_r1_price_compare.png]] 详细的 API 调用指南请参考官方文档: [https://api-docs.deepseek.com/zh-cn/guides/reasoning_model https://api-docs.deepseek.com/zh-cn/guides/reasoning_model]
返回至
DeepSeek-R1 发布,性能对标 OpenAI o1 正式版
。
导航菜单
个人工具
登录
名字空间
页面
讨论
变种
视图
阅读
查看源代码
查看历史
更多
搜索
导航
首页
社区主页
新闻动态
最近更改
随机页面
帮助
华师附中老三届
站群链接
社友网(sn)
产品百科(cpwiki)
产品与服务(sn)
社区支持农业(sn)
工具
链入页面
相关更改
特殊页面
页面信息