DeepSeek-R1

DeepSeek-R1

DeepSeek-R1是DeepSeek2025年1月最新推出的推理模型，通过大规模强化学习训练，无需监督微调即可展现出卓越的推理能力。该模型在数学、代码和推理任务上表现优异，与OpenAI-o1相当。此外，DeepSeek还开源了基于Llama和Qwen的6个从DeepSeek-R1蒸馏而来的密集模型。

DeepSeek-R1

详细介绍

DeepSeek-R1是一款先进的推理模型，通过大规模强化学习训练，无需监督微调即可展现出卓越的推理能力。它具备自我验证、反思和生成长推理链的能力，为研究社区树立了一个重要的里程碑。该模型旨在为推理任务提供高精度，适用于广泛的应用场景。

更多
人工智能

心灵空间: 负担得起的创伤后压力障碍同伴支持。找到治疗师，帮助您在匿名的、由小组支持的同伴支持中。

心灵空间: 负担得起的创伤后压力障碍同伴支持。找到治疗师，帮助您在匿名的、由小组支持的同伴支持中。

在心灵空间找到治愈：在线同伴支持和创伤支持小组。在专家指导下克服创伤后压力障碍症状。加入我们，今天实现积极的改变。

大脑AI - 最佳冥想应用 | 冥想与睡眠

大脑AI - 最佳冥想应用 | 冥想与睡眠

大脑AI：通过Mere提升冥想和睡眠体验。体验利用先进技术的恢复性放松。

tartuNLP/Reddit Anhedonia Dataset - hf-mirror

tartuNLP/Reddit Anhedonia Dataset - hf-mirror

tartuNLP/reddit-anhedonia by huggingface-mirror (hf-mirror)

网站 URL

https://github.com/deepseek-ai/DeepSeek-R1

更多分类

人工智能 LLM 研究

关键词

AIDeepSeek-R1推理模型强化学习监督微调语言模型代码生成机器学习自然语言处理推理数学推理

分享