Kimi k1.5

Kimi k1.5

Kimi k1.5是一个通过强化学习(RL)训练的先进多模态模型,在多个基准测试和模态中实现了最先进的推理性能。它在短链推理任务中大幅超越了现有的模型,如GPT-4o和Claude Sonnet 3.5,并在长链推理性能上与OpenAI的o1相当。

More Categories

Keywords

Kimi k1.5强化学习法学硕士多模态模型推理性能短 CoT长 CoT最新技术机器学习自然语言处理研究多模态理解

Share