ブログ

Feb 10, 2025

突破性融合DeepSeek-R1训练框架!Kneron AI实现行业芯片级思维链推理



在人工智能的快速发展浪潮中,Kneron 始终紧跟最前沿的技术,并不断优化自身的 AI 方案,以更强大的能力和更优的性价比赋能各行各业。

如今,Kneron 取得了一个令人兴奋的突破——借助 DeepSeek-R1 论文中提到的前沿训练技巧,Kneron 成功让自研的 LLM 模型掌握了“思维链推理(Chain-of-Thought Reasoning)”和“自我反思(Reflection)”的能力,并已部署在 Kneo300 和 Kneo330 AI 一体机上,为企业提供更智能、更精准的 AI 解决方案,Kneron智能决策系统已落地医疗金融等多个场景。

这意味着,Kneron 的 AI 不再仅仅是回答问题或执行任务,而是能够“思考”和“推理”,让 AI 具备更强的逻辑推导能力,从而更好地理解复杂问题,给出更可靠、更专业的答案。

Kneron 已经在医疗、金融、企业客服等多个行业场景中成功应用了这一创新技术,帮助客户实现更高效的 AI 赋能。


什么是“思维链推理”和“自我反思”?

在传统的 AI 对话系统中,模型往往直接给出答案,但很多时候,这些答案缺乏逻辑推导,容易出现前后矛盾或不够严谨的情况。而 “思维链推理” 让 AI 学会像人类一样,逐步拆解问题,形成清晰的推理步骤,避免“拍脑袋”式的回答。

更重要的是,Kneron 的 AI 还具备了“自我反思(Reflection)”能力--在回答复杂问题时,它可以回顾自己的推理过程,检查是否有逻辑错误,并在发现问题后主动调整答案。这种能力在数学计算、金融分析、医学诊断等领域尤其重要,因为这些场景需要 AI 不仅提供答案,还要保证答案的正确性和推理过程的严谨性。

图1: 原模型对推理性问题回答并不理想

图二:经训练提升后, KneronLLM-R1 可以有一个推理思考的过程,可以通过思考输出更正确的答案。

突破创新:Kneron 如何做到的?

这次突破的核心在于 Kneron 采用了 DeepSeek-R1 论文中提出的强化学习(Reinforcement Learning, RL)和蒸馏(Distillation)等技术,使 AI 在训练过程中逐步学会推理和反思。其关键步骤包括:

1.高质量数据整理与冷启动训练
参考 DeepSeek-R1 的方法,Kneron 通过构建高质量的思维链(Chain-of-Thought, CoT)数据,精心筛选多轮推理示例,进行冷启动训练。这一阶段提高了模型的可读性和稳定性,使 AI 具备基本推理能力。

2.拒绝采样 + 蒸馏
Kneron 采用拒绝采样(Rejection Sampling),筛选出最优推理路径,并结合知识蒸馏(Knowledge Distillation),将Deepseek-r1及o1等大模型的推理能力迁移到轻量级模型,使 Kneron AI 既具备强大的推理能力,又能在 Kneo300 和 Kneo330 上高效运行。

3.强化学习优化推理能力
训练后期,Kneron 采用类似于 DeepSeek-R1 的强化学习策略,在训练过程中让 AI 通过自对比和奖励机制学习最佳推理路径。模型会生成多个不同的推理链,并根据准确性和逻辑一致性进行优化。

4.语言一致性与长文本优化
由于 AI 需要适应不同场景,Kneron 还借鉴 DeepSeek-R1 在语言优化方面的方法,引入语言一致性奖励,确保模型在复杂推理过程中保持逻辑清晰,避免回答混乱或前后矛盾。

最终,耐能成功将这一增强版 AI 部署在 Kneo300 和 Kneo330 AI 一体机 上,让更多企业和开发者可以直接使用具备推理能力的 AI,为他们的业务赋能。


更智能的 AI,如何助力行业升级?

这项技术的突破,正在帮助多个行业实现 AI 赋能,耐能已经在以下场景中实现落地应用:

1. 医疗问卷 AI 助手                                                             

在医疗行业,医生和医院需要收集大量的患者信息,进行健康评估。Kneron 的 AI 可在问卷填写过程中进行推理,根据患者的回答动态调整问题,并分析可能的健康风险,提高诊断效率。



2.金融衍生品定价 AI                                                          

金融衍生品定价涉及复杂数学计算和市场分析。Kneron AI 结合“思维链推理”技术,精准解析结构与条款,融合金融数学模型,智能推导定价策略,为金融机构提供高效、精准的投资优化与风险管控方案。


3.金融数据分析助手  

金融行业的数据繁多且复杂,传统的 AI 只能提供简单的报表分析,而 Kneron 的 AI 能够基于数据推理找出数据中的异常,帮助财务人员和分析师做出更高维度的分析。



4.企业资料智能客服

许多企业客服需要处理大量的内部文档和客户问题,Kneron AI 可自动读取、理解企业文档,并提供准确的回答,降低企业客服成本,同时提升客户体验。



5.会议纪要AI助手  

Kneron AI 可帮助企业自动生成高质量的会议纪要,不仅记录内容,还能分析会议重点,提炼核心观点,帮助企业提升会议效率。    

为什么选择耐能?

这次技术升级,充分展现了耐能在AI领域的创新能力和技术实力。耐能不仅能紧跟前沿技术趋势,还能将这些技术快速落地,为客户提供极具性价比的软硬一体 AI 解决方案

Kneron AI 的核心优势:

软硬一体,性能更优:AI 直接运行在 Kneo300 和 Kneo330 上,速度更快,成本更低,无需依赖云端计算,实现软硬件深度协同优化,显著优化部署成本与提高隐私安全指标。

推理更强,结果更精准:认知推理能力突破,具备“思维链推理”和“自我反思”能力,在自然语言处理、复杂决策支持等场景提供更具逻辑性答案。

应用灵活,行业适配广:已落地医疗、金融、企业客服等多个场景,助力各行业智能升级。

在 AI 时代,拥有强大的推理能力意味着 AI 不仅能“回答问题”,还能“思考问题”。Kneron 的这一突破,为行业提供了一种全新的 AI 解决方案,帮助企业更高效地利用 AI,创造更大的价值。

突破性融合DeepSeek-R1训练框架!Kneron AI实现行业芯片级思维链推理 | Kneron – Full Stack Edge AI
突破性融合DeepSeek-R1训练框架!Kneron AI实现行业芯片级思维链推理 | Kneron – Full Stack Edge AI

シェア