DeepResearchAgent训练门槛骤降，30小时H200算力即可超

爱生活爱珂珂 2025-09-03 11:31:53

Deep Research Agent 训练门槛骤降，30小时H200算力即可超越Sonnet-4，开源工具助力人人可达前沿水平。

• 利用Agent Reinforcement Trainer (ART) 和 LangChain Open Deep Research框架，将Qwen 2.5 14B模型经过30小时强化训练，打造高效研究代理。

• 训练流程简洁明了：先用SFT掌握基础研究技能，再用GRPO提升执行效率，最终在DeepResearch Bench验证性能。

• 训练模型表现媲美Gemini 2.5 Pro、OpenAI Deep Research、Claude Research等百万级投入的商用系统。

• 公开了完整教程，基于OpenPipe、LangChain、Tavily，$350成本即可复制，极大降低深度研究AI开发门槛。

• 该方案不仅节省资金，更加推动开放研究生态，促进研究效率和创新能力的普惠。

• 社区广泛讨论奖励信号设计、模型可用性及后续扩展，展现该范式的广泛适用潜力。

技术细节与完整教程👉 art.openpipe.ai/tutorials/open-deep-research

强化学习深度研究开源AI LangChain 人工智能研究代理

0 阅读：2

猜你喜欢

据港媒报道，小胖樊振东这些天在德甲的日子可不轻松！每天雷打不动训练10小时，其中

据港媒报道，小胖樊振东这些天在德甲的日子可不轻松！每天雷打不动训练10小时，其中

樊振东德甲 ai

48小时前，黄荣奇还没工作；48小时后，杜锋仍把广东14人花名册空出一个格子——

48小时前，黄荣奇还没工作；48小时后，杜锋仍把广东14人花名册空出一个格子——

【2评论】【4点赞】

广东男篮杜锋黄荣奇广东队

广东队迎来新的外籍训练师！随着伊戈尔、泰勒的离队，冠军时期的广东外籍教练四人组

广东队迎来新的外籍训练师！随着伊戈尔、泰勒的离队，冠军时期的广东外籍教练四人组

【6点赞】

广东省泰勒广东队教练

首发62分钟就被换下！德弗里国家队评分4.5分，跌入困局荷兰3-2立陶宛拿下胜

首发62分钟就被换下！德弗里国家队评分4.5分，跌入困局荷兰3-2立陶宛拿下胜

【2点赞】

国米

推特上一个比较有意思的讨论：马兹拉维能不能踢中场？先不谈讨论了什么内容，主要

推特上一个比较有意思的讨论：马兹拉维能不能踢中场？先不谈讨论了什么内容，主要

【1点赞】

马兹拉维曼联

鲍尔默可能是自己把伦纳德给点了！为啥这么说？三种可能！1.据爆料者Pabl

鲍尔默可能是自己把伦纳德给点了！为啥这么说？三种可能！1.据爆料者Pabl

【14评论】【14点赞】

史蒂夫·鲍尔默科怀·伦纳德国际当红篮球明星

作弊棋手被直接拒签，梦百合杯真硬气！韩国棋院这回只能干瞪眼。去年3月，卞

作弊棋手被直接拒签，梦百合杯真硬气！韩国棋院这回只能干瞪眼。去年3月，卞

【10评论】【3点赞】

梦百合 ai 卞相壹

TheAthleticJamesMcNicholas：阿森纳可能会考虑在

TheAthleticJamesMcNicholas：阿森纳可能会考虑在

【1评论】

阿森纳狂潮英超

爱生活爱珂珂

感谢大家的关注

作者最新文章

1

[CL]《Language Modeling with Learned Meta

2

[LG]《Reinforced Generation of Combinator

3

[CL]《Can LLMs Reason Over Non-Text Modal

4

[LG]《GPO: Learning from Critical Steps t

5

早！[太阳] 早安

6

LLM 工程实战全流程拆解，系统掌握核心机制与优化技巧：• Tokenizati

7

[人人能懂] 绘制意义地图、反刍知识与打破秩序今天，我们将一起探索AI的几项惊人

8

“GPU与TPU怎么选？”不能只看性能差异，而是要全面考量生态与成本。• 硬件指

9

《Towards an AI-Augmented Textbook》教科书的未来

10

[LG]《Hierarchical Self-Attention: Genera

热门分类

科技TOP

1

微信员工回应新iPhone提示空间不足早之前就有网友出现这个问题，要是还解决不了

2

OPPOFindX9的屏幕，由两条顶级产线共炼：第一条，OPPO独家定制行业

3

翻开王腾过去从业史，在好几家手机品牌都干过，在OPPO从2008年一直到2016

4

离职前，OPPO产品经理莫妮卡与客户网友的同框合影照。莫妮卡不仅漂亮清爽，还亲切

5

史上最薄iPhoneiPhoneAir现场真机实拍这外观给几分？

6

重磅！华为公布多颗新昇腾芯片9月18日，在华为全连接大会2025上，华为轮值

7

4499起步倒不算意外，但小米17Pro是4999起步倒是挺意外的。骁龙8

8

这么一比，谁说FindX9不好看的...OPPOFindX9的官方外观

9

iPhone17，终于亮相。今年的颜色都还不错呀，造型就是跟16基本一样。屏

10

一张X300和X200Promini的背面对比图，可以看到X300的大圆镜头比

科技最新文章

1

荣耀这是要掀桌子的节奏？荣耀400系列就让友商眼红了，没想到这次荣耀500系列升

2

快讯！快讯！华为事情突发！华为正式宣布任正非女儿孟晚舟担任董事

3

小米17系列销量破百万所以好的产品真正有创新的产品永远不用愁消费者买不买单！小

4

华为事情突发！任正非的女儿孟晚舟明天起担任华为的轮值董事长，任期到2026年

5

苹果彻底傻眼了吧[捂脸哭]荣耀竟然要直接来个贴脸开大，荣耀500系列这是要把苹果拉

6

非常庆幸今年还有少数像荣耀Magic8Pro这样的窄边微曲屏幕的机型，真好看，

7

不听劝入手了荣耀Magic7，整个人都愣住了！大家听我的选手机千万不要光听人说，

8

不得不说现在的手机更新速度是真的快……我的Magic7到手还没捂热乎，Magic

9

刚看了下10月的新机发布安排，真的是太密集了。10月13日vivoX300

10

荣耀500系列配置前瞻，含荣耀500与荣耀500Pro。屏幕上，前者6.5英寸