上期图文内容,我们分享了深度求索公司发布的而在过中国新年之前,深度求索正式推出新一代人工智能助手DeepSeek-R1大语言模型。官方宣称其综合性能对标OpenAI的GPT-4o(o1正式版),并在逻辑推理、数学计算、编程辅助等场景中表现尤为亮眼。这一发布标志着国产大模型技术迈入全球第一梯队。且DeepSeek-R1依然是一款开源模型,价格更是打到了平民的价格。

DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。
一、核心技术亮点
思维链强化
采用分步式思考优化算法,解决复杂问题时推理步骤更清晰,错误率较前代降低40%。例如在解决国际数学奥林匹克(IMO)题目时,DeepSeek-R1能逐步拆解定理应用过程,并标注关键逻辑节点。
多模态能力升级
支持文本、图像、音频混合输入,实现跨模态内容生成与分析。比如上传一张电路板照片,可自动生成维修建议以及根据用户语音指令实时生成数据分析图表等。
实时联网与长文本处理
整合实时搜索引擎,支持单次解析超100万字符的长文档(如合同、学术论文等)。

官方在开源 DeepSeek-R1-Zero 和 DeepSeek-R1 两个 660B 模型的同时,通过 DeepSeek-R1 的输出,蒸馏了 6 个小模型开源给社区,其中 32B 和 70B 模型在多项能力上实现了对标 OpenAI o1-mini 的效果。

登录DeepSeek官网或官方App,打开“深度思考”模式,即可调用最新版 DeepSeek-R1 完成各类推理任务。

二、与OpenAI GPT-4o的差异化优势
作为开源的国产大模型,第一肯定最重要的是不用再想办法使用梯子才能使用大模型能力了,第二个当然是开源了,模型开源 License 统一使用 MIT。此次开源仓库(包括模型权重)统一采用标准化、宽松的 MIT License,完全开源,不限制商用,无需申请。

任何人可以直接在 GitHub 或者 hugging face 上面下载预训练权重,使用简单的代码即可实现使用

三、用户场景实际测试
这里使用了一个简单的测试来看看DeepSeek-R1的表现:
输入需求:“用Python写一个自动爬取天气数据的脚本,并生成可视化图表。”
DeepSeek-R1 10秒内生成完整代码,并标注关键API的调用注意事项。

DeepSeek-R1写清楚了每个过程的要点,并指导用户使用此脚本代码,简直是小白的福音。而调用DeepSeek-R1模型也很简单,只需要安装 openai第三方库,直接使用以下代码即可调用DeepSeek-R1,这里注意的是模型是deepseek-reasoner。
pip3 install -U openaifrom openai import OpenAIclient = OpenAI(api_key="<DeepSeek API Key>", base_url="https://api.deepseek.com")# Round 1messages = [{"role": "user", "content": "9.11 and 9.8, which is greater?"}]response = client.chat.completions.create( model="deepseek-reasoner", messages=messages, stream=True)reasoning_content = ""content = ""for chunk in response: if chunk.choices[0].delta.reasoning_content: reasoning_content += chunk.choices[0].delta.reasoning_content else: content += chunk.choices[0].delta.content# Round 2messages.append({"role": "assistant", "content": content})messages.append({'role': 'user', 'content': "How many Rs are there in the word 'strawberry'?"})response = client.chat.completions.create( model="deepseek-reasoner", messages=messages, stream=True)当然若你不了解代码,可以直接在 deepseek 官方网站上面直接使用,只需要在对话框左下角点击深度思考 R1,模型就自动使用deepseek R1 模型。
四、价格
最后一点便是优惠的价格,官方也明码标价,百万 tokens 为 16 元,比openai的 O1 模型优惠了很多。而同样作为开源模型的鼻祖 meta 也对 deep seek 的模型进行了密切关注,毕竟是一款中国模型,引起了广大网友的一致好评。660B参数的大模型,也不是一般电脑配置可以用起来的,因此使用 API 调用,或者直接在 deep seek 官方网站上使用 R1 模型定是一个不错的选择。

微曦
嗯 不理解[无奈吐舌] 吃瓜吧
知了
Deepseek的横空出世的最大意义,是打破了美国人对人工智能的垄断和定义权。美国人花了几年时间做了很大的局,把AI吹上了天,搞得全球的高科技行业不得不跟,然后就关门打狗,Openal和英伟达开始收割全世界的财富。结果中国这家不知名公司打破了美国人的如意算盘,现在美国人一定在风中凌乱、不知所措了。
这里是小皮
不是多模态,还不支持tools
檑檬K
不能语音,不能图像处理视频
孤单是我
出一个教程调用这个参数