清华大学：DeepSeek从入门到精通（2025）

科技梦想家阿山 2025-02-09 03:29:38

DeepSeek 坚定开源路线，密集更新 MoE、推理、多模态模型。近期，DeepSeek 连续发布并开源多个大模型，其低成本、高性能的特性迅速引发全球用户的关注。

其中，2024 年 12 月 26 日发布的 DeepSeek-V3 为 671B 参数的自研 MoE 模型，运行时仅需激活 37B，在 14.8T token 的数据上进行了预训练；2025 年 1 月 20 日发布的 DeepSeek-R1 为 660B 的高性能推理模型，对用户开放思维链输出，允许用户通过蒸馏技术借助 R1 训练其他模型；2025 年 1 月 27 日，DeepSeek 在 Hugging Face 平台上传了视觉模型 Janus-Pro 和多模态理解模型 JanusFlow -1.3B，进一步在图像领域发力。

清华大学发布“清华大学：DeepSeek从入门到精通（2025）”，围绕Deepseek是什么？Deepseek能够做什么？如何使用Deepseek？对Deepseek进行了全面深入解读。

以上内容转自智能计算芯世界

0 阅读：0

科技梦想家阿山

感谢大家的关注

作者最新文章

1

整理：国内智算中心发展的“几个阶段”以及典型的“盈利模式”？

2

大模型简史：从Transformer（2017）到DeepSeek-R...

3

DeepSeek训练70B大模型需要多少GB显存GPU分析及计算方法

4

英伟达RTX50系列“翻车”：硬件缺陷、软件危机与市场变局全解析

5

清华团队神操作：只要7万元，4090显卡轻松跑满血DeepSeek-R1

6

OpenAI-o3-mini与DeepSeekR1高级AI推理的...

7

清华大学：DeepSeek从入门到精通（2025）

8

DeepSeekV3的18大技术亮点！（附技术报告万字精读中文版）

9

NVIDIAGB200Superchip及各厂家液冷服务器和液冷机柜介绍

10

【独家深度揭秘】人形机器人投融资热潮背后的故事

科技TOP

1

重磅铁拳,中科院正式宣布,中方开始关闭EUV的大门

2

刚刚入网的荣耀GTPro,配置有点猛啊

3

1TB!去年捅破天的Ultra,杀回来了

4

下个月起,微信支付宝或将迎来“调整”!出门又要带“现金”了?

5

错位:黄仁勋李在容为中国市场奔走郭台铭李嘉诚为去中国化而出走

6

美团正式发布独立品牌“美团闪购”订单平均30分钟送达

7

可外接独立镜头,vivoX200Ultra配置全曝光,能打电话的相机?

8

"104%关税触发末日按钮?中国启动'彩虹防御',马斯克连夜改航班"

9

7600mAh只卖1千多,vivo超大电池的游戏手机来了

10

8000mAh+卫星通信+三防机身,这新机有点猛

科技最新文章

1

好评率高达97%,512GB+卫星通信低至1934元,这款华为手机值得买

2

2899元起!一加13T正式发布:小直屏+6260mAh+骁龙8至尊版

3

国补后2899元起,小屏手机一加13T发布,搭载骁龙8至尊版处理器

4

小米YU9曝光,雷军让3亿中产沸腾了

5

vivoX300Pro亮相:97.5%屏占比+24GB运存,独领风骚

6

首款骁龙8至尊千元机!2K直屏+7000mAh,iQOO半迭代S旗舰即将登场

7

中端“刺客”!荣耀X60GT直接开售!

8

REDMI迄今最好看手机!Turbo4Pro外观首次公布

9

24G+1T才2819元,还有100W超级快充+骁龙8Gen2旗舰

10

三星GalaxyS24轻薄美学,与实用主义的完美融合

热门分类

军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球健康房产家居星座旅游健身时尚科学探索职场育儿股票教育影视情感热点推荐热榜中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期青骄第二课堂少年风超级父母麻辣老师街拍恋爱攻略婚姻情趣正能量