DeepSeek再创佳绩,登顶HuggingFace点赞榜

智能真的很好说 2025-02-14 15:40:33

  2 月 14 日消息,DeepSeek在开源社区Hugging Face上取得了新的辉煌成就,其点赞数一举跃居榜首,达到了约8730次,并且这一数字还在持续攀升中。这一里程碑式的胜利,是继DeepSeek应用在美国App Store免费榜力压ChatGPT登顶,以及其在GitHub上的模型Star数首次超越OpenAI之后,再次在海外平台写下的辉煌篇章。

  Hugging Face作为全球知名的开源机器学习社区,其点赞榜单一直被视为衡量大模型受欢迎程度和技术实力的重要指标。此次DeepSeek能够脱颖而出,足见其在全球范围内的广泛认可度和影响力。

  在Hugging Face点赞榜单前十名的模型中,每一个都曾在不同节点上引爆整个大模型产业,成为业界关注的焦点。而DeepSeek能够在这场激烈的竞争中脱颖而出,实属不易。紧随DeepSeek之后的是FLUX.1,这款由StableDiffusion原班人马成立的黑森林工作室打造的AI生图“新王”,点赞数约8710次,与DeepSeek相差无几,竞争之激烈可见一斑。

  排名第六的是由全球1000名科学家组成的BigScience团队打造的超大NLP模型BLOOM,其参数高达1760亿个,展现了科学界在人工智能领域的集体智慧和力量。而排名第八的则是欧洲AI独角兽Mistral AI基于MoE(Mixture of Experts)架构的模型Mixtral-8x7B,其独特的技术架构和出色的性能也赢得了业界的广泛赞誉。

  值得一提的是,Meta的Llama系列模型和StabilityAI家的模型也占据了榜单的前十名中的六席,显示了这两家公司在人工智能领域的强大实力。然而,OpenAI的语音转录模型Whisper-large-v3却遗憾地被挤出了前十名之列,排名第11,点赞数约3810次。

  除了登顶榜首的DeepSeek主模型外,其另一款开源模型DeepSeek-V3也表现不俗,排名第19名,点赞数同样达到了约3810次,这一成绩已经超越了微软的Phi-2和谷歌的Gemma-7B模型,显示了DeepSeek在多个领域的全面领先地位。

  此外,DeepSeek还在Hugging Face上发布了一款多模态模型Janus-Pro-7B,该模型在使用文本提示的图像生成排行榜中表现优异,优于OpenAI的DALL-E 3和Stability AI的Stable Diffusion等知名模型。这一成绩的取得,再次证明了DeepSeek在多模态理解和视觉生成领域的深厚底蕴和强大实力。

  DeepSeek的这一系列成就并非偶然。近年来,DeepSeek在人工智能领域的研发投入不断加大,技术创新能力持续提升。DeepSeek V3、DeepSeek R1以及Janus-Pro-7B等模型的相继发布,就是其技术实力的最好证明。

  其中,DeepSeek V3为DeepSeek自研的MoE模型,参数量达到671B,激活参数量37B,在14.8T token上进行了预训练。该模型在多项评测中取得了优异成绩,超越了Qwen2.5-72B和Llama-3.1-405B等开源模型,并在性能上与闭源模型GPT-4o以及Claude-3.5-Sonnet相媲美。

  而DeepSeek R1则在数学、代码、自然语言推理等任务上展现出了出色的性能,与OpenAI o1正式版不相上下。同时,DeepSeek还开源了DeepSeek-R1-Zero和DeepSeek-R1两个660B模型,并蒸馏了6个小模型,其中32B和70B模型在多项能力上实现了对标OpenAI o1-mini的效果。

  多模态模型Janus-Pro作为去年发布的Janus的高级版本,更是显著提高了多模态理解和视觉生成的能力,为用户提供了更加丰富和多样的应用体验。

  DeepSeek的卓越性能和广泛应用潜力已经引起了全球范围内的广泛关注。从芯片企业、云计算巨头到各路基础设施公司,都纷纷适配、接入DeepSeek,共同推动人工智能技术的创新和发展。

  可以预见,随着DeepSeek在人工智能领域的不断深耕和拓展,其将为全球用户带来更多创新性的产品和服务,推动人工智能技术的普及和应用水平的提升。同时,DeepSeek也将继续秉持开放、合作、共赢的理念,与全球合作伙伴携手共进,共同开创人工智能的美好未来。

0 阅读:70
智能真的很好说

智能真的很好说

感谢大家的关注