全球OCR最强模型仅0.9B百度文心衍生模型刚刚横扫4项SOTA全球AI多模态竞

量子位看科技 2025-10-18 03:54:18

全球OCR最强模型仅0.9B百度文心衍生模型刚刚横扫4项SOTA

全球AI多模态竞速激战正酣，百度又放了个大招！

旗下新模型凭借0.9B参数量，在最新OmniDocBench V1.5榜单上拿下92.6分的成绩，获得综合性能全球第一。

它就是百度刚刚发布并在Day 1就开源的自研多模态文档解析模型PaddleOCR-VL。

（ps：0.9B参数量，对开发者的个人电脑真的炒鸡友好！）

发布16小时内，该模型就登顶了抱抱脸Trending全球第一。【图1】

非常抢眼的是，这款模型不仅得分高，它还在文本识别、公式识别、表格理解、阅读顺序四大核心能力上全面拿下SOTA，成为当前唯一在这四个维度全部排名第一的模型，刷新了全球OCR VL模型性能的新高线。【图2】

PaddleOCR-VL是一款面向复杂文档结构解析而设计的模型，是百度文心大模型体系下专注文档解析任务的轻量化衍生产品，具备极强的行业落地导向和平台集成能力，能轻松看懂令人头秃的PDF和图片。

敲黑板划重点：它真的能理解格式杂、长度长的文档中的逻辑结构、表格关系、数学表达等等。

𝕏和小红书等平台上，这个模型已经被大家先用起来并分享使用体验。实用又好用，已经收获“哇”声一片。【图3】【图4】

在AI从感知到认知不断跃迁的当下，当模型不再只是识字工具，变成了具备结构感知与语义还原能力的利器，OCR在AI时代的意义也被彻底改写。

0 阅读：1

量子位看科技

感谢大家的关注

作者最新文章

1

AI圈现千亿财富三角英伟达千亿美元投OpenAI英伟达准备向OpenAI投资最高

2

奥特曼私藏成功法则顶级创业者都这么干Sam Altman分享的成为亿万富翁的习惯

3

2025搞笑诺贝尔奖出炉科学研究笑完带你思考2025年的搞笑诺贝尔奖（Ig No

4

GPT5编程测评大反转GPT5解决率实则是Claude两倍GPT-5编程测评出现

5

腾讯AI重塑3D管线建模师迎来AI神器建模师们有福了！不用在建模、UV、贴图软件

6

OpenAI不计成本投入算力奥特曼预告ChatGPT新产品OpenAI真成了AI

7

多Agent系统问题与挑战什么是多Agent系统什么是多Agent系统？最新论文

8

OpenAI神秘狠人Bob被扒网友基本锁定OpenAI神秘人OpenAI内部有个

9

马斯克新模型性价比拉满Grok4Fast九折价比肩Gemini2.5马斯克xAI

10

马斯克转发金融AI新考题字节联手哥大挑战金融分析让AI像金融分析师一样搜索和分析

热门分类

科技TOP

1

这台是什么手机？

2

曾经的手机系统，如今只剩三家，大家都用过那些系统？

3

卢伟冰发布会上口误，把小米17Ultra徕卡版“7999元”说成“799元”，

4

iPhone18Pro配置提前看：2nm芯片+屏下FaceID

5

2699起，才2699，其中我以为最起码要2999。256版本是满一刀享受限时优

6

三款电竞手机如何挑选？一张图告诉你明明白。相信大家心中已有答案——荣耀无疑大获

7

冰冰美的冒泡！爱了！华为Mate80太出镜了！

8

2025年终中端机封神！等等党赢麻了✅5款真香机性价比拉满，闭眼冲不亏！✅荣

9

鸿蒙6.0老掉牙的Mate60pro时隔3年，你认为这个相机还能撑个几年，我个人

10

都说现在内存、存储芯片涨价得厉害，今年新机普遍价格都上调了，怎么我看新发布的一加

科技最新文章

1

阿里巴巴“千问app”率先引入AI购物模式，为什么阿里系股票会普遍大跌呢？

2

千问APP发布会前瞻｜AI“办事时代”的真正入口之争核心判断、AI正在争

3

据多家权威媒体的报道，第四季度中国手机市场出货量苹果第一，全年海外手机市场荣耀增

4

iPhone18系列超前预览[滑稽笑]标准版和Pro改为6.27英寸，更小了，那估

5

天塌了，iPhone18Pro真长这样啊？？最新爆料，iPhone18

6

1200亿订单！这什么概念，A股5千多家上市公司估计有超过90%年度营业收入都

7

国产工艺设计巅峰荣耀Magic8RSR对比华为Mate80RS大家更喜

8

没开玩笑，家里有iPhone4的赶紧翻出来！！咱也不知道为哈，iPhone

9

据行业信息显示，苹果计划于今年秋季推出其首款折叠屏手机iPhoneFold。

10

荣耀老粉别慌！MagicOS10没忘了你们，升级名单藏着大惊喜～之前好多小伙