编辑|孙浩南
字节跳动与中科大联合提出多模态文档大模型DocPedia
12 月 4 日消息,字节跳动与中国科学技术大学合作研发的多模态文档大模型 DocPedia 已成功突破了分辨率的极限,达到了 2560×2560 的高分辨率,而目前业内先进多模态大模型如 LLaVA、MiniGPT-4 等处理图像分辨率上限为 336×336,无法解析高分辨率的文档图像。这一成果是通过研究团队采用了一种新的方法,解决了现有模型在解析高分辨文档图像方面的不足。据称,DocPedia 不仅能准确识别图像信息,还能结合用户需求调用知识库回答问题,展现高分辨率多模态文档理解的能力。
传谷歌Gemini推迟至明年1月发布
12月4日消息,据外媒The Information昨日报道,两位知情人士透露,谷歌已将旨在与OpenAI竞争的AI聊天机器人Gemini的发布时间推迟至明年1月。其中一位知情人士称,谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)最近决定取消原定于下周在加利福尼亚州、纽约和华盛顿举行的一系列Gemini活动,因为公司发现其无法可靠地处理一些非英语查询。
中国电信成立 AI 科技新公司,注册资本为 30 亿元
据报道,天眼查显示,近日,中电信人工智能科技(北京)有限公司成立,注册资本 30 亿元,经营范围包含:人工智能行业应用系统集成服务;人工智能通用应用系统;人工智能基础资源与技术平台;人工智能理论与算法软件开发;人工智能基础软件开发;人工智能应用软件开发;人工智能硬件销售等。该公司由中国电信 100% 控股。
斥资5100万美元 OpenAI将从CEO阿尔特曼投资的初创公司购买AI芯片
12月4日消息,据一位知情人士透露,OpenAI于2019年与芯片开发商Rain AI 签署了一份意向书,在该初创公司的芯片上市后将斥资5100万美元购买这些芯片。这家公司的特殊之处在于它由阿尔特曼亲自投资,其已投资超过100万美元。据报道,Rain AI的总部与OpenAI旧金山总部之间不到一英里,目前正在研发一种NPU芯片,旨在“复制”人脑的特征。投资者文件也称,Rain AI最早可能于明年10月向客户提供第一批AI芯片。
魅族 MYVU 智能指环开售:支持 AR 眼镜多模交互
12 月 4 日消息,此前在 2023 魅族秋季无界生态发布会亮相的 MYVU Ring 智能指环现已开售,售价 399 元。该指环专为 MYVU 智能眼镜设计,支持手势和触控操作,如自由切换、一键接听电话等。采用陶瓷与不锈钢材质,防水等级 IPX7,提供四类尺寸。搭配 MYVU 智能眼镜,可实现多种操作。在 FlymeAR 系统及 Flyme AI 大模型支持下,成为用户的智能个人助理。配备充电仓,2 小时即可满电,续航 6 小时或待机 6 天。
AI智能决策公司悠桦林完成近亿元C+轮融资
12月4日消息,据AI智能决策公司悠桦林微信公众号今日发文,近日,悠桦林完成近亿元人民币的C+轮融资,此轮融资由上汽恒旭领投。该轮融资将用于加强悠桦林在运筹优化领域的技术优势和顶级行业人才的招募,持续完善算法、产品和服务体系,尤其是在智能供应链计划与排程优化平台方面的创新和深化,加速智能化决策解决方案的商业化步伐。