吹牛还是真牛?这家初创公司声称可以将任何CPU性能提高100倍!

科技创新蓝精灵 2024-06-19 11:32:38

一家名为Flow Computing的芬兰初创公司做出了芯片领域有史以来最疯狂的宣言之一:通过添加其专有的配套芯片,任何 CPU 的性能都可以立即提高一倍,通过软件调整,甚至可以将性能提高 100 倍。

如果这一技术得以实现,它将极大地助力整个行业,使之能够更好地应对AI领域对计算能力持续高涨且近乎无限的需求。

SuperCPU 革命

Flow 是芬兰国家研究机构VTT的子公司。该公司正在商业化的“并行处理单元(PPU)”芯片技术,正是该实验室的研究成果。PPU 与现有的 CPU 架构具有非常广泛的兼容性。据称,任何当前的冯·诺依曼架构 CPU 都可以集成 PPU。Flow表示,PPU 甚至可以装入手机和手表中,通过从 CPU 卸载工作,大大提高它们的性能和电池寿命。

Flow 首先承认,“将任何 CPU 的性能提高 100 倍”乍听起来确实令人难以置信。你不可能凭空从各种架构和代码库的CPU中榨取出额外的性能。如果可以的话,像英特尔或AMD这样的公司多年前就应该做到了。

但是,Flow一直在研究理论上可行的东西——只是迄今为止没有人能够成功实现。

Flow的联合创始人兼首席执行官Timo Valtonen表示:“CPU是计算中最薄弱的环节。它无法胜任当前的任务,这一点必须改变。为了满足对更高计算性能不断增长的需求,开启 CPU 性能的新时代已成为必然。Flow 打算通过其全新的PPU 架构引领 SuperCPU 革命,无论架构如何,都能将任何 CPU 的性能提高 100 倍,并具有完全的向后软件兼容性。”

CPU 的速度已经非常快,但即便响应时间已缩短至纳秒级别,由于基本限制(即一个任务必须在下一个任务开始前完成)导致指令执行过程中仍然存在大量的效率浪费。

Flow声称他们所做的就是消除了这一限制,将CPU从一条单车道的道路转变成多车道的高速公路。CPU仍旧受限于一次只能处理一个任务,但Flow所谓的并行处理单元(PPU)本质上是在芯片内部进行纳秒级别的流量管理,以比以往更快的速度将任务移入和移出处理器。

上图比较了采用FPGA增强的PPU芯片与未经修改的英特尔芯片在性能上的提升,增加PPU核心的数量会持续提升性能表现。

如何实现 100 倍的性能提升?

以下是PPU如何解决CPU延迟、同步和虚拟级别并行性方面的挑战。

延迟隐藏

当前的多核 CPU:内存访问,尤其是共享访问,对多核 CPU 来说是一大挑战。内存引用会降低执行速度,内核间通信网络会导致额外的延迟。传统的缓存层次结构会导致一致性和可扩展性问题。

FLOW PPU:通过在访问内存的同时执行其他线程,隐藏了内存引用的延迟。由于在网络前端没有设置缓存,因此不存在一致性问题。通过高带宽片上网络,提供了良好的可扩展性。

同步

当前的多核 CPU:并行性的使用带来了额外的挑战。由于 CPU 处理器核心固有的异步性,只要存在线程间依赖关系,就需要同步线程。这些同步操作非常昂贵,通常需要 100 到 1000 个时钟周期。

FLOW PPU:由于线程在同一个步骤内彼此独立,因此每个步骤仅需要同步一次。同步与执行重叠(将成本降至 1/100)。

虚拟 ILP/LLP

当前多核 CPU:对低级并行的处理欠佳。只有当指令独立时,多个指令才能在多个功能单元中执行。流水线风险会减慢指令执行速度。

FLOW PPU:功能单元以链的形式组织,其中的单元可以使用其前一个单元的结果作为操作数。在执行步骤中可以执行相关代码。消除了流水线风险。

更进一步的性能提升则来源于对软件的重构和重新编译,让PPU-CPU组合更好地协同工作。目前,该公司正在研发重新编译工具,以简化那些希望针对Flow芯片进行优化的软件制造商的工作。

能否成功?

Flow 的成功之路上面临着一个首要挑战:与软件产品不同,Flow的技术需要在芯片设计层面就被纳入,这意味着它不能对现有的芯片进行“追溯”性的修改或集成,而第一款搭载PPU的芯片必然还需要相当一段时间才能面世。

Tirias Research的分析师 Kevin Krewell在了解了 Flow 的技术后表示,他更担心的是行业对这项技术的接受程度,而非其技术基础。

Krewell指出,AI 加速是目前最大的市场。尽管带有PPU加速的CPU能够带来全面的性能提升,但芯片制造商可能不愿过度扰乱现有的市场格局。此外,还有一个问题在于,这些公司是否愿意在一项大部分未经证实的技术上投入大量资源。

尽管Flow已经在基于FPGA的测试设置中证明了这项技术的有效性,但要将其商业化并真正推向市场,还需要跨越从原型验证到大规模生产的重要阶段。芯片制造商需要对其技术潜力和市场接受度做出判断,并愿意承担相应的研发和生产成本,这对于Flow来说,无疑是一大考验。

不过,鉴于PPU技术所带来的显著性能提升,以及近年来CPU性能提升的缓慢和渐进性,如果仅通过一次布局的改变就能在一代产品中实现性能翻倍,芯片制造商们可能会迫切地选择与Flow合作。

目前,Flow已获得了由Butterfly Ventures领投的400万欧元(约430万美元)的种子前轮融资,参与投资的还有FOV Ventures、Sarsia、Stephen Industries、Superhero Capital以及Business Finland等机构。

Flow 表示将在今年下半年提供有关 PPU 的更多技术细节。

SDNLAB公众号后台回复0618PPU,可下载该技术相关白皮书

0 阅读:0

科技创新蓝精灵

简介:感谢大家的关注