在计算机科学的世界里，JeffDean和SanjayGhemawat的

在计算机科学的世界里，Jeff Dean 和 Sanjay Ghemawat 的名字代表着一种近乎传奇的工程默契。最近，他们将多年来在 Google 内部沉淀的性能优化指南 Performance Hints 整理公开。这不仅是一份技术文档，更是两位顶尖工程师在代码深处潜行数十年的经验结晶。1、性能优化不仅是那“3%”的微调，更是一种底层的工程哲学。Jeff Dean 与 Sanjay Ghemawat 认为，优秀的软件工程师不应在开发初期完全忽视性能，因为一旦系统规模扩大，性能损失会分散在各处，形成“平坦的分析图谱”，让你无从下手。2、很多人误读了高德纳关于“过早优化”的警告。事实上，在不增加复杂性的前提下，选择更快的替代方案是职业素养的体现。如果一个库在设计时就忽视了性能，那么未来的使用者将付出巨大的代价，因为他们往往无法轻易修改底层代码。3、性能直觉源于量化估算。你必须对硬件的基本开销了如指掌：L1 缓存访问只需 0.5 纳秒，而主存访问需要 50 纳秒，磁盘寻道则高达 5 毫秒。通过这些量级差异进行“信封背面”的计算，你可以在写代码前就排除掉那些注定低效的设计方案。4、API 设计决定了性能的天花板。优先提供批量接口（Bulk APIs）以减少跨边界调用的开销；使用视图类型（如 string_view 或 Span）来避免不必要的内存拷贝。一个好的 API 应当是“深”的：在简单的接口背后隐藏复杂的性能优化逻辑。5、算法改进永远是收益最高的路径。将 O(N^2) 降低到 O(N log N) 的效果远胜于任何微调。例如，在互斥锁实现中引入动态拓扑排序算法，不仅将性能提升了 50 倍，还解决了大规模并发下的扩展性瓶颈。6、内存布局是现代计算机性能的核心。指针是昂贵的，在 64 位机器上，大量指针会吞噬缓存空间。考虑使用数组索引替代指针，或者通过重新排列结构体字段来减少填充内存（Padding）。记住：紧凑的数据结构意味着更高的缓存命中率。7、减少内存分配是性能优化的捷径。每一次分配都伴随着系统开销和潜在的缓存失效。通过预留空间（Reserve）、重用临时对象、以及在栈上分配小对象，可以显著提升吞吐量。在长时间运行的程序中，频繁分配会导致内存碎片，进一步拖累性能。8、聪明地“偷懒”：为常见情况建立快速路径。如果一个向量通常只有几个元素，使用 InlinedVector 避免堆分配；如果一个复杂的计算在循环中反复出现，将其提升到循环外或进行预计算。性能优化的本质，往往是找出那些不必要做的工作并剔除它。9、警惕代码膨胀。过度使用模板和内联会导致二进制文件体积激增，增加指令缓存压力。对于非性能关键路径（如错误处理），应果断取消内联。小而精的代码往往比臃肿的“高度优化”代码运行得更快。10、重新审视 Protobuf 的开销。虽然 Protobuf 极其便利，但在极端性能场景下，它可能比原生结构体慢 20 倍。在内存中长期维护大量对象时，考虑以序列化形式存储，或者使用 Arena 内存池来管理生命周期，以减少分配开销。11、并发不等于速度。锁竞争是吞吐量的杀手。通过分片（Sharding）减少互斥锁的争用，保持临界区尽可能短小，并避免在持有锁时进行 RPC 或文件 IO。只有在 spare CPU 充足且任务可独立拆分时，并行化才有意义。12、性能优化是一场持久战。它需要稳定的微基准测试（Microbenchmarks）来验证每一项改动，也需要 pprof 等工具进行深度剖析。正如 Jeff 和 Sanjay 所言，12% 的提升在成熟工程领域从不是微不足道的，它是构建高质量软件的基石。abseil.io/fast/hints.html