英特尔和 AMD 谈 CPU 的过去、现在和未来-案例展示-长征娱乐「一家靠谱的游戏平台」

十年前，如果你要购买最好的游戏或其他用途的 CPU，你会选择 AMD 的 Athlon 64。天哪，时代变了。虽然 AMD 一直在努力重振其作为 CPU 性能领导者的辉煌岁月，但英特尔的 CPU 在过去十年中却不断壮大。如今，英特尔的 CPU 性能最佳，耗电量最少，从强大的游戏 PC 一直到轻薄的笔记本电脑和平板电脑，都表现出色——这些领域在十年前甚至还不存在。但是，如果不是 AMD 在 21 世纪初进行的创新，这种 CPU 重回主导地位可能永远不会发生，这使得该公司的失宠更加令人恼火。

AMD Athlon 64 的 64 位扩展意味着它可以运行 64 位操作系统，可以处理超过 4GB 的 RAM，同时仍能全速运行 32 位游戏和应用程序 - 当时这些都是 PC 玩家的重要考虑因素。这些扩展非常成功，以至于英特尔最终获得了它们许可，用于自己的兼容 x86-64 实现。Athlon 64 推出两年后，AMD 推出了第一款消费级多核处理器 Athlon 62 X2。它对当今 CPU 的影响不容小觑：从大型游戏机到小型手机，现在都使用具有两个或更多内核的 CPU。当我问英特尔游戏生态系统总监 Randy Stude 过去十年对 CPU 设计影响最大的是什么时，他甚至提到了这一变化。

“所以，问题的答案是核心，”Stude 告诉我。“我在英特尔工作期间经历了奔腾 IV 时代。我们遇到了该部件的发热问题，于是做出了重大转变，引进了来自以色列的一款非常高效的产品 [Core CPU]，这帮助我们夺回了性能领先地位——在很大程度上——我们已经享受了近十年的大部分时间。我们能够非常高效地添加核心，这为整个 PC 带来了一些实质性的性能提升。”

在过去十年的 CPU 开发中，这种对内核的关注占据了主导地位。在多核 CPU 推出之前，人们的关注点主要集中在提高时钟速度上。这让游戏和应用程序的性能得到了即时提升，而开发人员几乎不需要付出任何努力就可以利用它。摩尔定律（该定律指出，密集集成电路中的晶体管数量大约每两年就会翻一番）在 90 年代和 21 世纪初得到了充分体现。在 1994 年至 1998 年期间，CPU 时钟速度大幅提升了 300%。然而，到 21 世纪中期，功耗和时钟速度的改进陷入停滞，英特尔和 AMD 都在与物理定律作斗争。解决方案是引入更多内核，以便单个 CPU 可以同时执行多个任务，从而提高性能。

问题是，与提高时钟速度不同，增加内核数量需要开发人员改变代码编写方式才能提高性能。而对于游戏开发而言，这是一个缓慢的过程。

“[多核 CPU] 要求软件行业与我们一起并理解线程的概念，”Stude 说。“对于游戏来说，这是一个挑战。游戏线程化是一个更加困难的情况，我们和 AMD 都经历过。一般来说，所有事情都有一个巨大的工作量线程，到目前为止，这些工作量都是由零核处理的。其余的工作量，无论对于特定游戏来说是什么，都会由其他核心处理。如今，游戏引擎的成功有点碰运气。有些游戏，典型的主机游戏，并没有真正提高性能，没有线程或线程很少。”

“[多核 CPU] 要求软件行业与我们一起理解线程的概念。对于游戏来说，这是一个挑战。” - 英特尔

“这些平台的开发工作性质，尤其是在早期，是让你的游戏运行并发布，并且严重依赖你作为发行商拥有的游戏引擎，或者从 Crytek 和 Epic 等第三方获得的游戏引擎，”Stude 继续说道。“如果 Epic 及其控制台上的 Unreal 引擎没有线程图形管道（到目前为止，他们没有），那么你就会遇到与 PC 上相同的问题，即高度强调单核性能工作负载，然后物理和 AI 等其他所有事情都发生在其他核心上。这不是一个完全平衡的场景，因为迄今为止最大的工作负载是渲染管道。”

AMD 的问题更加突出。其 Bulldozer CPU 架构（其所有最新处理器均基于该架构的修改版本）试图通过延长 CPU 管道、增加延迟（与英特尔灾难性的 Prescott Pentium 4 的方法并无太大不同）以及通过共享调度程序和浮点单元等资源（而不是像标准多核 CPU 那样复制资源）来增加内核数量，从而提高时钟速度。不幸的是，对于 AMD 来说，Bulldozer 的高功耗意味着时钟速度受到限制，因此 CPU 依赖于利用这些多核的软件来达到可接受的性能。我问过 AMD 的游戏科学家、前英特尔和 Nvidia 员工 Richard Huddy，追求更多内核是否是正确的决定。毕竟，直到今天，英特尔的 Core 系列 CPU 一直比 AMD 的要好。

“所以如果你和游戏程序员交谈——还有其他市场——他们通常发现在两个或四个核心上共享工作很容易，”AMD 的 Huddy 说。最近五年来，人们已经改变了为多核编程的方式，以应对六核或八核。他们明白这个数字是他们需要瞄准的目标。实际上，要为游戏任务构建工作图，使其在 32 个核心或更高效的设备上运行确实非常困难。”

“核心越多，难度就越大，因此存在一个实际限制，”Huddy 继续说道。“如果我们生产 1000 核 CPU，那么人们会发现很难有效地驱动它们。有时你会有很多闲置的核心，这很困难。从程序员的角度来看，驱动一个核心非常容易。所以是的，如果我们能生产出 100 GHz 的单核处理器，我们就会拥有一台很棒的机器。但要让硅片如此快速地运行非常困难，因为我们要遵守物理定律，这让事情变得非常困难。你能做的只有忽略现实世界，最终你需要帮助程序员了解他们正在构建的约束类型。”

“我希望我们能制造出单核 CPU。事实是，如果你制造出单核 CPU，它就能充分利用 CPU 的所有功能，并以正确的方式进行扩展，那么程序员就不会觉得编程困难，但我们必须面对现实世界。”

现实世界是摩尔定律，或者更确切地说，是摩尔定律的终结。多年来，人们断断续续地谈论摩尔定律的终结，然而，英特尔和 AMD 的 CPU 产品线性能却持续大幅提升。但即将推出的英特尔 Broadwell 架构及其芯片从 22 纳米缩小到 14 纳米的计划却多次推迟，促使许多人再次呼吁摩尔定律的终结。当然，两家公司在如此小的制造工艺下工作时都面临着许多技术挑战。例如，英特尔开发了其 3D 三栅极晶体管技术（基本上允许电子通过的表面积增加三倍）来处理 22 纳米及以上工艺的漏电问题。

“过去十年——这是我们存在的重要时期，也是我们收入和单位销售额占主导地位的十年——我们被告知摩尔定律已死，物理学不允许我们继续取得这些进步，我们已经证明每个人都错了，”英特尔的斯图德说。“我是一个业余未来学家，在英特尔我学到了很多东西。我刚开始工作的那一天，我们就推出了奔腾，即使在那时，讨论的也是从芯片缩小的角度来看什么是可能的。我永远不会相信创新的速度会超过人类的大脑。”

“我并不认同没有更好的方法这一观点。我认为过去 50 年的证据表明，我们在硅工程方面还有很长的路要走。如果我们发现一种新元素或一种新工艺，将颠覆一切，那么我们认为可能实现的东西明天就可能完全被取代。我不会玩摩尔定律已死的游戏，因为我不认为它会死。也许时间线会变慢，但根据我在英特尔任职期间所见，我不能认为它会消亡。”

AMD 的 Huddy 也持有类似的观点：“摩尔定律看起来还活着，不是吗？它离消亡总是还有五年的时间。从实际角度来看，我预计到 2020 年，我们都能按照类似摩尔定律的方式生活。我们最大的问题是如何满足这个庞然大物的需求，即在这些设计中加入内存带宽。我希望 DRAM 制造商能够跟上我们的步伐，不仅为我们提供更高的密度——他们在为我们提供更多内存方面做得非常出色——而且还能让内存运行得更快。这是一个真正的问题，如果我们能够获得大量超快内存，而不必为那些总是妨碍我们的可恶的现实世界物理付出代价，那就好了。我怪他们，这一切都是 DRAM 的错！”

虽然在过去十年中，核心一直主导着 CPU 的发展，但 AMD 和英特尔都在将系统的其他部分集成到 CPU 上以提高性能和减小系统尺寸方面取得了巨大进步，最显著的就是显卡。直到最近，英特尔的集成显卡还被认为是游戏的不二之选，其性能只适用于渲染操作系统的 2D 视觉效果，而不是复杂的 3D 图形。但这种情况最近有所改变。虽然英特尔的 Iris Pro 集成显卡无法与单独的 GPU 竞争，但它们能够以可接受的帧速率和分辨率运行许多游戏。甚至还有一些围绕 Iris Pro 设计的精巧的小型游戏系统，例如技嘉的 Brix Pro。

但说到集成显卡，AMD 遥遥领先于其他公司。2004 年，AMD 收购了 ATI（尽管当时存在一些集成问题），这让该公司在性能方面取得了相当大的领先优势；AMD 的 APU 系列 CPU 内置 Radeon 显卡，是打造不带独立 GPU 的小型游戏 PC 的最佳选择。这可能只是该公司在 CPU 方面的一个小胜利，但它对公司的重点产生了重大影响。

“我们在 18 个月前就决定将重点放在图形 IP 上，”AMD 欧洲、中东和非洲地区副总裁 Darren Grasby 表示。“我们首先推动 APU 的发展，首先是 Llano，然后快速发展到今天的 Kaveri。Kaveri 是有史以来最复杂的 APU，如果你看看其中的图形性能，你不会得到高端游戏玩家的支持。但如果你看看主流甚至性能游戏，A10 Kaveri 就是你的不二之选。你不必花 1500 美元或 2000 美元购买非常高规格的游戏装备，坦率地说，主流或性能游戏玩家不会充分利用它的全部功能。”

“如果从游戏的角度考虑，玩家在寻找什么？他们希望获得显卡的计算能力。在我看来，CPU 几乎是次要的。” - AMD

“所以你对 CPU 方面的‘光环效应’的看法是正确的，”Grasby 继续说道。“显然，我们不能谈论前瞻性的路线图，但它倾向于图形 IP 在哪里，更广阔的市场在哪里，以及真正的收入机会在哪里。这就是为什么，如果你看看 Kaveri，如果你看看大众市场和游戏市场，你就会发现它就在那儿。然后你开始进入 295 X2，然后你谈论游戏玩家在哪里。如果你从游戏的角度来思考，游戏玩家在寻找什么？他们正在寻找显卡的计算能力。在我看来，CPU 几乎成为它的次要部分。”

虽然英特尔在纯 CPU 性能方面继续领先，AMD 在集成显卡方面也处于领先地位，但两家公司在移动领域都表现不佳，而随着个人电脑销量持续下滑，这个问题已经凸显。基于英国 ARM Holdings 设计的一体化芯片系统为全球绝大多数移动设备提供支持——这不仅仅意味着手机和平板电脑；索尼的 PlayStation Vita 就是基于四核 ARM 芯片构建的。英特尔一直试图坚持 X86 路线，专门为手机和平板电脑等低功耗设备打造了 Atom 系列处理器。不过，它们并没有真正引起轰动。英特尔的移动和通信集团今年早些时候亏损超过 9 亿美元。

与此同时，AMD 选择了一条不同的道路，签署了 ARM 许可，开始开发自己的 ARM 处理器。问题是，该公司的绝大部分经验都集中在 X86 架构上，为什么会这样做呢？

“你昨天看到英特尔的盈利结果了吗？[注：本次采访于 2014 年 7 月 17 日进行] 去看看他们在移动部门的损失就知道了，”AMD 的 Grasby 说。“我认为在某个阶段，他们的股东将面临挑战。我不记得确切的数字，这是公开记录，但我认为他们在 8000 万美元的营业额中损失了 11 亿美元。我们的客户认为这不是最好的策略。我鼓励他们继续这样做，因为如果他们继续损失这么多钱，那肯定不好……我们签署 ARM 许可证的主要原因是两年前我们收购了一家名为 SeaMicro 的公司。我们基本上是看中了它的 Freedom Fabric [存储服务器]，这就是我们签署 ARM 许可证的原因，以抓住密集、强大的服务器机会。这是一个巨大的机会。”

“我们一拿到 ARM 64 位许可证，其他机会就出现了。比如嵌入式。从 AMD 的角度来看，嵌入式一直是 X86 的强项。举个例子，ARM 和 X86 是一个价值 90 到 100 亿美元的产业。如果除去 ARM，价值约为 40 到 50 亿美元。这就是利用这个机会。”

尽管 AMD 做出了诸多努力，但其 ARM 战略和扭转局面的计划并未完全按计划进行。该公司在最近的财务报告中公布了 3600 万美元的净亏损，并预测其面向索尼、微软和任天堂的游戏机业务（迄今为止，这是其最大的成功之一）将在 9 月达到顶峰。消息公布后，该公司股价暴跌 18%。个人电脑市场仍在下滑，这意味着英特尔和 AMD 都在寻找在台式机之外扩张的方法，但两家公司坚持认为，他们的 CPU 产品线，尤其是针对游戏玩家和超频者的 CPU，仍然是他们业务的重要组成部分。

“超频市场当然很重要，”英特尔的斯图德说。“每当我们推出一款部件时，总有一小部分人是它的狂热爱好者。他们关心处理器的每一个细节，想要将它发挥到极致。他们是修补匠，他们不介意买几块处理器来试一下，看看它们能做什么，也为了谋生，无论是在台湾为制造主板的 ODM 工作，还是在媒体上发表他们对英特尔高端部件的看法。”

“我们喜欢它的精品性质，”Stude 继续说道，“因为坐在那个位置上的人通常具有非常有趣的计算视角，可以影响其他人的决策。所以，如果你非常擅长超频，你就拥有非常有影响力的地位……所以我们会尽最大努力为这个社区提供最好的故事，我们会继续这样做。”

英特尔和 AMD 谈 CPU 的过去、现在和未来

虽然毫无疑问 AMD CPU 具有出色的性价比（我们在预算 PC 构建中使用了一款 AMD CPU，效果非常好），但在整体性能和每瓦性能方面，它们仍然落后于英特尔；要想在 PC 市场上保持领先，AMD 面临的任务比其竞争对手艰巨得多。

“从工程角度来看，性能功耗比在很多情况下都会成为制约因素，因此毫无疑问我们需要做得更好，”AMD 的 Huddy 说道。“很明显，英特尔和 Nvidia 以及硅片市场上的所有竞争对手都必须更加意识到这一点。如果回顾 10 年前，特别是 20 年前，性能功耗比并不是一个大问题，但现在它越来越重要，我们的目标是做得更好。我对此深信不疑。人们对此给予了极大关注。我们对自己命运的控制程度是有限的，但对于我们来说，尤其是当我们像其他人一样使用台积电等公司时，这些公司与我们面临着同样的限制，我们应该能够与他们匹敌。”

“从工程角度来看，性能功耗比在很多情况下成为限制因素，因此毫无疑问我们需要做得更好。” - AMD

AMD 的未来可能不仅仅在于硬件。Mantle——其 OpenGL 和 Direct X 的竞争对手 API——允许像控制台一样对 CPU 和 GPU 进行低级访问，从与该公司的交谈中可以清楚地看出，该公司对这项技术寄予厚望，即使微软即将推出的 Direct X 12 承诺做非常类似的事情。

“很明显，人们已经看到了确实需要解决的人为限制，而这不仅仅是让 CPU 运行更多千兆赫兹，”AMD 的 Huddy 说道。“当出现人为瓶颈时，Mantle 可以消除 CPU 的阻碍，对此我们感到非常自豪。毫无疑问，人们会将额外的 CPU 马力用于好东西，我们在已经能够展示的演示中看到了这一点。但是，我们不要纠结于千兆赫兹，有时是智能让你到达那里，如果你正在寻找地球上最快的吞吐量 API，那么你必须说它是 Mantle，你必须说‘好吧，现在我明白为什么 AMD 处于领先地位’，不要只计算 CPU 千兆赫兹，还要看看我们正在提出的技术创新。”

“有趣的是，我不知道这有多重要，你可以自己做决定，对我来说这很有趣：其中一家与我们接洽的公司（关于 Mantle）是英特尔，我们对英特尔说，‘你知道吗，你能给我们一些时间，让我们完全稳定下来，因为这必须是面向未来的，但我们会在年底前发布 API 规范。’如果英特尔想要开发自己的 Mantle 驱动程序并希望为此做出贡献，他们可以自己开发。我们正在努力建设一个更美好的未来。”

欲了解有关 AMD Mantle 的更多信息，以及该公司为何认为 Nvidia 正在利用 Gameworks 技术“做一些非常令人担忧的事情”，请在本周晚些时候继续关注我们对 PC 图形最活跃公司之间正在展开的战争的观察。

案例展示

英特尔和 AMD 谈 CPU 的过去、现在和未来

天津长征娱乐信息技术有限公司

联系我们