许居衍院士是物理专业出身,从物理挑战的角度看,实际上我们没有进行物理计算。物理计算最重要的是模拟计算,1960 年曾出现过,但是很快就被淹没了。许院士认为,现在应该重视涉及新的算法、编程、控制的模拟计算了。
● 摩尔定律还在延续,只是速度会减慢。过去是每18 个月性能翻一番,到2005 年时,变成每3.5 年翻一番。那时几何等比例缩小是不能用的,因玻尔兹曼统计法在物理层面行不通了。在2015 年是6 年翻一番,尽管人们做了很多的努力,例如改用了纳米制程、采用新材料等,但材料层面的量子效应出来了。到现在为止已经是要20 年翻一番(如图1)。原因之一是功耗已碰墙,因为半导体器件发热很厉害。
● 冯·诺伊曼架构已经不能满足需要。因为该架构需要不断地在存储和计算之间搬运数据,消耗了一半甚至绝大部分的工作量,而逻辑处理只占很小的部分。
因此,人们寄希望于技术创新。这些新技术需要满足的条件是:①集成度可以提高,且成本不能太高;②开关速度快;③能效高;④处理信息功能优于CMOS。这些技术从何而来?新、老技术之间有什么关联性?它们与ICT(信息与通信技术)有什么关系?
ICT 产业奠定了数字化经济的基础。ICT 制造包括元器件、计算机设备、通信设备和消费产品(如图2)。
以下是许院士的观点和分析,仅供参考。从以下引导出来的技术,与国际半导体技术发展路线图(ITRS)及其他地方的介绍是一致的。
处理技术、存储技术本质上是器件技术;通信里有协议、架构;信息处理里有计算架构、软件。所以ICT由器件、软件和架构三个部分组成(如图3)。①软件和器件组合,就是“软件定义器件”,②软件和架构的相互作用,就是“软件定义架构”,③器件和架构的相互作用产生四大技术群。
2017 年DARPA(美国国防高级研究计划局)推出“电子复兴计划”,其中提出SDH(软件定义硬件),特点是既可以像CPU 一样编程,又可以性能很高,比现在CPU 性能提高成百上千倍。2020 年代将会是“软件定义器件”的一个高峰期,举2 个例子,一个是牧村浪潮,这是牧村先生2014 年提出来,认为2017—2027年是高度灵活超级集成的时代。许居衍院士比牧村先生提前了14 年提出可重构的系统级芯片,预计在2018—2028 年芯片的灵活性/ 可重构性非常高(如图4)。
图4 许居衍院士20世纪80年代末提出、90年代初发表的“半导体特征循环”已完整提到第六波和第七波,第七波特征当时用“?”表示,2000年拉直“?”为可重构的系统级芯片[1]
即把硬件和软件分隔开来,用SDA 简化了Web Scare 的实现。Web Scare 是2013 年由市场调查公司Gartner 提出来的,指大型云服务公司必须将软件扩展到庞大的受众群体,同时保持足够的敏捷性,以具备快速适应的能力。可见SDA 重塑了信息基础架构,将成为ICT 发展的主旋律。
关于软件定义,上面已介绍了2 方面:①软件定义硬件,②软件定义架构。实际上,软件定义一切。可以用两句话概括:有限的资源,“无限”的畅想。现在人们都知道“万物皆互联,一切可编程”。“一切可编程”非常重要的一点就是应用编程接口(API),在API 之上可以编程,在接口的下面,也就是基础设施部分,没有必要时它基本上不动。软件定义的核心是API,它解耦了软、硬件之间的关系。软件定义有三大特点:①推动应用软件向个性化发展,②硬件资源向标准化发展,③系统功能向智能化发展。
器件本身是怎么组织起来的?怎么设计的?应该有多少功能块?这些功能块应该怎么运行?有了软件,软件又来影响架构。所以器件和架构是相互影响的。但是很重要的一点,器件是通过架构走向应用的。器件包括很多,有电子的、光子的、离子的、激子的,现在除了电子我们非常熟悉之外,光子、离子、激子等才刚刚开始。实际上,所有的物理粒子都可以用来做器件。
1)“硅冯”范式:硅CMOS 技术与冯·诺依曼结合目前是最重要的应用。它是0/1 模式,通过计算机的二进制计算来表征事物的特征及其演变过程。我们现在所有的东西都是这种0/1 表示。
“硅冯”范式引起了思考。在国际计算机体系结构大会ISCA2018 的图灵奖演讲会上,ACM/IEEE 邀请了2017 年图灵奖获得者John L. Hennessy 与David Patterson联合进行了一场关于未来计算机体系结构发展道路探索的演讲,二位专家展望未来10 年是架构创新的黄金时代。
2019 年,在SEMI-West 上,产业界的AMD、英伟达也提出了类似观点:灵活应变的架构将引领未来。可见,当摩尔定律逐渐终结时,体系结构正在闪耀新的活力。摩尔定律的终结可能是计算中发生的最好事情。
后摩尔时代的创新无穷。如图5,最底下是More Moore(深度摩尔)。此外,还有More than Moore(超越摩尔),包括2D/3D 封装、HC/HI(异构计算和异构集成/ 异质集成)、DSA(特定领域架构)、SDH(软件定义硬件)等。
● More Moore 从原理上看非常简单,做起来相当复杂。以前是平面的,是一个面的沟道场效应管,后来是FinFET,在3 个维度来控制沟道。再下去,3 面不行,是4 面…… 。
光刻制程现在也仍然在发展,IBM 已发布2 nm 制程,台积电预计2025 年将量产2 nm 技术芯片。现在很多人预计,除非有新的发现,到2025 年很难再做下去了。
● More than Moore 的芯粒很重要的是异构计算,用API 把CPU Host 和各种加速部件连接起来。这里强调一点,就是基于新的异构集成将会引领半导体产业进入下一个发展时期,例如基于芯粒的集成。
不管是MPU, 还是SoC、GPU、FPGA、AI、IoT等先进和高集成的芯片产品都可以做成芯粒。例如手机芯片早已是芯粒。芯粒的应用将越来越多,将用于汽车电子、消费电子、工业自动化、医疗保健、国防、信息与通信等最终用途的行业中。据Transparency Market Research 报告,2021—2031 年芯粒的年复合增长率将达36.4%,到2031 年,芯粒市场的估值将超过471.9 亿美元。
国外在芯粒方面做得较好,例如一家单位搞了硅光结合的“光芯粒(optical chiplet)”。因为光和电是非常难融合的。因此将来光芯粒会不会促进发展呢?如果可以的话,摩尔定律可能会梅开二度。芯粒有可能推进“光进铜退”。例如数据中心,用于众多服务器、内存和计算资源之间的通信连接,从而推动“在封装级实现光进铜退”。因为一些超级计算机用电传输几厘米就不得了了,但光缆可以传出去几里,这样一来,预计2023年将会很快进入大型数据中心。过去,光纤已进入了家庭、城市,现在要到芯片封装里。
2)“类硅”模式:新器件与冯·诺伊曼架构的结合现在的共识是:下一代最好的情况是能进入跟CMOS雷同的二值开关,如果是这样,摩尔定律还可以再延续一段时间。这一共识印证了许居衍院士等专家演绎的“类硅”模式是对的。
一些大公司,诸如Intel、IMEC、NRI 等认为“类硅”有两种途径:①扩展CMOS,②非CMOS 的,仍然基于电荷变换(如图6)。
3)“类脑”模式:仍然利用现有硅CMOS 器件技术,但架构不是冯·诺伊曼架构,是通过神经突触传递的。冯·诺伊曼是存算分离的,新架构是存算一体的,冯·诺伊曼的叫做程序流,它是事件流(数据处理的)。
● IBM 的TrueNorth 是一个非常著名的模拟神经网络。神经内核是4096 个核,模拟100 万个可编程神经元和2.56 亿个可编程突触。其中1 个核里包括调度器、、路由器、神经元,这里有256 个神经元(处理器)、256 个轴突(存储器)和64 k 的突触(通信)。其最主要的特色是异步计算(大脑式架构)。当然,在接口和时序方面为同步,但其他地方是异步的。异步时,当事件没有来的时候,是0,所以功耗才70 mW;如果变成同步了,大概要100 mW。
● 中科院计算所的DianNao, 如图7, 片上存储单元有NBin(保存的输入数据),NBout(保存的输出数据),SB(保存模型的权值),三者占66%。计算单元是NFU(神经功能单元), 占28%。NFU 是典型的点乘器(dot-product)方案,上面是一个点乘,下面是累加,累加以后数据有2 个输入、1 个直接输出。输出就是1 个尖峰/ 脉冲了。它的一个优势是可以存储在计算机里,然后再处理。
4)“新兴”范式:新兴架构和新器件来做(如图8)。国际半导体技术发展路线图(ITRS)上指出,新的物理粒子有激子、离子、光波。
物理态变量,除了电子电荷外,还有自旋、相位、极性、轨道对称性、磁通量、分子构型等。例如英特尔的下一代架构是量子和神经形态体系结构,许院士认为是非常重要的技术。
● 新兴器件是另类的信息处理。新兴器件包括自旋波器件(SWD)、激子器件、纳米磁性逻辑(NML)、发光器件/ 晶体管激光器(TL)。
许院士有一个非常新的观点:我们现在通过API 连接异构计算(GPU、FPGA 等),未来新兴计算在相当长的时期里也将与传统计算通过微服务(API)组成专业计算机(specialized computers)。后摩尔时代,异构计算、异构(质)集成将得到很大发展。
● 在硬件颠覆更新之前,软件定义仍将“ 吞噬一切”。但是在架构创新的时代,尤其是“新兴”范式出来以后,软件的作用还无法预测。
● 摩尔定律失效驱动了创新的“百花齐放”,现在是年轻人创业的最佳时机。尽管硅CMOS 技术和冯·诺伊曼计算架构仍将(或分别)长期主导ICT 发展,但先进器件、材料、封装和新型通信、新兴架构已经在推动/ 冲击着ICT 的变革。
● “硅冯”范式还有一定的韧性,有人说还可以维持50~100 年,仍是十分重要的。人们关心异构计算科学。
另外,许院士还谈。