随着90nm技术的逐步普及,芯片供应商们发现必须放弃一些曾经受过时间考验的技术法则才能适应这种变化。典型的案例是Xilinx和Altera公司。这二家最大的可编程逻辑供应商在向更先进的工艺技术迈进时选择了截然不同的发展方向。
对于Altera来说,这意味着要放弃目前大多数FPGA逻辑结构中采用的基本构建模块-全能型四输入查找表(LUT)。最近该公司宣布其Stratix-II高端FPGA系列产品将采用称为自适应逻辑模块(ALM)的输入数可变结构。
而Xilinx公司仍坚持使用四输入LUT,而在业务模式上探索出另一条道路。一般情况下工艺尺寸缩小时最先考虑的应用对象应该是体积更大、价格更高的FPGA器件。但这次不同,Xilinx把转向90nm工艺的目标定为低成本的Spartan器件上,而不是高端的Virtex-II产品线。“我们想要我们能快速学到的东西。”该公司行销副总裁Sandeep Vij表示。Xilinx希望利用更小体积、更大批量器件的测试晶圆上获得关键的成品率和缺陷密度数据。
创新的自适应逻辑模块
长期以来业界一直认为四输入LUT能够很好地平衡器件的性能与成本。但用户调查显示,实际上输入分配方式多种多样,最多的输入分配是5个,Altera公司透露。就效率而言,很明显如果允许输入功能数变化的话FPGA将具备更大的灵活性。输入变多意味着可以降低互连要求,并可提升性能,而输入变少能够降低逻辑成本。
修改逻辑结构的另外一个原因是解决日益突出的功耗问题,特别是漏电流问题。如果简单地将现有结构过渡到90nm并期望用户仍使用相同数量的逻辑单元,功耗问题是很难解决的。目前最需要的是既可提升性能又不增加功耗的新结构,Altera表示。
“情况变得非常复杂。”Altera公司市场部高级行销副总裁Erik Cleage说,“人们已经认识到必须设计出一种能够同时解决上述两个问题的最优结构。”
Stratix-II中使用的ALM多少可以解决与逻辑单元最优尺寸有关的数据冲突难题。众所周知,如果互连时延变得比逻辑单元时延还要长,那么逻辑单元的优化复杂度将成倍地提高。但与此同时,逻辑单元越复杂,就越难高效地使用它们。在带有复杂逻辑发生器和多触发器的设计中,许多单元只被用到其全部容量的很少一部分。
最早提出来解决这一难题的方法是四输入查找表,简称4-LUT。多年的使用证明4-LUT能够做到良好的折衷效果。但最近的情况越来越清楚地表明,用现代工艺实现的FPGA将受益于更大的逻辑单元。理论学家已经推出了异类架构的概念:包括紧凑型3-LUT或4-LUT与更多复杂单元的逻辑构造。但这种架构设计起来很复杂,而且会引起布线和时序问题。
Altera从用户设计库中提取出的自身数据可以支持异类架构。通过检查逻辑锥形晶格,把它们映射到LUT节点,并根据每个节点最佳的输入数排序,Altera公司发现扇入分配在2个到6个输入之间是非常平坦的,在5个输入时有个非常好的峰值。
自适应逻辑块几乎完美地解决了这个问题,它既能提供类似于异类的架构,又能正确地将较大和较小的单元放置在最需要它们的地方。其逻辑单元输入侧的八输入结构可以分开使用,从而形成部分的7-LUT、完整的6-LUT、完整的5-LUT以及完整的3-LUT,或者两个4-LUT。通过复杂PLD用户所熟悉的引脚共享技术还可将器件扩展成5+4、5+5或两个部分的6-LUT。
将LUT分成两个部分并单独使用可以解决利用率不足的问题。映射软件将逻辑锥形晶格映射到逻辑单元,并决定每个节点需要的LUT宽度。然后由布局布线软件为这些单元定位,并在每个隔开的单元中放置两个节点,从而达到用完LUT所有空闲部分的目的。这样做可能会增加本地的布线密度,因为一些节点可能需要跳过几个单元才能发现空闲的4-LUT。但同时也会增加单元内逻辑的使用率,Altera表示。当需要时提供宽的输入可以戏剧性地减少在固定架构中实现宽输入功能的逻辑单元的混乱状态。
Altera认为,上述这些变化的结果是业界将转向更先进的设计规则(更多的逻辑资源、性能和带宽),同时使用更少的逻辑单元。Altera公司计划在今年推出6种Stratix-II器件,规模从15,600到179,400个逻辑单元不等,并有望于今年第二季度开始出货。
升级的Quartus II
Stratix在架构方面的变化也要求Quartus工具作出广泛而重大的改变,Altera公司软件开发部高级副总裁Misha Burich表示。“Quartus流程中的每个组成部分都需要改变,包括综合、布局和布线,也因此增加了综合工具的负担。”
Altera公司发布了4.0版Quartus II软件,该版本可支持公司的最新Stratix II FPGA产品。
Burish表示,4.0版Quartus II中的综合技术映射器了解新的LUT,并且知道如何将它们打包进ALM以获得最佳的性能和面积效率。同时他透露,Synplicity和明导资讯公司也共享这一新技术,他们的FPGA综合工具将支持Stratix II。
另外,4.0版Quartus II针对Altera的HardCopy结构化ASIC增加了缓存插入功能,因此可以获得更精确的时延估计和更高的最大频率;同时还增加了使用户可分层浏览其设计的RTL Viewer,该公司表示。
能让用户通知编译器工作难度的自适配(auto-fit)功能可以将全器件系列的编译时间最多减少50%,Altera指出。SignalTap II嵌入式逻辑分析仪增加了新的触发模式,并且其新增的存储编译器波形生成特性可图形化地支持“what if”分析,有助于加快设计进程。
4.0版Quartus II已上市,目前正在向软件签约用户交货。Altera设计软件针对节点固定PC许可证的年度订费为2千美元。
Xilinx:缺陷密度保持不变
Xilinx公司在向90nm器件转移时采取了不同的方法。该公司今年1月就开始生产两种90nm的Spartan 3系列产品,每个月的交货量超过1万片,并透露说第一季度交货量预计将达到20万片。Xilinx在向新工艺转移中必须解决多个技术障碍,其中最显著的就是蚀刻步骤中出现的难题。
虽然如此,早期量产的情况表明这次工艺进步与以前的工艺演变没什么不同。“缺陷密度与0.13和0.15微米等较早一代工艺相比基本上没什么变化。”Xilinx公司产品技术副总裁Vincent Tong表示。
不过并不是每件事都是在按计划进行。为了尽可能提高产量,Xilinx公司本来希望在300mm晶圆上验证Spartan 3,但后来为了减少风险决定只生产200mm晶圆。目前公司计划在今年中期前为90nm生产做好300mm晶圆验证工作。Xilinx公司称其目前所有的芯片生产中有50%来自于300mm晶圆。
与Altera不同,虽然Xilinx为了提升性能已在现有的Virtex架构中增加了复用器,但该公司不会对组成其逻辑构造的四输入LUT结构作任何变动。公司计划在今年晚些时候推出一款新的专用FPGA,该FPGA能将功能块分割成可互相交换的栏,而不再是栅格上的方块。
作者:赵子龙、张国勇
京公网安备 11011202001138号
