P&R 2

时间 2020-05-10

标签 p&r 繁體版

原文原文链接

Floorplan：后端

要作好floorplan须要掌握哪些知识跟技能？网络

一般，遇到floorplan问题，大体的debug步骤跟方法有哪些？工具

如何衡量floorplan的QA?性能

Floorplan是后端实现的根本，对后续流程的影响最大，所以必须综合考量。SoC顶层的Floorplan涉及面广而杂，以此作说明较有通用性。至于模块级或IP级，能够在SoC级的基础上删减一些。学习

如下罗列各方面的因素：测试

芯片的形状和尺寸。评价芯片三大指标PPA里的A（Area）最终体如今了这里。在工艺参数必定的条件下，A越小成本越低越有竞争力。对于TSMC来讲（有的Foundry对曝光利用率并不强制要求），光有A还不够，具体的长和宽的大小也会影响成本——即所谓的MFU。太低的MFU会被额外收费，很高的MFU会有额外奖励；优化
芯片在板级的互联状况。配套的显示屏、存储、电源管理、晶体等位于哪一个方向，决定了与之相关的IO的摆放，进而影响Floorplan；spa
芯片一共有多少路电源输入，其各自是否须要单独关断。归属同一电源的模块应尽可能集中到一块儿方便封装走线以及电源网络设计；debug
封装的具体要求。封装对于PAD开口大小一般有明确的要求，其基板过孔的大小也会致使要求预留必定的位置不能开PAD口。相似存储接口这类IO较密集的位置，须要仔细考量如何同时知足信号质量以及供电等方面的要求，而且方便封装走线；设计
进入先进的深亚微米工艺以后（40nm及如下），工艺上对于不少指标有了很是细的要求，好比Poly direction等。这些需求，会致使IP出现了方向性的概念：买的IP是NS的？仍是EW的？亦或是摆放在角落里？这会涉及到项目规划和IP采购，好比NS类型的IP就只能摆放在上、下两条边，没法旋转后放在左、右两边；
IO的选型也是Floorplan的一部分，in-line / stagger模式要根据芯片的实际状况肯定，是否支持CUP要看工艺和IO库。选定IO库后，还会涉及到驱动能力的问题，通常讲对外输出的管脚对此敏感，须要用SSO的指标去评价是否带得动外部电路，具体对某一组功能IO添加多少PG IO须要通过计算和评估，另外还会涉及到ESD等，也要在Floorplan阶段规划好；
在Floorplan阶段还要结合工艺提供的可用金属层以及IR signoff标准，规划具体的PG网络设计。一般高层金属厚度大电阻小会被用于主干网，低层金属的PG会影响signal routing，要仔细计算评估strap width / spacing等，横竖strap之间的过孔会形成潜在的routing congestion，也要仔细评估如何添加。其余还包括是否要求有back-bias？SRAM或IP是否有额外的供电网络要求等；
模块的partition以及模块间的channel设计，也是Floorplan时须要关注的问题。规划时要充分考虑各模块的特性，是否timing难收敛？是否routing难度大？不一样模块规划成不一样的形状可能有利于利用顶层空间进而节省面积。Channel中要避免出现复杂逻辑以防止出现routing congestion。
细节还有不少，特定IP对周边环境的要求（好比PLL要放在尽可能远离干扰的边角附近），几组IO是作成Ring？仍是构成一个个孤岛？SRAM朝哪一个方向摆？MTCMOS摆成什么pattern，用何种方式链接？如何利用placement / routing blockage引导工具作出本身想要的结果？
要屡次迭代检查后续流程中是否有任何问题与Floorplan相关并及时调整；
Floorplan做为一个基础，直接决定了后续实现工做可以达到的高度。好的Floorplan对外符合系统的要求，不会给系统设计形成额外的麻烦，对内不会形成意外的timing问题和routing问题。坏的Floorplan对内对外都会浪费更多的资源，例如走线层数、run time、功耗等。

评价机制上，首先要知足外部系统要求和内部各种IP、库的具体使用要求，例如方位、PAD分布、间距、Pattern等。在此基础上，能够对比不一样版本的Floorplan在timing result、power、total net length等方面的差别。符合数据流向的好的Floorplan会带来好的timing / routability / power结果。

Placement:

要作好placement须要掌握哪些知识跟技能？

一般，遇到placement问题，大体的debug步骤跟方法有哪些？

如何衡量placement的QA?

除了Floorplan阶段和物理检查阶段外，PPA这三个目标都会定量的出如今各个阶段中，成为每一阶段的目标。

Placement要完成的任务是把逻辑合理的摆放到Floorplan阶段预留的空间中，尽量少的增长面积和功耗，同时知足时序要求。一方面，工程师应该了解工具的行为和方法，另外一方面，工程师应该了解待处理的对象和可用的材料。

工具的行为方法能够从运行log中看出一部分，也能够请教EDA AE。如今深亚微米的工艺愈来愈复杂，EDA对应的也提供了不少开关选项供工程师选择，不一样的开关会致使彻底不一样的结果。

待处理的对象是设计自己，是timing critial（例如高性能CPU）仍是routing critical（例如CEVA DSP core）？也包括所使用的library，不一样的library cell在时序、可绕线方面的表现彻底不一样，这须要花必定的时间研究，以便在不一样的场景下指导工具选择不一样的单元。

例如，让工具尽量均匀地把逻辑摊开，仍是尽量把相关的逻辑集成到一块儿，对timing / routability的结果会彻底不一样。这对于CPU实现和DSP实现来讲，就要求不一样的开关组合。不一样单元的pin density相差很大，所以dont use cell list等也须要斟酌。

Placement的问题一般表如今timing差，或者出现差的congestion map。debug时要具体问题具体分析，好比观察timing path、各hier module的分布状况，看是否有Floorplan不合理或是工具设置不合理致使。

评价Placement时一般看几点：

能够考虑逻辑门数的增量，因为完成了一些HFN的fixing以及一些逻辑优化，面积会有小幅的增长，具体合理的增幅与综合时是否考虑了Floorplan也有关系；
看timing result，各timing group的setup time不该该有过大的violation；
检查congestion map，确认placement legalization以后，没有出现high congestion的点等。

CTS:

要作好CTS须要掌握哪些知识跟技能？

一般，遇到CTS问题，大体的debug步骤跟方法有哪些？

如何衡量CTS的QA?

仍是先看目标，对于传统的CTS来讲，工程师须要尽量的把时钟源头产生的时钟，在同一时刻传递给所有的FF（useful skew点除外）。在实际上固然没法作到同时到达所有FF，所以有了最基本的latency / skew的概念。首先CTS的目标就是追求尽量小的skew，过大的skew会致使后续的setup/hold难以收敛；其次是追求尽量小的latency，这将会经过OCV影响timing结果，也会影响功耗。另外还有一些额外的指标须要考虑，例如上升沿和降低沿的均衡问题，一般工程师要挑选一些特定的门电路用于CTS，再好比时钟脉宽在CPU设计中有较严格的要求，这对于CTS策略也有影响，另外考虑到SI的问题，用什么样的spacing，要不要加额外的shield routing也须要考虑。

一样的，凡是用到工具的地方，都须要理解工具的行为，从log里能够看到，工具是“如何”长成clock tree的，是从根节点向leaf节点看，仍是从leaf节点向根倒推？哪些指标能够显式的影响到工具的运行结果？也要了解设计，一般SRAM、hard macro等有可能致使tree意外变长，能够重点关注。

CTS的结果若是不够好，须要分析具体是哪一个时钟出了问题（一般设计中会有不少个时钟，特别是考虑到功能模式和测试模式后）。分步长CTS是一个能够考虑的方法，以便对比先后不一样阶段时不一样tree的性能。有时也须要与Designer讨论时钟的定义是否仍有优化的空间。

评价CTS的结果，除了latency / skew外，功耗也是一个重要因素，一般clock network会占到全芯片功耗的很大一部分。另外，若是common path太短，可能会形成后续的timing fix难度较大，所以须要检查不一样分支的clock是否尽量多的使用了common path。面积增量也是一个检查的方向，过大的面积增长可能意味着比较差的CTS结果。

Route:

要作好Route须要掌握哪些知识跟技能？

一般，遇到Route问题，大体的debug步骤跟方法有哪些？

如何衡量Route的QA?

仍然是要了解工具，了解工艺。不一样金属层的厚度、电阻率都不一样，在不一样的PVT corner下会对timing带来彻底不一样的影响。

Route阶段工具能够优化的幅度已经不太大了，不少结果已经被前期Floorplan / Placement / CTS所决定，所以顺序上越靠前的步骤越应该多优化。

Double pattern的出现致使routing engine须要有一个升级，而且须要引导工具合理的使用double pattern CAD layer。除了基础的完成所有的连线外，从DFM的角度考虑，过孔的可靠性须要额外的进行优化，所以有了double via ratio的概念。实际routing完成后，工具能够看到真实的SI效应，所以timing结果须要根据实际状况进一步进行优化。

Route阶段不该该出现大的congestion意外，若是发现要仔细分析与Floorplan / Placement等阶段到底有何不一样。理论上congestion map在各步骤之间应该是连续可控的。若是发现Route有问题，包括DRC / short / open等，须要检查是否有充足的资源用于route，是否出现局部routing过于拥塞，是否与PG或Clock net相关等，以便进行局部微调，或者调整Floorplan等。

Route以后不该该出现大的timing violation和DRC violation。面积增量应该是受控的，不然须要检查约束是否合理（尤为是hold time）。

DRC:

要作好DRC须要掌握哪些知识跟技能？

一般，遇到DRC问题，大体的debug步骤跟方法有哪些？

如何衡量DRC的QA?

DRC一般被分类为前段和后段，即一般讲的base layer / metal layer。前段DRC要在较早的时间点上确认干净，因其每每与Floorplan相关，若是后期改动时间来不及。

DRC与工艺直接相关，每一代先进工艺都会引进大量的DRC rule，所以须要提早学习设计规则文件，了解Foundry有哪些要求，以便在Floorplan时即有考虑。

先进工艺下的DRC检查，除了基础的宽度、间距这些几何检查外，还混合了ESD、latch-up等链接性和电路检查。这就要求工程师熟悉设计规则的同时，清楚DRC rule file里每一个开关选项的具体含义和用法。正确的使用开关组合以及开启相应的完备的检查是DRC signoff正确的前提。

基础的DRC作debug在GUI上显示分析便可很容易，ESD等跟电路结构有关，若是本身不具有分析能力，须要请layout engineer帮忙分析。另外有不少新的DRC rule与电压等信息相关，所以输入信息的准确性也须要反复检查。

评价芯片的DRC结果，首先要划分类型：必须消灭的和能够waive的：

除了一些特定缘由引发的DRC能够waive（好比电感或敏感电路周边的density issue，或者designer确认电路自己没问题只是工具的理解有问题）外（也要跟Foundry确认），其余的DRC都要修干净。

再说几句题外话，伟哥的师傅Kimi哥说过，后端实现是“良心活儿”。这实在是一句真理。理论上说，经过了形式验证的后端数据，功能正确性就有了保证；经过了物理验证的后端数据，可生产性就有了保证；再经过timing、IR、SI等方面的signoff check，后端数据的使用正确性也有了保证。然而，做为后端工程师这时候就能够交差了么？显然不是。PPA三项指标，还能不能再作优化一些？能不能少用一层金属一层孔？能不能少用一种Vt的device？电源网络设计还能不能再robust一些？DFM recommendation rule是否能多知足一些？ESD放电路径是否能再增长一些冗余度......

若是有无限多的时间和无限多的资源，理论上能够逼近最完美的那个解。但是在实际项目里，不论是时间仍是其余资源，trade-off无处不在，所以，虽而后端实现没法从无到有的增长功能，但好的后端实现可以最大程度上保障芯片的可用性和可靠性。后端实现的“灵魂”，在于在于不断地寻找更优的可能，发自心里的想把芯片作得更强壮更好用，在于今天要比昨天作得更好。

1. PR学习笔记2
2. [PR & ML 2] [Introduction] Example: Polynomial Curve Fitting
3. PR菜鸟入门 -- PR基础教学
4. pr-安装
5. pr学习
6. PR/AUC/ROC
7. PR教程
8. github PR(Pull request)
9. ROC,AUC,PR
10. pr导出
更多相关文章...
• Thymeleaf扩展2(Say Hello) - Thymeleaf 教程
• QBC的2种检索方式 - Hibernate教程
• C# 中 foreach 遍历的用法
• RxJava操作符（二）Transforming Observables