对Verilog 初学者比较有用的整理(转自它处)

时间 2019-11-08

标签 verilog 初学者比较有用整理繁體版

原文原文链接

对Verilog 初学者比较有用的整理(转自它处)

********************************************************************************************************************html

*做者: Ian11122840 时间: 2010-9-27 09:04 *
*标题: 菜鸟作设计必看！有关如何作设计的总体思路，以及可否综合的笔记 *
*所谓综合，就是把描述语言转化成能硬件实现的电路，学verilog的时候，没有人给我说要不要考虑可否综合的问题~~~ *
*看了5本书，竟然没有一本书讲到可否综合，因此设计出来的程序彻底不能用~~~ *
*并且，书中都是讲语句的具体使用办法，例如always @()，可是何时用always，几个always之间、时序电路、逻辑电路、任务与函数何时用，却没有一本书能讲清楚。*
*这个笔记详细写了这些思路的问题，分享给新手看看，学习一种思路~~
*点击此处下载 ourdev_585849OJ54KV.doc(文件大小:720K) (原文件名:verilog_经验(适合初学者).doc) *前端

********************************************************************************************************************程序员

先记下来：
一、不使用初始化语句；
二、不使用延时语句；
三、不使用循环次数不肯定的语句，如：forever，while等；
四、尽可能采用同步方式设计电路；
五、尽可能采用行为语句完成设计；
六、always过程块描述组合逻辑，应在敏感信号表中列出全部的输入信号；
七、全部的内部寄存器都应该能够被复位；
八、用户自定义原件（UDP元件）是不能被综合的。
一：基本
Verilog中的变量有线网类型和寄存器类型。线网型变量综合成wire，而寄存器可能综合成WIRE，锁存器和触发器，还有可能被优化掉。
二：verilog语句结构到门级的映射
一、连续性赋值：assign
连续性赋值语句逻辑结构上就是将等式右边的驱动左边的结点。所以连续性赋值的目标结点老是综合成由组合逻辑驱动的结点。Assign语句中的延时综合时都将忽视。
二、过程性赋值：
过程性赋值只出如今always语句中。
阻塞赋值和非阻塞赋值就该赋值自己是没有区别的，只是对后面的语句有不一样的影响。
建议设计组合逻辑电路时用阻塞赋值，设计时序电路时用非阻塞赋值。
过程性赋值的赋值对象有可能综合成wire, latch,和flip-flop，取决于具体情况。如，时钟控制下的非阻塞赋值综合成flip-flop。
过程性赋值语句中的任何延时在综合时都将忽略。
建议同一个变量单一地使用阻塞或者非阻塞赋值。
三、逻辑操做符：
逻辑操做符对应于硬件中已有的逻辑门，一些操做符不能被综合：===、!==。
四、算术操做符：
Verilog中将reg视为无符号数，而integer视为有符号数。所以，进行有符号操做时使用integer,使用无符号操做时使用reg。
五、进位：
一般会将进行运算操做的结果比原操做数扩展一位，用来存放进位或者借位。如：
Wire [3:0] A,B;
Wire [4:0] C;
Assign C=A+B;
C的最高位用来存放进位。
六、关系运算符：
关系运算符：<,>,<=,>=
和算术操做符同样，能够进行有符号和无符号运算，取决于数据类型是reg，net仍是integer。
七、相等运算符：==，！=
注意：===和！==是不可综合的。
能够进行有符号或无符号操做，取决于数据类型
八、移位运算符：
左移，右移，右边操做数能够是常数或者是变量，两者综合出来的结果不一样。
九、部分选择：
部分选择索引必须是常量。
十、BIT选择：
BIT选择中的索引能够用变量，这样将综合成多路（复用）器。
十一、敏感表：Always过程当中，全部被读取的数据，即等号右边的变量都要应放在敏感表中，否则，综合时不能正确地映射到所用的门。
十二、IF：
若是变量没有在IF语句的每一个分支中进行赋值，将会产生latch。若是IF语句中产生了latch，则IF的条件中最好不要用到算术操做。Case语句相似。Case的条款能够是变量。
若是一个变量在同一个IF条件分支中先赎值而后读取，则不会产生latch。若是先读取，后赎值，则会产生latch。
1三、循环：
只有for-loop语句是能够综合的。
1四、设计时序电路时，建议变量在always语句中赋值，而在该always语句外使用，使综合时能准确地匹配。建议不要使用局部变量。
1五、不能在多个always块中对同一个变量赎值
1六、函数
函数表明一个组合逻辑，全部内部定义的变量都是临时的，这些变量综合后为wire。
1七、任务：
任务多是组合逻辑或者时序逻辑，取决于何种状况下调用任务。
1八、Z：
Z会综合成一个三态门，必须在条件语句中赋值
1九、参数化设计：
优势：参数可重载，不须要屡次定义模块
四：模块优化
一、资源共享：
当进程涉及到共用ALU时，要考虑资源分配问题。能够共享的操做符主要有：关系操做符、加减乘除操做符。一般乘和加不共用ALU，乘除一般在其内部共用。
二、共用表达式：
如：C=A+B;
D=G+(A+B);
二者虽然有共用的Ａ＋Ｂ，可是有些综合工具不能识别．能够将第二句改成：D=G+C；这样只需两个加法器．
三、转移代码：
如循环语句中没有发生变化的语句移出循环．
四、避免latch：
两种方法：一、在每个IF分支中对变量赋值。二、在每个IF语句中都对变量赋初值。
5：模块：
综合生成的存储器如ROM或RAM不是一种好方法，只是成堆的寄存器，很费资源。最好用库自带的存储器模块。
5、验证：
１、敏感表：
在always语句中，若是敏感表不含时钟，最好将全部的被读取的信号都放在敏感表中。
２、异步复位：
建议不要在异步时对变量读取，即异步复位时，对信号赋以常数值。

Averilog的流行,有两方面的缘由;
B verilog与VHDL相比的优势
C典型的verilog模块
D verilog语法要点

A) verilog的流行,有两方面的缘由:
1它是cadence的模拟器verilog-XL的基础,cadence的普遍流行使得verilog在90年代深刻人心;
2它在硅谷得到普遍使用;
B) verilog与VHDL相比的优势两者的关系仿佛C与FORTRAN,具体而言:
1 verilog的代码效率更高:
比较明显的对比:
VHDL在描述一个实体时采用entity/architecture模式,
verilog在描述一个实体时只需用一个"module/edumodule"语句块.
此外verilog的高效性还在不少地方体现出来;
2 verilog支持二进制的加减运算:
VHDL在进行二进制的加减运算时使用conv_***函数或者进行其余的定义,总之必须通知编译器;verilog直接用形如"c=a+b"的表示二进制的加减运算;
3综合时可控制性好:
VHDL对信号不加区分地定义为"signal",
而verilog区分为register类型的和wire类型的;
可是也有人支持VHDL,认为verilog和VHDL的关系仿佛C和C++.C)典型的verilog模块
讨论如下典型电路的verilog描述:
*与非门;
*加法器;  //即全加器
* D触发器;
*计数器; //**分频的counter
* latch;
*时序机;
*RAM; //用synopsys的
*模块引用;
*预编译;
*与非门的verilog描述以下:
//verilog使用和C语言相同的注释方法
module nd02(a1,a2,zn);//一个verilog模块老是以module开始,以endmodule 结束,nd02是模块名,a1,a2,zn是模块的3个输入输出信号
input a1,a2;  //告诉编译器a1,a2对此模块而言是输入,而且数据类型是"bit"
output zn;  //告诉编译器zn对此模块而言是输出,数据类型也是"bit"
nand  (zn,a1,a2); //我理解nand是运算符,咱们没必要深究verilog中的正式术语是什
么了吧，总之这种形式表示zn=~(a1 && a2);你必定已经想到相似的运算符还有"not","and","or","nor","xor"了吧;除了"not",括号里的信号数能够任意,例如or (z,f,g,h)表示z=f || g || h,而且延时是3个单位时间，#x表示延时x个单位时间;
endmodule

*加法器的verilog描述以下:
module ad03d1(A,B,CI,S,CO) ;
input [2:0] A,B;  //表示A,B是输入信号,而且是3位矢量,上界是2,下界是0
input CI;
output [2:0] S;
output CO;
assign {CO,S}=A+B+CI;//一对"{"和"}"表示连接,即将CO和S合并成4位矢量
endmodule

*带异步清零端的D触发器的verilog描述以下:
module dfctnb (d,cp,cdn,q,qn);
input d,cp,cdn;
output q,qn;
reg q,qn; //关键字"reg"表示q和qn是"register"类型的信号;verilog中有两种类型的信号:"register"类型和"wire"类型.你能够简单地把register类型的信号想象为某个D触发器的输出,而wire类型的的信号是组合逻辑的输出.两者的最大区别在于:你能够对register类型的信号进行定时赋值(用wait语句在特定时刻的赋值,详见下面always语句),而对于wire类型的信号则不可.
always wait (cdn==0) //表示每当cdn=0时,将要对D触发器清零,"always"和"wait"嵌套，"wait"和"@"是verilog的两个关键字,表示一旦有某事发生；则执行下面的语句块,"always"有点象C语言中的"if ... then..."，"wait"和"@"的区别:请参考本模块.wait表示本语句块的进程中止,直到"cdn=0"的条件出现才继续；我理解在verilog中,每一个最外层语句块都是一个***的进程;"@"(请看下个always语句)也表示本语句块的进程中止,直到后面定义"posedge cp"(即出现cp的上升沿)的事件出现才继续;也许wait和@能够合二为一吧,但至少到目前verilog中wait表示"条件",@表示"事件";具体运用中,wait老是用于相似"wait(xxx=1)"之类的场合,@老是用于相似"@(xxx)"或"@(posedge/negedge xxx)"之类的场合整句话的意思是"每当cdn等于0时,则做如下事情"
begin    //begin...end结构的用法相似于pascal语言
   q=0;
      qn=1;
      wait (cdn==1);
end
always @ (posedge cp)//"@(posedge cp)"中有两个关键字:"@ (x)"表示"每当事件x发
生","posedge x"表示"x的上升沿,"negedge x"表示"x的降低沿"，整句话的意思是"每当cp的上升沿,则做如下事情"
      if (cdn)  //若是cdn=1(意味着清零端无效)
      begin
               q=d;
               qn=~q;//"~"表示反相
      end
endmodule
*计数器的verilog描述以下:
module count(in,set,cp,out) ;//此计数器,在cp的上升沿将输入赋给输出,在cp的上升沿使输出加一
input [15:0] in;
input set,cp;
output [15:0] out;
reg [15:0] out;
always @ (posedge set)
out = in;
always @(posedge cp)
out = out+1;  //verilog允许一个信号同时出如今等号两端,只要它是reg类型的
endmodule

*latch的描述以下:
always @(clk or d)
if (clk) q = d;

*时序机的verilog描述以下:
always @(posedge CLK)  //D是下一个状态,Q是当前状态,e1,e2是输入,a,b是输出
Q=D;
always @(Q or othercase) begin //当Q变化或输入e1,e2变化时D要相应变化
D = Q; //note1
a = 0;
b = 0;
......
case(Q)
  q1:begin
q1 action;
if(e1)D=d1;
if(e2)D=d2;
else D=d3;
a = 1; //note 2
end
  q2:begin
b = 1;
......
end
  default:begin
a = 0;
b = 0;
......
end
end
---annotations---
note 1:
  This is a custom expression,after reset,D should be equal to Q;
note 2:
  In this state machine,a is only equal to 1 at state q1,in
  other state,a is equal to 0;
* RAM的verilog描述以下:
module ram(din,ain,dout,aout,rd,wr);//这是一个双口RAM,分别有:输入端:输入地址ain;输入数据din;上升沿有效的写信号wr;/输出端:输出地址aout;输出数据dout;高电平有效的读信号rd;
  inout [7:0] din;
  input [7:0] ain,aout;
  input rd,wr;
  output [7:0] dout;
  reg [7:0] memory [0:255]; //请注意这是存储阵列的描述方法,描述了一个共有2
56个字的存储阵列,每一个字是8位
  assign dout = rd ? memory[aout] : 8'bz; //"assign"关键字表示并行赋值语句的
开始"?"运算符的做用和在C语言中同样"8'bz"是一个常量,表示一个字节的高阻态,其中8表示长度是8bit,"'"是固定分割符,"b"表示后面的数据是以比特形式给出的,"z"表示高阻;举例:4'ha表示长4bit的数"1010"。相似的还可举出5'b10111,6'o33等等
  always @(posedge wr)
memory[ain] = din;
endmodule
*模块引用
假设在前面(能够是别的模块)定义了module ram(din,ain,dout,aout,rd,wr),则引用此
模块时只需写
ram myram(din_in_map,ain_in_map,dout_in_map,aout_in_map,rd_in_map,wr_in_map)
;
//其中"ram"是所引用的module名,"myram"是你起的instance名,"din_in_map"等等是图中的节点名,和器件(module)中的"din..."进行"虚实结合";
*预编译
相似C语言,只需写
`include "<pathname:filename>",反上撇号"`"是verilog的预编译符,相似C中的"#".
D) verilog语法要点
*基本原则
设计时应该把你的系统划分为计数器,触发器,时序机,组合逻辑等等可综合的单元,对此不一样的IC公司和EDA开发商可能根据本身的看法和经验提出不一样的要求,而且对verilog程序的细节进行本身的规定,但有一点是对的:即写硬件描述语言不象写C语言那样符合语法就行.单单符合verilog语法的程序可能被拒绝综合,甚至被拒绝模拟;
*最外层能够写什么?
这里所说的最外层是指module语句后的第一层,在这一层能够写这些可执行语句:
assign和nand等定义组合逻辑的语句,
always语句,
模块引用语句,
一些以"$"开头的系统定义语句.
特别注意不能够写if语句.if语句只能放在always内部.
不推荐写wait语句，由于不能综合.
*不能够在多个always语句中对一个信号赋值.

1. 强烈建议用同步设计
2.在设计时老是记住时序问题
3.在一个设计开始就要考虑到地电平或高电平复位、同步或异步复位、上升沿或降低沿触发等问题，在全部模块中都要遵照它
4.在不一样的状况下用if和case，最好少用if的多层嵌套（1层或2层比较合适，当在3层以上时，最好修改写法，由于这样不只能够reduce area，并且能够得到好的timing）
5.在锁存一个信号或总线时要当心，对于整个design，尽可能避免使用latch，由于在DFT时很难test。
6.确信全部的信号被复位，在DFT时，全部的FlipFlop都是controllable，
7.永远不要再写入以前读取任何内部存储器（如SRAM）
8.从一个时钟到另外一个不一样的时钟传输数据时用数据缓冲，他工做像一个双时钟FIFO（是异步的），能够用Async SRAM搭建Async FIFO。
9.在VHDL中二维数组能够使用，它是很是有用的。在VERILOG中他仅仅能够使用在测试模块中，不能被综合
10.遵照register-in register-out规则
11.像synopsys的DC的综合工具是很是稳定的，任何bugs都不会从综合工具中产生
12.确保FPGA版本与ASIC的版本尽量的类似，特别是SRAM类型，若版本一致是最理想的，可是在工做中FPGA版本通常用FPGA自带的SRAM，ASIC版本通常用厂商提供的SRAM。
13.在嵌入式存储器中使用BIST
14.虚单元和一些修正电路是必需的
15.一些简单的测试电路也是须要的，常常在一个芯片中有许多测试模块
16.除非低功耗不要用门控时钟，强烈建议不要在design中使用gate clock
17.不要依靠脚原本保证设计。可是在脚本中的一些好的约束可以起到更好的性能（例如前向加法器）
18.若是时间充裕，经过时钟作一个多锁存器来取代用MUX
19.不要用内部tri-state, ASIC须要总线保持器来处理内部tri-state，如IO cell。
20.在top level中做pad insertion
21.选择pad时要当心（如上拉能力，施密特触发器，5伏耐压等），选择合适的IO cell
22.当心由时钟误差引发的问题
23.不要试着产生半周期信号
24.若是有不少函数要修正，请一个一个地做，修正一个函数检查一个函数
25.在一个计算等式中排列每一个信号的位数是一个好习惯，即便综合工具能作
26.不要使用HDL提供的除法器
27.削减没必要要的时钟。它会在设计和布局中引发不少麻烦，大多数FPGA有1－4个专门的时钟通道

良好代码编写风格能够知足信、达、雅的要求。在知足功能和性能目标的前提下，加强代码的可读性、可移植性，首要的工做是在项目开发以前为整个设计团队创建一个命名约定和缩略语清单，以文档的形式记录下来，并要求每位设计人员在代码编写过程当中都要严格遵照。良好代码编写风格的通则归纳以下：
（1）对全部的信号名、变量名和端口名都用小写，这样作是为了和业界的习惯保持一致；对常量名和用户定义的类型用大写；
（2）使用有意义的信号名、端口名、函数名和参数名；
（3）信号名长度不要太长；
（4）对于时钟信号使用clk 做为信号名，若是设计中存在多个时钟，使用clk 做为时钟信号的前缀；
（5）对来自同一驱动源的信号在不一样的子模块中采用相同的名字，这要求在芯片整体设计时就定义好顶层子模块间连线的名字，端口和链接端口的信号尽量采用相同的名字；
（6）对于低电平有效的信号，应该以一个下划线跟一个小写字母b 或n 表示。注意在同一个设计中要使用同一个小写字母表示低电平有效；
（7）对于复位信号使用rst 做为信号名，若是复位信号是低电平有效，建议使用rst_n；
（8）当描述多比特总线时，使用一致的定义顺序，对于verilog 建议采用bus_signal[x:0]的表示；
（9）尽可能遵循业界已经习惯的一些约定。如*_r 表示寄存器输出，*_a 表示异步信号，*_pn 表示多周期路径第n 个周期使用的信号，*_nxt 表示锁存前的信号，*_z 表示三态信号等；
（10）在源文件、批处理文件的开始应该包含一个文件头、文件头通常包含的内容以下例所示：文件名，做者，模块的实现功能概述和关键特性描述，文件建立和修改的记录，包括修改时间，修改的内容等；
（11）使用适当的注释来解释全部的always 进程、函数、端口定义、信号含义、变量含义或信号组、变量组的意义等。注释应该放在它所注释的代码附近，要求简明扼要，只要足够说明设计意图便可，避免过于复杂；
（12）每一行语句独立成行。尽管VHDL 和Verilog 都容许一行能够写多个语句，当时每一个语句独立成行能够增长可读性和可维护性。同时保持每行小于或等于72 个字符，这样作都是为了提升代码得可读性；
（13）建议采用缩进提升续行和嵌套语句得可读性。缩进通常采用两个空格，如西安交通大学SOC 设计中心2 若是空格太多则在深层嵌套时限制行长。同时缩进避免使用TAB 键，这样能够避免不一样机器TAB 键得设置不一样限制代码得可移植能力；
（14）在RTL 源码的设计中任何元素包括端口、信号、变量、函数、任务、模块等的命名都不能取Verilog 和VHDL 语言的关键字；
（15）在进行模块的端口申明时，每行只申明一个端口，并建议采用如下顺序：
输入信号的clk、rst、enables other control signals、data and address signals。而后再申明输出信号的clk、rst、enalbes other control signals、data signals；
（16）在例化模块时，使用名字相关的显式映射而不要采用位置相关的映射，这样能够提升代码的可读性和方便debug 连线错误；
（17）若是同一段代码须要重复屡次，尽量使用函数，若是有可能，能够将函数通用化，以使得它能够复用。注意，内部函数的定义通常要添加注释，这样能够提升代码的可读性；
（18）尽量使用循环语句和寄存器组来提升源代码的可读性，这样能够有效地减小代码行数；
（19）对一些重要的always 语句块定义一个有意义的标号，这样有助于调试。注意标号名不要与信号名、变量名重复；
（20）代码编写时的数据类型只使用IEEE 定义的标准类型，在VHDL 语言中，设计者能够定义新的类型和子类型，可是全部这些都必须基于IEEE 的标准；
（21）在设计中不要直接使用数字，做为例外，能够使用0 和1。建议采用参数定义代替直接的数字。同时，在定义常量时，若是一个常量依赖于另外一个常量，建议在定义该常量时用表达式表示出这种关系；
（22）不要在源代码中使用嵌入式的dc_shell 综合命令。这是由于其余的综合工具并不认得这些隐含命令，从而致使错误的或较差的综合结果。即便使用Design Compiler，当综合策略改变时，嵌入式的综合命令也不如放到批处理综合文件中易于维护。这个规则有一个例外的综合命令，即编译开关的打开和关闭能够嵌入到代码中；
（23）在设计中避免实例化具体的门级电路。门级电路可读性差，且难于理解和维护，若是使用特定工艺的门电路，设计将变得不可移植。若是必须实例化门电路，咱们建议采用独立于工艺库的门电路，如SYNOPSYS 公司提供的GTECH 库包含了高质量的经常使用的门级电路；
（24）避免冗长的逻辑和子表达式；
（25）避免采用内部三态电路，建议用多路选择电路代替内部三态电路。

规则 #1: 创建时序逻辑模型时，采用非阻塞赋值语句。
规则 #2: 创建latch模型时，采用非阻塞赋值语句。
规则 #3: 在always块中创建组合逻辑模型时，采用阻塞赋值语句。
规则 #4: 在一个always块中同时有组合和时序逻辑时时，采用非阻塞赋值语句。
规则 #5: 不要在一个always块中同时采用阻塞和非阻塞赋值语句。
规则 #6: 同一个变量不要在多个always块中赋值。
规则 #7: 调用$strobe系统函数显示用非阻塞赋值语句赋的值。
规则 #8: 不要使用#0延时赋值。
组合逻辑
1，敏感变量的描述完备性
Verilog中，用always块设计组合逻辑电路时，在赋值表达式右端参与赋值的全部信号都必须在always @(敏感电平列表)中列出,always中if语句的判断表达式必须在敏感电平列表中列出。若是在赋值表达式右端引用了敏感电平列表中没有列出的信号，在综合时将会为没有列出的信号隐含地产生一个透明锁存器。这是由于该信号的变化不会马上引发所赋值的变化，而必须等到敏感电平列表中的某一个信号变化时，它的做用才表现出来，即至关于存在一个透明锁存器，把该信号的变化暂存起来，待敏感电平列表中的某一个
信号变化时再起做用，纯组合逻辑电路不可能做到这一点。综合器会发出警告。
Example1:
input a,b,c;
reg e,d;
always @(a or b or c)
begin
e=d&a&b; /*d没有在敏感电平列表中,d变化时e不会马上变化,直到a,b,c中某一个变化*/
d=e |c;
end
Example2:
input a,b,c;
reg e,d;
always @(a or b or c or d)
begin
e=d&a&b; /*d在敏感电平列表中,d变化时e马上变化*/
d=e |c;
end
2,条件的描述完备性
若是if语句和case语句的条件描述不完备，也会形成没必要要的锁存器。
Example1:
if (a==1'b1) q=1'b1;//若是a==1'b0,q=? q将保持原值不变，生成锁存器！
Example2:
if (a==1'b1) q=1'b1;
else       q=1'b0;//q有明确的值。不会生成锁存器！
Example3:
reg[1:0] a,q;
....
case (a)
   2'b00 : q=2'b00;
   2'b01 : q=2'b11;//若是a==2'b10或a==2'b11,q=? q将保持原值不变，锁存器！
endcase
Example4:
reg[1:0] a,q;
....
case (a)
   2'b00 : q=2'b00;
   2'b01 : q=2'b11;
   default: q=2'b00;//q有明确的值。不会生成锁存器！
endcase
   Verilog中端口的描述
1，端口的位宽最好定义在I/O说明中,不要放在数据类型定义中；
Example1:
module test(addr,read,write,datain,dataout)
input[7:0]  datain;
input[15:0] addr;
input    read,write;
output[7:0] dataout;  //要这样定义端口的位宽！
wire addr,read,write,datain;
reg  dataout;
Example2:
module test(addr,read,write,datain,dataout)
input  datain,addr,read,write;
output dataout;
wire[15:0] addr;
wire[7:0]  datain;
wire    read,write;
reg[7:0] dataout; //不要这样定义端口的位宽！！
2，端口的I/O与数据类型的关系：
端口的I/O          端口的数据类型
                     module内部    module外部
   input             wire       wire或reg
   output       wire或reg          wire
   inout          wire             wire
3，assign语句的左端变量必须是wire；直接用"="给变量赋值时左端变量必须是reg！
Example:
assign a=b; //a必须被定义为wire！！
********
begin
a=b; //a必须被定义为reg！
end
  VHDL中STD_LOGIC_VECTOR和INTEGER的区别
例如A是INTEGER型，范围从0到255；B是STD_LOGIC_VECTOR，定义为8位。A累加到255时，再加1就一直保持255不变，不会自动反转到0，除非令其为0；而B累加到255时，再加1就会自动反转到0。因此在使用时要特别注意！
以触发器为例说明描述的规范性
1，无置位/清零的时序逻辑
always @( posedge CLK)
   begin
   Q<=D;
   end
2，有异步置位/清零的时序逻辑
  异步置位/清零是与时钟无关的，当异步置位/清零信号到来时，触发器的输出当即  被置为1或0，不须要等到时钟沿到来才置位/清零。因此，必需要把置位/清零信号  列入always块的事件控制表达式。
always @( posedge CLK or negedge RESET)
   begin
   if (!RESET)
      Q=0;
   else
      Q<=D;
   end
3，有同步置位/清零的时序逻辑
同步置位/清零是指只有在时钟的有效跳变时刻置位/清零，才能使触发器的输出分别转换为1或0。因此，不要把置位/清零信号列入always块的事件控制表达式。可是必须在always块中首先检查置位/清零信号的电平。
always @( posedge CLK )
begin
   if (!RESET)
      Q=0;
   else
      Q<=D;
   end
结构规范性
在整个芯片设计项目中，行为设计和结构设计的编码是最重要的一个步骤。它对逻辑综合和布线结果、时序测定、校验能力、测试能力甚至产品支持都有重要的影响。考虑到仿真器和真实的逻辑电路之间的差别，为了有效的
进行仿真测试：
  1，避免使用内部生成的时钟
内部生成的时钟称为门生时钟（gated clock）。若是外部输入时钟和门生时钟同时驱动，则不可避免的二者的步调不一致，形成逻辑混乱。并且，门生时钟将会增长测试的难度和时间。
  2，绝对避免使用内部生成的异步置位/清零信号
内部生成的置位/清零信号会引发测试问题。使某些输出信号被置位或清零，没法正常测试。
3，避免使用锁存器
锁存器可能引发测试问题。对于测试向量自动生成（ATPG），为了使扫描进行，锁存器须要置为透明模式（transparent mode），反过来，测试锁存器须要构造特定的向量，这可非同通常。
  4，时序过程要有明确的复位值
使触发器带有复位端，在制造测试、ATPG以及模拟初始化时，能够对整个电路进行快速复位。
  5，避免模块内的三态/双向
内部三态信号在制造测试和逻辑综合过程当中难于处理.

近日读 J.Bhasker 的<verilog synthesis practical primer> , 受益不浅,理清了很多基础电路知识 , 记下一些 tips :
1. 过程赋值(always 中触发赋值)的变量,可能会被综合成连线或触发器或锁存器.
2.综合成锁存器的规则:
a. 变量在条件语句(if 或case)中,被赋值.
b. 变量未在条件语句的全部分支中被赋值.
c. 在always语句屡次调用之间须要保持变量值 .
以上三个条件必须同时知足.
3.综合成触发器的规则:
变量在时钟沿的控制下被赋值。
例外状况：变量的赋值和引用都仅出如今一条always语句中，则该变量被视为中
间变量而不是触发器。
4. 对于无时钟事情的always语句（即组合逻辑建模），其时间表应包括该alwa语
句引用的全部变量，不然会出现RTL与Netlist的不一致
芯片外部引脚不少都使用inout类型的，为的是节省管腿。通常信号线用作总线等双向数据传输的时候就要用到INOUT类型了。就是一个端口同时作输入和输出。 inout在具体实现上通常用三态门来实现。三态门的第三个状态就是高阻'Z'。当inout端口不输出时，将三态门置高阻。这样信号就不会由于两端同时输出而出错了,更详细的内容能够搜索一下三态门tri-state的资料.
1 使用inout类型数据,能够用以下写法:
inout data_inout;
input data_in;
reg data_reg;//data_inout的映象寄存器
reg link_data;
assign data_inout=link_data?data_reg:1’bz;//link_data控制三态门
//对于data_reg,能够经过组合逻辑或者时序逻辑根据data_in对其赋值.经过控制link_data的高低电平,从而设置data_inout是输出数据仍是处于高阻态,若是处于高阻态,则此时看成输入端口使用.link_data能够经过相关电路来控制.
2 编写测试模块时,对于inout类型的端口,须要定义成wire类型变量,而其它输入端口都定义成reg类型,这二者是有区别的.
当上面例子中的data_inout用做输入时,须要赋值给data_inout,其他状况能够断开.此时能够用assign语句实现:assign data_inout=link?data_in_t:1’bz;其中的link ,data_in_t是reg类型变量,在测试模块中赋值.
另外,能够设置一个输出端口观察data_inout用做输出的状况:
Wire data_out;
Assign data_out_t=(!link)?data_inout:1’bz;
else，in RTL
inout use in top module(PAD)
dont use inout(tri) in sub module
也就是说，在内部模块最好不要出现inout，若是确实须要，那么用两个port实现，到顶层的时候再用三态实现。理由是：在非顶层模块用双向口的话，该双向口必然有它的上层跟它相连。既然是双向口，则上层至少有一个输入口和一个输出口联到该双向口上，则发生两个内部输出单元链接到一块儿的状况出现，这样在综合时每每会出错。
对双向口，咱们能够将其理解为2个份量：一个输入份量，一个输出份量。另外还须要一个控制信号控制输出份量什么时候输出。此时，咱们就能够很容易地对双向端口建模。
例子：
CODE:
module dual_port (
....
inout_pin,
....
);
inout inout_pin;
wire inout_pin;
wire input_of_inout;
wire output_of_inout;
wire out_en;
assign input_of_inout = inout_pin;
assign inout_pin = out_en ? output_of_inout : 高阻;
endmodule
可见，此时input_of_inout和output_of_inout就能够看成普通讯号使用了。
在仿真的时候，须要注意双向口的处理。若是是直接与另一个模块的双向口链接，那么只要保证一个模块在输出的时候，另一个模块没有输出（处于高阻态）就能够了。
若是是在ModelSim中做为单独的模块仿真，那么在模块输出的时候，不能使用force命令将其设为高阻态，而是使用release命令将总线释放掉
不少初学者在写testbench进行仿真和验证的时候，被inout双向口难住了。仿真器总是提示错误不能进行。下面是我我的对inout端口写testbench仿真的一些总结，并举例进行说明。在这里先要说明一下inout口在testbench中要定义为wire型变量。
先假设有一源代码为：
module xx(data_inout , ........);
inout data_inout;
........................
assign data_inout=(! link)?datareg:1'bz;
endmodule
方法一：使用相反控制信号inout口，等于两个模块之间用inout双向口互连。这种方法要注意assign 语句只能放在initial和always块内。
module test();
wire data_inout;
reg data_reg;
reg link;
initial begin
..........
end
assign data_inout=link?data_reg:1'bz;
endmodule
方法二：使用force和release语句，但这种方法不能准确反映双向端口的信号变化，但这种方法能够反在块内。
module test();
wire data_inout;
reg data_reg;
reg link;
#xx;       //延时
force data_inout=1'bx;          //强制做为输入端口
...............
#xx;
release data_inout;       //释放输入端口
endmodule
不少读者反映仿真双向端口的时候遇到困难，这里介绍一下双向端口的仿真方法。一个典型的双向端口如图1所示。

其中inner_port与芯片内部其余逻辑相连，outer_port为芯片外部管脚，out_en用于控制双向端口的方向，out_en为1时，端口为输出方向，out_en为0时，端口为输入方向。

用Verilog语言描述以下：
module bidirection_io(inner_port,out_en,outer_port);
input out_en;
inout[7:0] inner_port;
inout[7:0] outer_port;
assign outer_port=(out_en==1)?inner_port:8'hzz;
assign inner_port=(out_en==0)?outer_port:8'hzz;
endmodule

用VHDL语言描述双向端口以下：
library ieee;
use IEEE.STD_LOGIC_1164.ALL;
entity bidirection_io is
port ( inner_port : inout std_logic_vector(7 downto 0);
out_en : in std_logic;
outer_port : inout std_logic_vector(7 downto 0) );
end bidirection_io;
architecture behavioral of bidirection_io is
begin
outer_port<=inner_port when out_en='1' else (OTHERS=>'Z');
inner_port<=outer_port when out_en='0' else (OTHERS=>'Z');
end behavioral;

仿真时须要验证双向端口能正确输出数据，以及正确读入数据，所以须要驱动out_en端口，当out_en端口为1时，testbench驱动inner_port端口，而后检查outer_port端口输出的数据是否正确；当out_en端口为0时，testbench驱动outer_port端口，而后检查inner_port端口读入的数据是否正确。因为inner_port和outer_port端口都是双向端口（在VHDL和Verilog语言中都用inout定义），所以驱动方法与单向端口有所不一样。
验证该双向端口的testbench结构如图2所示。

这是一个self-checking testbench，能够自动检查仿真结果是否正确，并在Modelsim控制台上打印出提示信息。图中Monitor完成信号采样、结果自动比较的功能。
testbench的工做过程为
1）out_en=1时，双向端口处于输出状态，testbench给inner_port_tb_reg信号赋值，而后读取outer_port_tb_wire的值，若是二者一致，双向端口工做正常。
2）out_en=0时，双向端口处于输如状态，testbench给outer_port_tb_reg信号赋值，而后读取inner_port_tb_wire的值，若是二者一致，双向端口工做正常。

用Verilog代码编写的testbench以下，其中使用了自动结果比较，随机化激励产生等技术。

`timescale 1ns/10ps
module tb();
reg[7:0] inner_port_tb_reg;
wire[7:0] inner_port_tb_wire;
reg[7:0] outer_port_tb_reg;
wire[7:0] outer_port_tb_wire;
reg out_en_tb;
integer i;

initial
begin
out_en_tb=0;
inner_port_tb_reg=0;
outer_port_tb_reg=0;
i=0;
repeat(20)
begin
#50
i=$random;
out_en_tb=i[0]; //randomize out_en_tb
inner_port_tb_reg=$random; //randomize data
outer_port_tb_reg=$random;
end
end

//**** drive the ports connecting to bidirction_io
assign inner_port_tb_wire=(out_en_tb==1)?inner_port_tb_reg:8'hzz;
assign outer_port_tb_wire=(out_en_tb==0)?outer_port_tb_reg:8'hzz;

//instatiate the bidirction_io module
bidirection_io bidirection_io_inst(.inner_port(inner_port_tb_wire),
.out_en(out_en_tb),
.outer_port(outer_port_tb_wire));

//***** monitor ******
always@(out_en_tb,inner_port_tb_wire,outer_port_tb_wire)
begin
#1;
if(outer_port_tb_wire===inner_port_tb_wire)
begin
$display("\n **** time=%t ****",$time);
$display("OK! out_en=%d",out_en_tb);
$display("OK! outer_port_tb_wire=%d,inner_port_tb_wire=%d",
outer_port_tb_wire,inner_port_tb_wire);
end
else
begin
$display("\n **** time=%t ****",$time);
$display("ERROR! out_en=%d",out_en_tb);
$display("ERROR! outer_port_tb_wire != inner_port_tb_wire" );
$display("ERROR! outer_port_tb_wire=%d, inner_port_tb_wire=%d",
outer_port_tb_wire,inner_port_tb_wire);
end
end
endmodule

今天从新回顾了一下阻塞赋值和非阻塞赋值的概念，感受又有所收获。
1、特色：
阻塞赋值：一、RHS的表达式计算和LHS的赋值更新，这两个动做之间不能插入其余动做，即所谓计算完毕，当即更新。
         二、所谓阻塞就是指在一个“begin...end”块中的多个阻塞赋值语句内，只有上一句彻底执行完毕后，才会执行下一语句，不然阻塞程序的执行。
非阻塞赋值：RHS的表达式计算和LHS的赋值更新分两个节拍执行，首先，应该是RHS的表达式计算，获得新值后并不当即赋值，而是放在事件队列中等待，直到
            当前仿真时刻的后期才执行（缘由下文会提到）。
2、Verilog的分层事件队列：
在Verilog中，事件队列能够划分为5个不一样的区域，不一样的事件根据规定放在不一样的区域内，按照优先级的高低决定执行的前后顺序，下表就列出了部分Verilog分层事件队列。其中，活跃事件的优先级最高（最早执行），而监控事件的优先级最低，并且在活跃事件中的各事件的执行顺序是随机的（注：为方便起见，在通常的仿真器中，对同一区域的不一样事件是按照调度的前后关系执行的）。

当前仿真
时间事件

活跃事件    阻塞赋值，非阻塞赋值的RHS计算……

非活跃事件

显式0延时的阻塞赋值……

非阻塞赋值更新事件

由非阻塞语句产生的一个非阻塞赋值更新事件，并被调入当前仿真时刻。

监控事件

$monitor和$strobe等系统任务

未来仿真
时间事件         被调度到未来仿真时间的事件

3、结论：
由上表就能够知道，阻塞赋值属于活跃事件，会马上执行，这就是阻塞赋值“计算完毕，马上更新”的缘由。此外，因为在分层事件队列中，只有将活跃事件中排在前面的事件调出，并执行完毕后，才可以执行下面的事件，这就能够解释阻塞赋值的第二个特色。
一样是由上表知，非阻塞赋值的RHS计算属于活跃事件，而非阻塞赋值更新事件排在非活跃事件以后，所以只有仿真队列中全部的活跃事件和非活跃事件都执行完毕后，才轮到非阻塞赋值更新事件，这就是非阻塞赋值必须分两拍完成的缘由。

以上就是我今天的读书笔记，写得仓促，若有不对，敬请指出。

一. 强调Verilog代码编写风格的必要性。
强调Verilog代码编写规范，常常是一个不太受欢迎的话题，但倒是很是有必要的。
每一个代码编写者都有本身的编写习惯，并且都喜欢按照本身的习惯去编写代码。与本身编写风格相近的代码，阅读起来容易接受和理解。相反和本身编写风格差异较大的代码，阅读和接受起来就困难一些。
曾有编程大师总结说，一个优秀的程序员，能维护的代码长度大约在1万行数量级。代码的整洁程度，很大程度上影响着代码的维护难度。
遵循代码编写规范书写的代码，很容易阅读、理解、维护、修改、跟踪调试、整理文档。相反代码编写风格随意的代码，一般晦涩、凌乱，会给开发者本人的调试、修改工做带来困难，也会给合做者带来很大麻烦。
（实际上英文Coding Style有另外一层涵义，更偏重的是，某一个电路，用那一种形式的语言描述，才能将电路描述得更准确，综合之后产生的电路更合理。本文更偏重的是，编写Verilog代码时的书写习惯。）

二. 强调编写规范的宗旨。
缩小篇幅
提升整洁度
便于跟踪、分析、调试
加强可读性，帮助阅读者理解
便于整理文档
便于交流合做
三. 变量及信号命名规范。
1. 系统级信号的命名。
系统级信号指复位信号，置位信号，时钟信号等须要输送到各个模块的全局信号；系统信号以字符串Sys开头。
2. 低电平有效的信号后一概加下划线和字母n。如：SysRst_n；FifoFull_n；
3. 通过锁存器锁存后的信号，后加下划线和字母r，与锁存前的信号区别。如CpuRamRd信号，经锁存后应命名为CpuRamRd_r。
低电平有效的信号通过锁存器锁存后，其命名应在_n后加r。如CpuRamRd_n信号，经锁存后应命名为CpuRamRd_nr
多级锁存的信号，可多加r以标明。如CpuRamRd信号，经两级触发器锁存后，应命名为CpuRamRd_rr。
4. 模块的命名。
在系统设计阶段应该为每一个模块进行命名。命名的方法是，将模块英文名称的各个单词首字母组合起来，造成3到5个字符的缩写。若模块的英文名只有一个单词，可取该单词的前3个字母。各模块的命名以3个字母为宜。例如：
Arithmatic Logical Unit模块，命名为ALU。
Data Memory Interface模块，命名为DMI。
Decoder模块，命名为DEC。

5. 模块之间的接口信号的命名。
全部变量命名分为两个部分，第一部分代表数据方向，其中数据发出方在前，数据接收方在后，第二部分为数据名称。
两部分之间用下划线隔离开。
第一部分所有大写，第二部分全部具备明确意义的英文名所有拼写或缩写的第一个字母大写，其他部分小写。
举例：CPUMMU_WrReq，下划线左边是第一部分，表明数据方向是从CPU模块发向存储器管理单元模块（MMU）。下划线右边Wr为Write的缩写，Req是Request的缩写。两个缩写的第一个字母都大写，便于理解。整个变量连起来的意思就是CPU发送给MMU的写请求信号。
模块上下层次间信号的命名也遵循本规定。
若某个信号从一个模块传递到多个模块，其命名应视信号的主要路径而定。
6. 模块内部信号：
模块内部的信号由几个单词链接而成，缩写要求能基本代表本单词的含义；
单词除经常使用的缩写方法外（如：Clock->Clk, Write->Wr, Read->Rd等），一概取该单词的前几个字母（如：Frequency->Freq, Variable->Var 等）；
每一个缩写单词的第一个字母大写；
若遇两个大写字母相邻，中间添加一个下划线（如DivN_Cntr）；
举例：SdramWrEn_n；FlashAddrLatchEn;
四. 编码格式规范。
1. 分节书写，各节之间加1到多行空格。如每一个always,initial语句都是一节。每节基本上完成一个特定的功能，即用于描述某几个信号的产生。在每节以前有几行注释对该节代码加以描述，至少列出本节中描述的信号的含义。
2. 行首不要使用空格来对齐，而是用Tab键，Tab键的宽度设为4个字符宽度。行尾不要有多余的空格。
3. 注释。
使用//进行的注释行以分号结束；
使用/* */进行的注释，/*和*/各占用一行，而且顶头；
例：
// Edge detector used to synchronize the input signal；
4. 空格的使用：
不一样变量，以及变量与符号、变量与括号之间都应当保留一个空格。
Verilog关键字与其它任何字符串之间都应当保留一个空格。如：
Always @ (……)
使用大括号和小括号时，前括号的后边和后括号的前边应当留有一个空格。
逻辑运算符、算术运算符、比较运算符等运算符的两侧各留一个空格，与变量分隔开来；单操做数运算符例外，直接位于操做数前，不使用空格。
使用//进行的注释，在//后应当有一个空格；注释行的末尾不要有多余的空格。
例：
assign SramAddrBus = { AddrBus[31:24], AddrBus[7:0] };
assign DivCntr[3:0] = DivCntr[3:0] + 4’b0001;
assign Result = ~Operand;

5. 同一个层次的全部语句左端对齐；Initial、always等语句块的begin关键词跟在本行的末尾，相应的end关键词与Initial、always对齐；这样作的好处是避免因begin独占一行而形成行数太多；
例：
always @ ( posedge SysClk or negedge SysRst ) begin
if( !SysRst ) DataOut <= 4'b0000;
else if( LdEn ) begin
DataOut <= DataIn;
End
else DataOut <= DataOut + 4'b0001;
end
6. 不一样层次之间的语句使用Tab键进行缩进，每加深一层缩进一个Tab；
8. 在endmodule，endtask，endcase等标记一个代码块结束的关键词后面要加上一行注释说明这个代码块的名称；
9. 在task名称前加tsk以示标记。在function的名称前加func以示标记。例如：
task tskResetSystem；
……
endtask //of tskResetSystem
五．小结：
以上列出的代码编写规范没法覆盖代码编写的方方面面，还有不少细节问题，须要在实际编写过程当中加以考虑。而且有些规定也不是绝对的，须要灵活处理。并非律条，可是在一个项目组内部、一个项目的进程中，应该有一套相似的代码编写规范来做为约束。
总的方向是，努力写整洁、可读性好的代码

二．reg型
在“always”块内被赋值的每个信号都必须定义成reg型。
reg型数据的缺省初始值是不定值。
reg型只表示被定义的信号将用在“always”块内，理解这一点很重要。并非说reg型信号必定是寄存器或触发器的输出。虽然reg型信号经常是寄存器或触发器的输出，但并不必定老是这样。

三．memory型
memory型数据是经过扩展reg型数据的地址范围来生成的。其格式以下：

reg [n-1:0] 存储器名[m-1:0]；
或 reg [n-1:0] 存储器名[m:1]；

在这里，reg[n-1:0]定义了存储器中每个存储单元的大小，即该存储单元是一个n位的寄存器。存储器名后的[m-1:0]或[m:1]则定义了该存储器中有多少个这样的寄存器。
reg [7:0] mema[255：0];

这个例子定义了一个名为mema的存储器，该存储器有256个8位的存储器。该存储器的地址范围是0到255。注意：对存储器进行地址索引的表达式必须是常数表达式。
尽管memory型数据和reg型数据的定义格式很类似，但要注意其不一样之处。如一个由n个1位寄存器构成的存储器组是不一样于一个n位的寄存器的。见下例：

reg [n-1:0] rega; //一个n位的寄存器
reg mema [n-1:0]; //一个由n个1位寄存器构成的存储器组

一个n位的寄存器能够在一条赋值语句里进行赋值，而一个完整的存储器则不行。见下例：

rega =0; //合法赋值语句
mema =0; //非法赋值语句

若是想对memory中的存储单元进行读写操做，必须指定该单元在存储器中的地址。下面的写法是正确的。
mema[3]=0; //给memory中的第3个存储单元赋值为0。
3.3.1.基本的算术运算符

在Verilog HDL语言中，算术运算符又称为二进制运算符，共有下面几种：
1)    + (加法运算符,或正值运算符,如 rega＋regb，＋3)
2)    －(减法运算符，或负值运算符，如 rega－3,－3)
3)    ×(乘法运算符，如rega*3)
4)    / (除法运算符，如5/3)
5)    % (模运算符，或称为求余运算符，要求％两侧均为整型数据。如7％3的值为1)

注意：在进行算术运算操做时，若是某一个操做数有不肯定的值x，则整个结果也为不定值x。
1)    ~       //取反
2)    &       //按位与
3)    |       //按位或
4)    ^       //按位异或
5)    ^~       //按位同或(异或非)
在Verilog HDL语言中存在三种逻辑运算符:
1)    && 逻辑与
2)    || 逻辑或
3)    ! 逻辑非

关系运算符共有如下四种：

a < b    a小于b
a > b    a大于b
a <= b    a小于或等于b
a >= b    a大于或等于b

3.3.5.等式运算符
3.3.6.移位运算符
3.3.7.位拼接运算符(Concatation)
3.3.10.关键词
在Verilog HDL中，全部的关键词是事先定义好的确认符,用来组织语言结构。关键词是用小写字母定义的,所以在编写原程序时要注意关键词的书写,以免出错。下面是Verilog HDL中使用的关键词(请参阅附录：Verilog语言参考手册)：

always， and， assign，begin，buf，bufif0，bufif1，case，casex，casez，cmos，deassign，default，defparam，disable，edge，else，end，endcase，endmodule，endfunction，endprimitive, endspecify, endtable， endtask， event， for， force， forever， fork， function，highz0， highz1, if，initial, inout, input，integer，join,large，macromodule，medium，module，nand，negedge，nmos，nor，not，notif0，notifl, or, output, parameter, pmos, posedge, primitive, pull0, pull1, pullup, pulldown, rcmos, reg, releses, repeat, mmos, rpmos, rtran, rtranif0,rtranif1,scalared,small，specify，specparam，strength，strong0, strong1, supply0, supply1, table, task, time, tran, tranif0, tranif1, tri, tri0, tri1, triand, trior， trireg，vectored，wait，wand，weak0，weak1，while， wire，wor, xnor， xor

(1).非阻塞(Non_Blocking)赋值方式( 如 b <= a; )
1)    块结束后才完成赋值操做。
2)    b的值并非马上就改变的。
3)    这是一种比较经常使用的赋值方法。（特别在编写可综合模块时）

(2).阻塞(Blocking)赋值方式( 如 b = a; )
1)    赋值语句执行完后,块才结束。
2)    b的值在赋值语句执行完后马上就改变的。
3)    可能会产生意想不到的结果。

一．顺序块
顺序块有如下特色：
1)    块内的语句是按顺序执行的，即只有上面一条语句执行完后下面的语句才能执行。
2)    每条语句的延迟时间是相对于前一条语句的仿真时间而言的。
3)    直到最后一条语句执行完，程序流程控制才跳出该语句块。
顺序块的格式以下：
begin
语句1;
语句2;
......
语句n;
end
其中：
       块名即该块的名字，一个标识名。其做用后面再详细介绍。
       块内声明语句能够是参数声明语句、reg型变量声明语句、integer型变量声明语句、real型变量声明语句。

二．并行块
并行块有如下四个特色：
1)    块内语句是同时执行的，即程序流程控制一进入到该并行块，块内语句则开始同时并行地执行。
2)    块内每条语句的延迟时间是相对于程序流程控制进入到块内时的仿真时间的。
3)    延迟时间是用来给赋值语句提供执行时序的。
4)    当按时间时序排序在最后的语句执行完后或一个disable语句执行时，程序流程控制跳出该程序块。

并行块的格式以下：
fork
语句1;
语句2;
.......
语句n;
join
其中：
•       块名即标识该块的一个名字，至关于一个标识符。
•       块内说明语句能够是参数说明语句、reg型变量声明语句、integer型变量声明语句、real型变量声明语句、time型变量声明语句、事件(event)说明语句。

在fork_join块内，各条语句没必要按顺序给出，所以在并行块里，各条语句在前仍是在后是可有可无的。见下例：

三．块名
在VerilgHDL语言中，能够给每一个块取一个名字，只需将名字加在关键词begin或fork后面便可。这样作的缘由有如下几点。
1)    这样能够在块内定义局部变量，即只在块内使用的变量。
2)    这样能够容许块被其它语句调用，如被disable语句。
3)    在Verilog语言里，全部的变量都是静态的，即全部的变量都只有一个惟一的存储地址，所以进入或跳出块并不影响存储在变量内的值。
基于以上缘由，块名就提供了一个在任何仿真时刻确认变量值的方法。

casez语句用来处理不考虑高阻值z的比较过程，casex语句则将高阻值z和不定值都视为没必要关心的状况。

若是用到if语句，最好写上else项。若是用case语句，最好写上default项。遵循上面两条原则，就能够避免发生这种错误，使设计者更加明确设计目标，同时也加强了Verilog程序的可读性。
3.6.循环语句

在Verilog HDL中存在着四种类型的循环语句，用来控制执行语句的执行次数。

1) forever 连续的执行语句。
2) repeat 连续执行一条语句 n 次。
3) while 执行一条语句直到某个条件不知足。若是一开始条件即不知足(为假)，
         则语句一次也不能被执行。
4) for经过如下三个步骤来决定语句的循环执行。
a)    先给控制循环次数的变量赋初值。
b)    断定控制循环的表达式的值，如为假则跳出循环语句，如为真则执行指定的语句后，转到第三步。
c)

＃1:当为时序逻辑建模，使用“非阻塞赋值”。
＃2:当为锁存器（latch）建模，使用“非阻塞赋值”。
＃3:当用always块为组合逻辑建模，使用“阻塞赋值”
＃4:当在同一个always块里面既为组合逻辑又为时序逻辑建模，使用“非阻塞赋值”。
＃5:不要在同一个always块里面混合使用“阻塞赋值”和“非阻塞赋值”。
＃6:不要在两个或两个以上always块里面对同一个变量进行赋值。
＃7:使用$strobe以显示已被“非阻塞赋值”的值。
＃8:不要使用＃0延迟的赋值。
#9:在VERILOG语法中， if...else if ... else 语句是有优先级的，通常说来第一个IF的优先级最高，最后一个ELSE的优先级最低。若是描述一个编码器，在XILINX的XST综合参数就有一个关于优先级编码器硬件原语句的选项Priority Encoder Extraction. 而CASE语句是"平行"的结构，全部的CASE的条件和执行都没有“优先级”。而创建优先级结构会消耗大量的组合逻辑，因此若是可以使用CASE语句的地方，尽可能使用CASE替换IF...ELSE结构。
#10:XILINX的底层可编程硬件资源叫SLICE，由2个FF和2个LUT组成。 FF触发器  LUT查找表
ALTERA的底层可编程硬件资源叫LE,  由1个FF和1个LUT组成。
#11:慎用锁存器(latch)，同步时序设计要尽可能避免使用锁存器，综合出非目的性latch的主要缘由在于不彻底的条件判断句。另一种状况是设计中有组合逻辑的反馈环路(combinatorial feedback loops)。
#12:状态机的通常设计原则，Biary, gray-code 编码使用最少的触发器，较多的组合逻辑。而one-hot编码反之。因此CPLD多使用GRAY-CODE, 而FPGA多使用ONE-HOT编码。另外一方面，小型设计使用GRAY-CODE和BINARY编码更有效，而大型状态机使用ONE-HOT更有效。
#13:业界主流CPLD产品是lattice的LC4000系列和ALTERA的MAX3000系列。
#14:复位使初始状态可预测，防止出现禁用状态。FPGA 和CPLD 的复位信号采用异步低电平有效信号，链接到其全局复位输入端，使用专用路径通道,复位信号必须链接到FPGA 和CPLD 的全局复位管脚。。
#15:不要用时钟或复位信号做数据或使能信号，也不能用数据信号做为时钟或复位信号，不然HDL 综合时会出现时序验证问题。信号穿过期钟的两半个周期时，要在先后分别取样；防止出现半稳定状态。
#16：fpga设计中不要使用门时钟（don't use gated clock）。时钟信号必须链接到全局时钟管脚上。
#17：不要使用内部三态信号，不然增长功耗。
#18：只使用同步设计，不要使用延时单元。
#19：避免使用负延触发的双稳态多谐振荡器（flip flop）。
#20:不要使用信号和变量的默认值（或初始值），用复位脉冲初始化
信号和变量。
#21:不要在代码中使用buffer 类型的端口读取输出数据；要使用out 类型，再增长另外变量或信号，以获取输出值。
这是由于buffer 类型的端口不能链接到其余类型的端口上，所以buffer 类型就会在整个设计的端口中传播下去。
#22:对变量要先读后写；若是先写后读，就会产生长的组合逻辑和锁存器（或寄存器）。这是由于变量值是当即获取的。
#23:在组合逻辑进程中，其敏感向量标中要包含全部要读取得信号；这是为了防止出现没必要要的锁存器。

近期，在stephen Brown的一本书数字逻辑基础与verilog设计一书中看到关于触发器电路的时序分析。之前一直没有搞明白这个问题，如今以为豁然开朗。怕忘记了，特意摘抄与此与edacn网友分享。
触发器电路的时序分析：
图7-84给出了一个使用D触发器的简单电路。咱们想要计算该电路能正常工做的最大的时钟频率Fmax，而且想肯定该电路的保持时间是否不够长。在技术文献中，这种类型的电路分析一般叫作时序分析。假设该触发器的时序参数为：tsu=0.6ns，th=0.4ns，0.8ns<=tcQ<=1.0ns。给tcq参数规定一个范围是由于延迟参数分布在必定范围内，这样处理是现成集成电路芯片经常使用的方法。为了计算最小的时钟信号周期Tmin=1/Fmax，咱们必须考虑在触发器中从开始到结束的全部路径。在这个简单的电路中，只有一条这样的路径，这条路径开始于数据被时钟信号的正跳变沿加载进入触发器，通过tcQ的延迟后传播到Q的输出端，再传播经过非门，同时必须知足D输入端的创建时间要求。所以：
Tmin=tcQ+tNOT+tsu
因为咱们关注的只是计算出最长的延迟时间，因此应该用tcQ的最大值。为了计算出tNOT，咱们将假设经过任何逻辑门的延迟均可以用1+0.1k进行计算，其中k是该门的输入信号的个数。对非门而言，k=1，所以获得以下Tmin和Fmax的值：Tmin=1.0+1.1+0.6=2.7ns
Fmax=1/2.7ns=370.37MHz
固然，有必要检查电路中的保持时间是否违反规定。在这种场合，咱们必须核查从时钟信号的正跳变沿到D输入值改变的最短延迟。该延迟由tcQ+tNOT=0.8+1.1=1.9ns给定。由于1.9ns>0.4ns，因此保持时间够长，没有违反规定。再举一个触发器电路时序分析的例子，请考虑图7-85所示的计数器电路。假设所用的触发器的时序参数与图7-84中用过的触发器相同，请计算该电路能正常运行的最高频率。再次假设经过逻辑门的传播延迟能够用1+0.1k来计算。
在这个电路中，存在着四个触发器从开始到结束的许多路径。最长的路径从触发器Q0起到触发器Q3结束。在某个电路中最长的路径成为关键路径。关键路径的延迟包括触发器Q0的时钟信号到Q的延迟、经过三个与门的传播延迟和一个异或门的延迟。咱们还必须考虑触发器Q3的创建时间。所以，获得
Tmin=tcQ+3(tAND)+tXOR+tsu
用tcQ的最大值，获得
Tmin=1.0+3(1.2)+1.2+0.6=6.4ns
Fmax=1/6.4ns=156.25MHz
该电路的最短路径是从每一个触发器经过异或门反馈到该触发器自己的输入端。沿每一个这样路径的最小延迟为tcQ+tXOR=0.8+1.2=2.0ns。由于2.0ns>th=0.4ns，所以保持时间足够长，没有违反规定。
   在上面的分析中，假设时钟信号同时到达全部四个触发器。咱们如今将重复这个分析，假设时钟信号同时到达触发器Q0,Q1,Q2，但到达触发器Q3有一些延迟。始终到达不一样的触发器之间的时间差称为时钟误差(clock skew)，记做tskew，时钟误差能够由许多缘由引发。
   在图7-85中，电路的关键路径是从触发器Q0起到触发器Q3。然而，Q3的时钟误差使得这个延迟减小，由于时钟误差在数据被加载进该触发器前提供了附加的时间。若是考虑增长1.5ns的时钟误差，则从触发器Q0到触发器Q3的路径延迟由tcQ+3(tAND)+tXOR+tsu-tskew=6.4-1.5ns=4.9ns给定。该电路如今还存在一个不一样的关键路径，该路径从触发器Q0起到触发器Q2结束。这条路径的延迟为
Tmin=tcQ+2(tAND)+tXOR+tsu=1.0+2(1.2)+1.2+0.6ns=5.2ns
Fmax=1/5.2ns=192.31MHz
   在这种场合，时钟误差致使电路的最高时钟频率提升。可是，若是时钟误差是负的，即触发器Q3的时钟到达时间比其余触发器更早一些，则会形成该电路的最高时钟频率Fmax下降。
   由于数据加载到触发器Q3被时钟误差延迟了，因此对全部起始于Q0，Q1，Q2而以Q3为结束点的路径，都会产生使触发器Q3的保持时间须要增长到th+tskew的影响。在该电路中，这种最短的路径是从触发器Q2到Q3的路径，其延迟时间为TcQ+tAND+tXOR=0.8+1.2+1.2=3.2ns。由于3.2ns>th+tskew=1.9ns，因此保持时间足够长，没有违反规定。
若是对时钟误差值tskew>=3.2-th=2.8ns，重复以上保持时间的分析，则会出现保持时间不够的状况。当tskew>=2.8ns时，该电路将不可能在任何频率下可靠地运行。因为时钟误差的存在会引发电路时序问题，因此好的电路设计方法必须保证时钟信号到达全部触发器的误差尽量小。
最后是个人总结：肯定最小周期是找关键路径即最长路径。肯定Th是否违例是找最短路径。最短路径要大于Th。若是有Tskew的状况则要大于Th+Tskew（有skew的寄存器为最短路径的终点的时候）
还有就是我对有Tskew的状况的时候为何防止违例要最短路径>Th+Tskew。由于Q0，Q1和Q2时钟比Q3早，以他们为起点的路径已经开始走了一段时间后Q3的时钟才到才开始打入数据。因此保持时间上要加上这段skew

ISE 约束文件的基本操做
1．约束文件的概念

FPGA设计中的约束文件有3类：用户设计文件（.UCF文件）、网表约束文件（.NCF文件）以及物理约束文件（.PCF文件），能够完成时序约束、管脚约束以及区域约束。3类约束文件的关系为：用户在设计输入阶段编写UCF文件，而后UCF文件和设计综合后生成NCF文件，最后再通过实现后生成PCF 文件。本节主要介绍UCF文件的使用方法。

UCF文件是ASC 2码文件，描述了逻辑设计的约束，能够用文本编辑器和Xilinx约束文件编辑器进行编辑。NCF约束文件的语法和UCF文件相同，两者的区别在于： UCF文件由用户输入，NCF文件由综合工具自动生成，当两者发生冲突时，以UCF文件为准，这是由于UCF的优先级最高。PCF文件能够分为两个部分：一部分是映射产生的物理约束，另外一部分是用户输入的约束，一样用户约束输入的优先级最高。通常状况下，用户约束都应在UCF文件中完成，不建议直接修改 NCF文件和PCF文件。

2．建立约束文件

约束文件的后缀是.ucf，因此通常也被称为UCF文件。建立约束文件有两种方法，一种是经过新建方式，另外一种则是利用过程管理器来完成。

第一种方法：新建一个源文件，在代码类型中选取“Implementation Constrains File”，在“File Name”中输入“one2two_ucf”。单击“Next”按键进入模块选择对话框，选择模块“one2two”，而后单击“Next”进入下一页，再单击“Finish”按键完成约束文件的建立。

第二种方法：在工程管理区中，将“Source for”设置为“Synthesis/Implementation”。“Constrains Editor”是一个专用的约束文件编辑器，双击过程管理区中“User Constrains”下的“Create Timing Constrains”就能够打开“Constrains Editor”，其界面如图所示：

图启动Constrains Editor引脚约束编辑

在“Ports”选项卡中能够看到，全部的端口都已经罗列出来了，若是要修改端口和FPGA管脚的对应关系，只须要在每一个端口的“Location”列中填入管脚的编号便可。例如在UCF文件中描述管脚分配的语法为：

      NET “端口名称” LOC = 引脚编号;

须要注意的是，UCF文件是大小敏感的，端口名称必须和源代码中的名字一致，且端口名字不能和关键字同样。可是关键字NET是不区分大小写的。

3．编辑约束文件

在工程管理区中，将“Source for”设置为“Synthesis/Implementation”，而后双击过程管理区中“User Constrains”下的“Edit Constraints (Text)”就能够打开约束文件编辑器，以下图所示，就会新建当前工程的约束文件。


图用户约束管理窗口

UCF文件的语法说明
1．语法
      UCF文件的语法为：
{NET|INST|PIN} "signal_name" Attribute;
其中，“signal_name”是指所约束对象的名字，包含了对象所在层次的描述；“Attribute”为约束的具体描述；语句必须以分号“；”结束。能够用“#”或“/* */”添加注释。须要注意的是：UCF文件是大小写敏感的，信号名必须和设计中保持大小写一致，但约束的关键字能够是大写、小写甚至大小写混合。例如：
NET "CLK" LOC = P30;
“CLK”就是所约束信号名，LOC = P30；是约束具体的含义，将CLK信号分配到FPGA的P30管脚上。

对于全部的约束文件，使用与约束关键字或设计环境保留字相同的信号名会产生错误信息，除非将其用" "括起来，所以在输入约束文件时，最好用" "将全部的信号名括起来。

2．通配符
在UCF文件中，通配符指的是“*”和“?”。“*”能够表明任何字符串以及空，“?”则表明一个字符。在编辑约束文件时，使用通配符能够快速选择一组信号，固然这些信号都要包含部分共有的字符串。例如：
NET "*CLK?" FAST;
将包含“CLK”字符并以一个字符结尾的全部信号，并提升了其速率。
在位置约束中，能够在行号和列号中使用通配符。例如：
INST "/CLK_logic/*" LOC = CLB_r*c7;
把CLK_logic层次中全部的实例放在第7列的CLB中。

3．定义设计层次
   在UCF文件中，经过通配符*能够指定信号的设计层次。其语法规则为：
* 遍历全部层次
Level1/* 遍历level1及如下层次中的模块
Level1/*/ 遍历level1种的模块，但不遍历更低层的模块

例4-5 根据图4-75所示的结构，使用通配符遍历表4-3所要求的各个模块。

图层次模块示意图
表要求遍历的符号列表

管脚和区域约束语法

LOC约束是FPGA设计中最基本的布局约束和综合约束，可以定义基本设计单元在FPGA芯片中的位置，可实现绝对定位、范围定位以及区域定位。此外， LOC还能将一组基本单元约束在特定区域之中。LOC语句既能够书写在约束文件中，也能够直接添加到设计文件中。换句话说，ISE中的FPGA底层工具编辑器（FPGA Editor）、布局规划器（Floorplanner）和引脚和区域约束编辑器的主要功能均可以经过LOC语句完成。
•    LOC语句语法
INST "instance_name " LOC = location;

其中“location”能够是FPGA芯片中任一或多个合法位置。若是为多个定位，须要用逗号“,”隔开，以下所示：
LOC = location1,location2,...,locationx;
目前，还不支持将多个逻辑置于同一位置以及将多个逻辑至于多个位置上。须要说明的是，多位置约束并非将设计定位到全部的位置上，而是在布局布线过程当中，布局器任意挑选其中的一个做为最终的布局位置。

范围定位的语法为：
INST “instance_name” LOC=location:location [SOFT];

经常使用的LOC定位语句如表4-4所列。
表经常使用的LOC定位语句

使用LOC完成端口定义时，其语法以下：
NET "Top_Module_PORT" LOC = "Chip_Port";

其中，“Top_Module_PORT”为用户设计中顶层模块的信号端口，“Chip_Port”为FPGA芯片的管脚名。

LOC语句中是存在优先级的，当同时指定LOC端口和其端口连线时，对其连线约束的优先级是最高的。例如，在图4-76中，LOC=11的优先级高于LOC=38。

图 LOC优先级示意图
2．LOC属性说明

LOC语句经过加载不一样的属性能够约束管脚位置、CLB、Slice、TBUF、块RAM、硬核乘法器、全局时钟、数字锁相环（DLL）以及DCM模块等资源，基本涵盖了FPGA芯片中全部类型的资源。因而可知，LOC语句功能十分强大，表4-5列出了LOC的经常使用属性。
表 LOC语句经常使用属性列表

Verilog HDL代码描述对状态机综合的研究
2007-11-25 16:59
1 引言
Verilog HDL做为当今国际主流的HDL语言,在芯片的前端设计中有着普遍的应用。它的语法丰富,成功地应用于设计的各个阶段：建模、仿真、验证和综合等。可综合是指综合工具能将Verilog HDL代码转换成标准的门级结构网表,所以代码的描述必须符合必定的规则。大部分数字系统均可以分为控制单元和数据单元两个部分,控制单元的主体是一个状态机,它接收外部信号以及数据单元产生的状态信息,产生控制信号,于是状态机性能的好坏对系统性能有很大的影响。
有许多可综合状态机的Verilog代码描述风格,不一样代码描述风格经综合后获得电路的物理实如今速度和面积上有很大差异。优秀的代码描述应当易于修改、易于编写和理解,有助于仿真和调试,并能生成高效的综合结果。
2 有限状态机
有限状态机(Finite State Machine,FSM)在数字系统设计中应用十分普遍。根据状态机的输出是否与输入有关,可将状态机分为两大类：摩尔(Moore)型状态机和米莉(Mealy)型状态机。Moore型状态机的输出仅与现态有关;Mealy型状态机的输出不只与现态有关,并且和输入也有关。图1是有限状态机的通常结构图,它主要包括三个部分,其中组合逻辑部分包括状态译码器和输出译码器,状态译码器肯定状态机的下一个状态,输出译码器肯定状态机的输出,状态寄存器属于时序逻辑部分,用来存储状态机的内部状态。

图1 状态机的结构框图
2.1 好的状态机标准
好的状态机的标准不少,最重要的几个方面以下：
第一,状态机要安全,是指FSM不会进入死循环,特别是不会进入非预知的状态,并且因为某些扰动进入非设计状态,也能很快的恢复到正常的状态循环中来。这里面有两层含义。其一要求该FSM的综合实现结果无_毛刺等异常扰动,其二要求FSM要完备,即便受到异常扰动进入非设计状态,也能很快恢复到正常状态。
第二,状态机的设计要知足设计的面积和速度的要求。
第三,状态机的设计要清晰易懂、易维护。
须要说明的是,以上各项标准,不是割裂的,它们有着直接紧密的内在联系。在芯片设计中,对综合结果评判的两个基本标准为：面积和速度。“面积”是指设计所占用的逻辑资源数量;“速度”指设计在芯片上稳定运行所可以达到的最高频率。二者是对立统一的矛盾体,要求一个设计同时具有设计面积最小,运行频率最高,这是不现实的。科学的设计目标应该是：在知足设计时序要求(包含对设计最高频率的要求)的前提下,占用最小的芯片面积,或者在所规定的面积下,使设计的时序余量更大,频率更高。另外,若是要求FSM安全,则不少时候须要使用“full case”的编码方式,即将状态转移变量的全部向量组合状况都在FSM 中有相应的处理,这常常势必意味着要多花更多的设计资源,有时也会影响FSM的频率因此,上述的标准要综合考虑,根据设计的要求进行权衡。

2.2 状态机描述方法
状态机描述时关键是要描述清楚几个状态机的要素,即如何进行状态转移,每一个状态的输出是什么,状态转移的条件等。具体描述时方法各类各样,最多见的有三种描述方式：
第一,整个状态机写到一个always模块里面,在该模块中既描述状态转移,又描述状态的输入和输出;
第二,用两个always模块来描述状态机,其中一个always模块采用同步时序描述状态转移;另外一个模块采用组合逻辑判断状态转移条件,描述状态转移规律以及输出;
第三,在两个always模块描述方法基础上,使用三个always模块,一个always模块采用同步时序描述状态转移,一个采用组合逻辑判断状态转移条件,描述状态转移规律,另外一个always模块描述状态的输出(能够用组合电路输出,也能够时序电路输出)。
通常而言,推荐的FSM 描述方法是后两种。这是由于:FSM和其余设计同样,最好使用同步时序方式设计,以提升设计的稳定性,消除毛刺。状态机实现后,通常来讲,状态转移部分是同步时序电路而状态的转移条件的判断是组合逻辑。
第二种描述方法同第一种描述方法相比,将同步时序和组合逻辑分别放到不一样的always模块中实现,这样作的好处不只仅是便于阅读、理解、维护,更重要的是利于综合器优化代码,利于用户添加合适的时序约束条件,利于布局布线器实现设计。在第二种方式的描述中,描述当前状态的输出用组合逻辑实现,组合逻辑很容易产生毛刺,并且不利于约束,不利于综合器和布局布线器实现高性能的设计。第三种描述方式与第二种相比,关键在于根据状态转移规律,在上一状态根据输入条件判断出当前状态的输出,从而在不插入额外时钟节拍的前提下,实现了寄存器输出。

2.3 状态机的编码
二进制编码(Binary)、格雷码(Gray-code)编码使用最少的触发器,较多的组合逻辑,而独热码(One-hot)编码反之。独热码编码的最大优点在于状态比较时仅仅须要比较一个位,从而必定程度上简化了比较逻辑,减小了毛刺产生的几率。因为CPLD更多地提供组合逻辑资源,而FPGA更多地提供触发器资源,因此CPLD多使用二进制编码或格雷码,而FPGA多使用独热码编码。另外一方面,对于小型设计使用二进制和格雷码编码更有效,而大型状态机使用独热码更高效。
3 实例说明
下面经过实例来讲明Verilog HDL代码描述对状态机综合结果的影响。
设计一个序列检测器,用于检测串行的二进制序列,每当连续输入三个或三个以上的1时,序列检测器的输出为1,其它状况下输出为0。
假设初始的状态为s0,输入一个1的状态记为s1,连续输入二个1后的状态记为s2,输入三个或以上1的状态记为s3,不论现态是何种状态一旦输入0的话,就返回到初始状态。根据题意,可画出状态图如图2所示。

图2 状态图
根据状态图以及前面状态机的介绍,能够采用一个always模块来描述,状态编码采用二进制编码,程序以下：
module fsm(clk,ina,out);
input clk,ina;
output out;
reg out;
parameter s0 = 3'bOO,s1 =3'b01,s2 =3'b10,s3=3'b11;
reg[0:1]state;
always @ (posedge clk)
begin
state<=s0;
out =0;
case(state)
s0:begin
state<=(ina)?s1:s0;out=0;
end
s1:begin
state<=(ina)?s2:s0;out=0;
end
s2:begin
state<=(ina)?s3:s0;out=0;
end
s3:begin
state<=(ina)?s3:s0;out=1;
end
endcase
end
endmodule
采用Synplify Pro工具在Altera EPF10K10系列器件上进行综合,其综合的结果如图3所示。

若是采用两个always来描述,程序的模块声明、端口定义和信号类型部分不变,只是改动逻辑功能描述部分,改动部分的程序以下：
alwys @ (posedge dk)
state fsm <=next_state;
always @ (state_fsm or ina)
begin
state<=s0;out =0;
case(state_fsm )
s0:begin
next_state=(ina)?s1:s0;out=0;
end
s1:begin
next state=(ina)?s2:s0;out=0：
end
s2:begin
next_state=(ina)?s3:s0;out=0;
end
s3:begin
next_state=(ina)?s3:s0;out=1;
end
endcase
end
endmodule
在相同的器件上其综合的结果如图4所示,比较图3与图4的综合结果,能够看出。两种综合结果都是采用了两个触发器来存储状态。其不一样的地方是输出部分,采用一个always模块的输出结果是寄存器输出。采用两个always模块描述的是组合逻辑直接输出,这是由于代码中的输出赋值也放在了时钟的上升沿(always @ (posedge clk))。其综合的结果是寄存器,所以它比直接组合逻辑输出延迟一个时钟周期。

图4
若是采用一位hot编码,仅改动参数设置的两行程序。采用一个always模块描述,改动部分的程序以下：
parameter s0 = 3'b0001,s1 =3'b0010,s2 =3'b0100,s3=3'b1000;
reg[0:3] state;

图5
综合的结果如图5所示。将图5与图3相比,能够看出：
图5中状态寄存器采用了4个触发器来存储状态,而图3采用了两个触发器来存储状态,这是因为它们的状态编码的不一样而获得的不一样的综合结果,采用二进制编码综合获得的触发器要比采用独热码综合获得的触发器少。它们的共同之处都是采用了寄存器来输出的。
3 结束语
有多种可综合状态机的Verilog HDL代码描述风格。其综合的结果是不一样的。其中普遍采用的是两个或三个always模块描述。组合逻辑输出型状态机不适合应用在高速复杂系统设计中,在高速系统中应当采用寄存器输出型状态机。寄存器类型信号不会产生毛刺,而且输出不含组合逻辑。会减小组合逻辑门延时。容易知足高速系统设计要求。总之,状态机的设计是数字系统设计中的关键部分,设计时作到心中有电路。充分考虑其综合的结果,才能编写出高质量的综合代码。进而提升设计水平。

模块划分很是重要，除了关系到是否最大程度上发挥项目成员的协同设计能力，并且直接决定着设计的综合、实现时间。下面是一些模块划分的原则。
   a.对每一个同步设计的子模块的输出使用寄存器（registering）。也即用寄存器分割同步时序模块的原则。) @( F3 f+ D" j
   使用寄存器的好处有：综合工具在编译综合时会将所分割的子模块中的组合电路和同步时序电路总体考虑。并且这种模块结构符合时序约束的习惯，便于使用时序约束熟悉进行约束。) q9 t/ |# a  \7 p0 C
   b.将相关的逻辑或者能够复用的逻辑划分在同一模块内。
   这样作的好处有，一方面将相关的逻辑和能够复用的逻辑划分在同一模块，能够最大程度的复用资源，减小设计消耗的面积。同时也更利于综合工具优化一个具体功能（操做）在时序上的关键路径。其缘由是，综合工具只能同时考虑一部分逻辑，而所同时优化的逻辑单元就是模块，因此将相关功能划分在同一模块更有利于综合器的优化。; l/ w" k5 r9 G4 X4 x
   c.将不一样优化目标的逻辑分开。
   好的设计，在规划阶段，设计者就已经思考了设计的大概规模和关键路径，并对设计的优化目标有一个总体上的把握。对于时序紧张的部分，应该独立划分为一个模块，其优化目标为“speed”，这种划分方法便于设计者进行时序约束，也便于综合和实现工具进行优化。好比时序优化的利器Amplify，使用模块进行区域优化更方便一些。另外一类矛盾集中在面积的设计，也应该划分红独立的模块，这类模块的优化目标是“Area”，一样将他们规划到一块儿，更有利于区域布局与约束。这种根据优化目标进行优化的方法的最大好处是，对于某个模块综合器仅仅须要考虑一种优化目标和策略，从而比较容易达到较好的优化效果。相反的若是同时考虑两种优化目标，会使综合器陷入互相制约的困境。
   d.将松约束的逻辑归到同一模块。
   有些逻辑的时序很是宽松，不须要较高的时序约束，能够将这类逻辑纳入同一模块，如多周期路径“multi-cycle”等。将这些模块归类，并指定松约束，则可让综合器尽可能的节省面积资源。
   e.将RAM/ROM/FIFO等逻辑独立划分红模块。
   这样作的好处是便于综合器将这类资源类推为器件的硬件原语，同时仿真时消耗的内存也会少些，便于提升仿真速度。（大多数仿真器对大面积的RAM都有独特的内存管理方式）0 o4 B! p5 Q- D) O) Y7 M/ ]
   f.合适的模块规模。
   规模大，利于“Resource Sharing”。可是对综合器同时处理的逻辑量太大，不利于多模块和增量编译模式。

关于约束，时序分析的问题汇总
不少人发贴，来信询问关于约束、时序分析的问题，好比：如何设置setup，hold时间？如何使用全局时钟和第二全局时钟（长线资源）？如何进行分组约束？如何约束某部分组合逻辑？如何经过约束保证异步时钟域之间的数据交换可靠？如何使用I/O逻辑单元内部的寄存器资源？如何进行物理区域约束，完成物理综合和物理实现？等等。。。
为了解决你们的疑难，咱们将逐一讨论这些问题。

今天先讨论一下约束的做用？
有些人不知道什么时候该添加约束，什么时候不须要添加？有些人认为低速设计不须要时序约束？关于这些问题，但愿下面关于约束做用的论述可以有所帮助！
附加约束的基本做用有3：
(1)提升设计的工做频率
对不少数字电路设计来讲，提升工做频率很是重要，由于高工做频率意味着高处理能力。经过附加约束能够控制逻辑的综合、映射、布局和布线，以减少逻辑和布线延时，从而提升工做频率。
(2)得到正确的时序分析报告
几乎全部的FPGA设计平台都包含静态时序分析工具，利用这类工具能够得到映射或布局布线后的时序分析报告，从而对设计的性能作出评估。静态时序分析工具以约束做为判断时序是否知足设计要求的标准，所以要求设计者正确输入约束，以便静态时序分析工具输出正确的时序分析报告。
(3)指定FPGA/CPLD引脚位置与电气标准
FPGA/CPLD的可编程特性使电路板设计加工和FPGA/CPLD设计能够同时进行，而没必要等FPGA/CPLD引脚位置彻底肯定，从而节省了系统开发时间。这样，电路板加工完成后，设计者要根据电路板的走线对FPGA/CPLD加上引脚位置约束，使FPGA/CPLD与电路板正确链接。另外经过约束还能够指定IO引脚所支持的接口标准和其余电气特性。为了知足突飞猛进的通讯发展，Xilinx新型FPGA/CPLD能够经过IO引脚约束设置支持诸如AGP、BLVDS、CTT、GTL、GTLP、HSTL、LDT、LVCMOS、LVDCI、LVDS、LVPECL、LVDSEXT、LVTTL、PCI、PCIX、SSTL、ULVDS等丰富的IO接口标准。

另外经过区域约束还能在FPGA上规划各个模块的实现区域，经过物理布局布线约束，完成模块化设计等。

贴2：时序约束的概念和基本策略！
时序约束主要包括周期约束（FFS到FFS，即触发器到触发器）和偏移约束（IPAD到FFS、FFS到OPAD）以及静态路径约束（IPAD到OPAD）等3种。经过附加约束条件能够使综合布线工具调整映射和布局布线过程，使设计达到时序要求。例如用OFFSET_IN_BEFORE约束能够告诉综合布线工具输入信号在时钟以前何时准备好，综合布线工具就能够根据这个约束调整与IPAD相连的Logic Circuitry的综合实现过程，使结果知足FFS的创建时间要求。
附加时序约束的通常策略是先附加全局约束，而后对快速和慢速例外路径附加专门约束。附加全局约束时，首先定义设计的全部时钟，对各时钟域内的同步元件进行分组，对分组附加周期约束，而后对FPGA/CPLD输入输出PAD附加偏移约束、对全组合逻辑的PAD TO PAD路径附加约束。附加专门约束时，首先约束分组之间的路径，而后约束快、慢速例外路径和多周期路径，以及其余特殊路径。

贴3：周期（PERIOD）的含义
周期的含义是时序中最简单也是最重要的含义，其它不少时序概念会由于软件商不一样略有差别，而周期的概念确是最通用的，周期的概念是FPGA/ASIC时序定义的基础概念。后面要讲到的其它时序约束都是创建在周期约束的基础上的，不少其它时序公式，能够用周期公式推导。
周期约束是一个基本时序和综合约束，它附加在时钟网线上，时序分析工具根据PERIOD约束检查时钟域内全部同步元件的时序是否知足要求。PERIOD约束会自动处理寄存器时钟端的反相问题，若是相邻同步元件时钟相位相反，那么它们之间的延迟将被默认限制为PERIOD约束值的一半。
以下图所示，时钟的最小周期为：
TCLK = TCKO +TLOGIC +TNET +TSETUP －TCLK_SKEW
TCLK_SKEW =TCD2 －TCD1
其中TCKO为时钟输出时间，TLOGIC为同步元件之间的组合逻辑延迟，TNET为网线延迟，TSETUP为同步元件的创建时间，TCLK_SKEW为时钟信号延迟的差异。

这个帖子打算先澄清一些时序约束的基本概念，而后将在综合工具（Synplify Pro为例），设计平台（ISE5.x 和Quartus 2.2为例）的具体约束方法和技巧，而后将如何利用时序分析工具分析关键路径。若是没有意外，应该30多个帖子吧。
仿真时序原本是Deve的老本行，随时须要Deve加入一块儿把这个帖子办好。欢迎你们畅谈观点，本站的版主，冲锋啊，嘻嘻。

贴4：数据和时钟之间的约束：OFFSET和SETUP、HOLD时间。
为了确保芯片数据采样可靠和下级芯片之间正确的交换数据，须要约束外部时钟和数据输入输出引脚之间的时序关系（或者内部时钟和外部输入/输出数据之间的关系，这仅仅是从采用了不一样的参照系罢了）。约束的内容为告诉综合器、布线器输入数据到达的时刻，或者输出数据稳定的时刻，从而保证与下一级电路的时序关系。
这种时序约束在Xilinx中用Setup to Clock（edge），Clock（edge） to hold等表示。在Altera里经常使用tsu (Input Setup Times)、th (Input Hold Times)、tco (Clock to Out Delays)来表示。不少其它时序工具直接用setup和hold表示。其实他们所要描述的是同一个问题，仅仅是时间节点的定义上略有不一样。下面依次介绍。

贴5：关于输入到达时间，这一贴估计问题比较多，看起来也比较累，可是没有办法，这些都是时序的基本概念啊。搞不清楚，永远痛苦，长痛不如短痛了，呵呵。

Xilinx的"输入到达时间的计算"时序描述如图所示：

定义的含义是输入数据在有效时钟沿以后的TARRIVAL时刻到达。则，
TARRIVAL=TCKO+TOUTPUT+TLOGIC    公式1
根据”贴3“介绍的周期（Period）公式，咱们能够获得：
Tcko+Toutput+Tlogic+Tinput+Tsetup-Tclk_skew=Tclk; 公式2
将公式1代入公式2：
Tarrival+Tinput+Tsetup-Tclk_skew=Tclk, 而Tclk_skew知足时序关系后为负，因此
TARRIVAL +TINPUT+TSETUP <TCLK  公式3，
这就是Tarrival应该知足的时序关系。其中TINPUT为输入端的组合逻辑、网线和PAD的延迟之和，TSETUP为输入同步元件的创建时间。

贴6 数据延时和数据到达时间的关系：
TDELAY为要求的芯片内部输入延迟，其最大值TDELAY_MAX与输入数据到达时间TARRIVAL的关系如图2所示。也就是说：
TDELAY_MAX+TARRIVAL=TPERIOD 公式4
因此：
TDELAY<TDELAY_MAX=TPERIOD－TARRIVAL
帖7 要求输出的稳定时间
从下一级输入端的延迟能够计算出当前设计输出的数据必须在什么时候稳定下来，根据这个数据对设计输出端的逻辑布线进行约束，以知足下一级的创建时间要求，保证下一级采样的数据是稳定的。
计算要求的输出稳定时间如图所示。
公式的推导以下：
定义：TSTABLE = TLOGIC +TINPUT +TSETUP
从前面帖子介绍的周期（Period）公式，能够获得(其中TCLK_SKEW＝TCLK1－TCLK2)：
TCLK＝TCKO＋TOUTPUT+TLOGIC+TINPUT+TSETUP+TCLK_SKEW
将TSTABLE的定义代入到周期公式，能够获得：
TCLK=TCKO+TOUTPUT+TSTABLE+TCLK_SKEW
因此，
TCKO +TOUTPUT+TSTABLE<TCLK
这个公式就是TSTABLE必需要知足的基本时序关系，即本级的输出应该保持怎么样的稳定状态，才能保证下级芯片的采样稳定。有时咱们也称这个约束关系是输出数据的保持时间的时序约束关系。只要知足上述关系，当前芯片输出端的数据比时钟上升沿提前TSTABLE 时间稳定下来，下一级就能够正确地采样数据。
其中TOUTPUT为设计中链接同步元件输出端的组合逻辑、网线和PAD的延迟之和，TCKO为同步元件时钟输出时间。

/*******************************************************************/
这里的概念介绍比较繁复，可是若是想掌握数据与时钟关系的基本约束，就必须搞清楚这些概念，下一帖介绍这些概念的具体应用，实施上述约束的方法和具体命令。

转贴lipple的问题：
请问斑竹上面几贴那些延时属于setup，哪些属于hold啊
周期=Tsetup+Tlogic+Thold这个公式对比斑竹的公式，区别在因而不是划分的不够细啊？
westor的答复：
基本是哪一个意思。这些公式描述的对象是意义的，只是每一个变量的定义略有区别罢了，换句话说，变量定义的节点不一样。
这个公式是altera等采用的描述方法，一些工具为了便于理解用
周期=Tsetup+Tlogic+Thold约束时序。
和我前面介绍的公式：
TCLK = TCKO +TLOGIC +TNET +TSETUP －TCLK_SKEW
相比，他把到寄存器前的全部组合逻辑logic和线延时都归在Tsetup里面了，并且上面公式忽略了Tclk_skew。

帖8 实施上述约束的方法和命令。
实施上述约束的基本方法是，根据已知时序信息，推算须要约束的时间值，实施约约束。具体的说是这样的，首先对于通常设计，首先掌握的是TCLK,这个对于设计者来讲是个已知量。前面介绍公式和图中的TCKO和TSETUP（注：有的工具软件对TCKO和TSETUP的定义与前面图形不一样，还包含了到达同步器件的一段logic的时延）是器件内部固有的一个时间量，通常咱们选取典型值，对于FPGA，这个量值比较小，通常不大于1~2ns。比较难以肯定的是TINPUT和TOUTPUT两个时间量。
约束输入时间偏移，须要知道TINPUT，TINPUT为输入端的组合逻辑、网线和PAD的延迟之和（详细定义见帖5），PAD的延时也根据器件型号也有典型值可选，可是到达输入端的组合逻辑电路和网线的延时就比较难以肯定了，只能经过静态时序分析工具分析，或者经过底层布局布线工具量取，有很大的经验和试探的成分在里面。
约束输出时间偏移，须要知道TOUTPUT，TOUTPUT为设计中链接同步元件输出端的组合逻辑、网线和PAD的延迟之和（见帖7），仍然是到达输出端的组合逻辑电路和网线的延时就比较难以肯定，须要经过静态时序分析工具分析，或者经过底层布局布线工具量取，有很大的经验和试探的成分在里面。
约束的具体命令根据约束工具不一样而异，首先说使用Xilinx器件的状况下，实施上述约束的命令和方法。Xilinx把上述约束统称为：OFFSET约束（偏移约束），一共有4个相关约束属性：OFFSET_IN_BEFORE、OFFSET_IN_AFTER、OFFSET_OUT_BEFORE和OFFSET_OUT_AFTER。
其中前两个属性叫作输入偏移（OFFSET_IN）约束，基本功能类似，仅仅是约束取的参考对象不一样而已。后两个属性叫作输出偏移（OFFSET_OUT）约束，基本功能类似，也是约束取的参考对象不一样而已。
为了便于理解，举例说明。
输入偏移约束例：时钟周期为20ns，前级寄存器的TCKO选则1ns，前级输出逻辑延时TOUTPUT为3ns，中间逻辑TLOGIC的延时为10ns，那么TARRIVAL=14ns，因而能够在数据输入引脚附加
NET DATA_IN FFET=IN  14ns  AFTER CLK
约束，也能够使用OFFSET_IN_BEFORE对芯片内部的输入逻辑进行约束，其语法以下：
NET DATA_IN FFET=IN  TDELAY BEFORE CLK
其中TDELAY为要求的芯片内部输入延迟，其最大值与输入数据到达时间TARRIVAL的关系如帖6所述:TDELAY_MAX + TARRIVAL = TPERIOD,因此
TDELAY < TPERIOD - TARRIVAL = 20 - 14 =6 ns.
输出偏移约束例：设时钟周期为20ns，后级输入逻辑延时TINPUT为4ns、创建时间TSETUP为1ns，中间逻辑TLOGIC的延时为10ns，那么TSTABLE=15ns，因而能够在数据输入引脚附加NET DATA_OUT FFET=OUT  15ns  BEFORE CLK
约束，也能够直接对芯片内部的输出逻辑直接进行约束，
NET DATA_OUT FFET=OUT  TOUTPUT_DELAY  AFTER CLK，
其中TOUTPUT_DELAY为要求的芯片内部输出延迟，其最大值与要求的输出数据稳定时间TSTABLE的关系为：TOUTPUT_DELAY_MAX+TSTABLE= TPERIOD.
TOUT_DELAY< TPERIOD - TSTABLE = 20 - 15 = 5ns
/*******************************************************************/
这些概念和推导有些枯燥和乏味，可是若是要掌握好数据与时钟之间的约束，就要耐心看下去，明天介绍一下Altera的相关约束方法。

帖9 Altera对应的时序概念
这两天太忙了，帖子上的有些慢，请朋友们原谅，我会尽可能按照计划写完这个主题的。
前面8个帖子介绍了一些时序概念，有的是FPGA/ASIC设计的通常性时序概念，有的为了方便叙述，主要介绍了Xilinx对应的这些时序概念，和具体的约束熟悉。下面几个帖子主要介绍Altera对应的这些时序概念和约束方法。
前面首先介绍的第一个时序概念是周期，Period，这个概念是FPGA/ASIC通用的一个概念，各方的定义至关统一，至可能是描述方式不一样罢了，全部的FPGA设计都首先要进行周期约束，这样作的好处除了在综合与布局布线时给出规定目标外，还能让时序分析工具考察整个设计的Fmax等。
Altera的周期定义如图所示，公式描述以下：
Clock Period = Clk-to-out + Data Delay + Setup Time - Clk Skew
即，
Tclk       = Tco       + B       + Tsu       -(E-C)
Fmax       = 1/Tclk
对比一下前面的介绍，只要理解了B包含了两级寄存器之间的全部logic和net的延时就会发现与前面公式彻底一致。
一个设计的Fmax在时序报告，或者在图形界面观察。以Quartus2为例，在图形界面的观察方法是，编译实现完成后，展开Compilation Report下面的Timing Analyses，单击Fmax（not include delays to / from pins）便可。在详细报告窗口能够观察到影响周期恶化的10条最差时序路径，根据这些信息能够找出关键路径，进行时序分析。
关于时序分析和关键路径改进等内容在后面的帖子会有专门的讨论，暂时不作进一步介绍。
贴10
Clock Setup Time (tsu)
要想正确采样数据，就必须使数据和使能信号在有效时钟沿到达前就准备好，所谓时钟创建时间就是指时钟到达前，数据和使能已经准备好的最小时间间隔。如图1所示：
注：这里定义Setup时间是站在同步时序整个路径上的，须要区别的是另外一个概念Micro tsu。Micro tsu指的是一个触发器内部的创建时间，它是触发器的固有属性，通常典型值小于1~2ns。在Xilinx等的时序概念中，称Altera的Micro tsu为setup时间，用Tsetup表示，请你们区分一下。
回到Altera的时序概念，Altera的tsu定义以下：
tsu = Data Delay – Clock Delay + Micro tsu

贴11
Clock Hold Time tH
时钟保持时间是只能保证有效时钟沿正确采用的数据和使能信号的最小稳定时间。其定义如图2所示。定义的公式为：
tH= Clock Delay – Data Delay + Micro tH
注：其中Micro tH是指寄存器内部的固有保持时间，一样是寄存器的一个固有参数，典型值小于1～2ns。

贴12
Clock-to-Output Delay（tco）
这个时间指的是当时钟有效沿变化后，将数据推倒同步时序路径的输出端的最小时间间隔。如图3所示。
tco ＝ Clock Delay + Micro tco + Data Delay
注：其中 Micor tco也是一个寄存器的固有属性，指的是寄存器相应时钟有效沿，将数据送到输出端口的内部时间参数。它与Xilinx的时序定义中，有一个概念叫Tcko是同一个概念。

Pin to Pin Delay （tpd）
tpd指输入管脚经过纯组合逻辑到达输出管脚这段路径的延时，特别须要说明的是，要求输入到输出之间只有组合逻辑，才是tpd延时。
7.Slack
Slack是表示设计是否知足时序的一个称谓，正的slack表示知足时序（时序的余量），负的slack表示不知足时序（时序的欠缺量）。slack的定义和图形如图4所示。
Slack = Required clock period – Actual clock period
Slack = Slack clock period – (Micro tCO+ Data Delay + Micro tSU)
8.Clock Skew
Clock Skew指一个同源时钟到达两个不一样的寄存器时钟端的时间偏移。shell

转载自：http://www.cnblogs.com/capark/p/4121369.htmlexpress