跳转至

板载外设(Intel FPGA 版)

HDMI 接口

实验板上提供了 HDMI 视频输出接口,用于输出视频信号。该接口使用了 TFP410PAP 转换芯片,将标准的 VGA 时序视频信号,转换为 HDMI 数字视频。该芯片最高可支持 1080p 60Hz 24 位真彩色的视频信号。

我们的工程模板中已经提供了输出视频的样例代码,其中使用的是 800x600 分辨率,72Hz 的视频格式,其他支持的视频格式,可参考 芯片数据手册VGA 时序列表,注意修改分辨率时,需要同时修改 vga 模块例化中的时序参数,如无必要,不建议使用样例之外的时序格式。

样例代码中使用了如下参数,和 VESA Signal 800 x 600 @ 72 Hz 对应关系如下:

  • Pixel clock: 50MHz
  • HSIZE: 800 (Visible Area)
  • HFP: 856 = 800 (Visible Area) + 56 (Front proch)
  • HSP: 976 = 856 + 120 (Sync pulse)
  • HMAX: 1040 (Whole line)
  • VSIZE: 600 (Visible Area)
  • VFP: 637 = 600 (Visible Area) + 37 (Front porch)
  • VSP: 643 = 637 + 6 (Sync pulse)
  • VMAX: 666 (Whole frame)

经测试实验板可以输出 1080p 60Hz 的视频,但是像素时钟高达 148.5 MHz,比较难实现。

使用显存

在工程模板中,使用了 VGA 时序模块 vga.v 输出的横纵坐标信息,驱动显示了 24 位彩色条。在实际项目开发中,严禁此类渲染逻辑,请使用显存作为图像的缓冲区。如有必要,可以采用双缓存、ring buffer 等机制,改善渲染的效果。

不建议用除法和取模

在使用 VGA 输出的时候,可能下意识想对坐标进行除法或者取模运算。但是使用组合逻辑实现除法和取模,需要很大的面积,时序上也会产生很长的路径。正确做法是,由于坐标的更新是有规律的,可以在每次更新坐标的同时,数周期,设置一个更新比较慢的寄存器,每 n 个周期才加 1,这样就可以持续保持和坐标有一个倍数关系。取模也是类似的。

降低色深和分辨率

显存是项目中对内存消耗最大的模块。例如样例中使用的 800x600 24 位色,将会占用 800*600*24/8/1048576 = 1.37MB 的内存资源。而大部分设计中,无需使用 24 位真彩色(RGB888 格式),而是采用 RGB565 格式,甚至更低的色深,以尽量减少内存资源占用。对于低色深的图片,输出时可直接将其连接至视频数据的高位,将低位置 0;或采用各类转换算法完成色深之间的线性插值转换。有关这些颜色格式和相互转换,可参考 博客文章

除了降低色深以外,也可以降低分辨率,例如显存只保存 400x300 个像素,然后在输出到 VGA 的时候,在 x 和 y 方向上重复输出像素。

结合色深和分辨率的压缩,可以在牺牲一定显示效果的代价下,把显存放到 FPGA 内部进行存储,此时可以用一个双端口的 RAM 作为显存。

也可以把显存放到 FPGA 外部,例如 SRAM 和 SDRAM,此时需要考虑的是如何把读取内存的逻辑与 VGA 控制器连接起来。由于 SRAM 和 SDRAM 只有单端口,不能同时进行读和写操作,可以使用仲裁的方式,当 VGA 控制器不需要读的时候(例如在消隐区),其他逻辑就可以对内存进行写入。

SDRAM 内存

实验板上提供了 32MB 容量的 SDRAM 内存,型号为 MT48LC16M16A2-7E,关于它的特性可参考 数据手册。SDRAM 采用较为复杂的同步访问时序,可以支持更高的时钟频率,但需要使用多个周期,并且通过专用的控制器进行访问,有关它与 SRAM 内存的区别,请参考 文章

我们推荐使用 GitHub 项目 中的控制器进行内存的驱动和读写操作。该控制器提供了一个较为简单的读写总线接口,类似 ready-valid 机制,具体的信号列表可以参考代码的注释部分。同时,该型号的 SDRAM 提供了一个 仿真模型,可以提供一个仿真的器件,并给出一些与时序有关的调试输出,方便项目调试。

时钟频率

SDRAM 对于时序有严格的约束要求,因此不能像片内 RAM 一样使用任意的时钟频率。我们使用的 SDRAM 型号和推荐的控制器均遵循 PC133 标准,即需要给控制器和 SDRAM 的时钟频率为 133MHz。可以参考工程模板,使用 PLL 将实验板输入的 100MHz 时钟转换为 133MHz(可以接受一定误差,如 133.3333MHz)。

千兆以太网

实验板上提供了千兆以太网 PHY 芯片,其型号为 RTL8211。我们将其配置成了 GMII 接口,与实验 FPGA 相连。我们的 FPGA 同时扮演了“CPU”和 MAC 芯片的角色。PHY 芯片将网线上的比特流进行接收,通过 GMII 接口发送至 FPGA;FPGA 中实现的 MAC 模块将其进行解析后,将原始的以太网帧通过各类流式总线发送至 FPGA 中的其他逻辑,即可完成各类处理。

由于 Quartus 软件中提供的 Ethernet MAC IP 核需要专用的 license,助教团队使用 verilog-ethernet 项目中,开源的 eth_mac_1g_gmii 模块进行了调试。该模块将 GMII 中到来的以太网帧,从 AXI Stream 接口中发出,该接口的位宽为 8bit,时钟频率为 125MHz。可以从 此处(或者 此处)下载样例工程,参考其中的使用方法。该项目中同时提供了带缓存的 eth_mac_1g_gmii_fifo 模块,如果需要对以太网帧进行短时间的 FIFO 缓存,可以将 MAC 替换为该模块。

同时,针对 AXI Stream 协议,verilog-axis 项目提供了许多有用的模块,例如 FIFO、数据宽度转换等,建议根据实际需要,使用其中的一些开源模块搭建项目。在此对这两个项目的作者 Alex Forencich 表示感谢,同学们也可以查看他编写的更多 Verilog 模块,从中获得启发。

SRAM

实验板上提供了 4MB 的 SRAM,是两片型号为 IS61WV102416BLL-10TLI 各 2MB 的 SRAM 数据线并联而成(两组 SRAM 连接同样的 addr ce_n we_n oe_n 信号,两组 data 拼接成为 32 位,两对 ub_n lb_n 组合成了 4 位的 be_n)。

SRAM 读写需要满足一定的时序,可以按照下面的文档,学习如何编写 SRAM 控制器:


最后更新: 2024年3月25日
作者:Jiajie Chen (55.88%), gaoyichuan (44.12%)

评论