跳转至

评分标准

  • 步骤 1(Cache Size):给出访存序列,测量程序的执行结果,以及对结果的简单分析。给出思考题的答案。共 2 分。
  • 步骤 2(Cache Line Size):给出访存序列,测量程序的执行结果,以及对结果的简单分析。思考题可选。共 1 分。
  • 步骤 3(Cache Associativity):给出访存序列,测量程序的执行结果,以及对结果的简单分析。共 2 分。
  • 步骤 4(MatMul Optimization):按照如下公式给分。除了代码内注明可修改的部分(TODO部分)外,其余代码不可修改。

分数计算公式为:max\{0, min\{\frac{优化前程序运行时间}{优化后程序运行时间}-1, 2\}\} 。即本步骤共 2 分,达到 3 倍加速比即可拿到全部分数。

  • 代码:1 分。请上交四个步骤的实验代码。评分时会参考代码的风格、注释等。只要提交的代码没有明显的抄袭痕迹,基本可以拿全。
  • 文档:2 分。除了上述每个步骤的内容之外,还需要给出以下内容:

    • 实验机器的 Cache 参数
    • 相联度算法的分析
    • 如有选做,给出选做部分的实现思路和结果分析
    • 对于本次实验的意见和建议
  • 可选部分:1 分。验证两种替换策略可获得 0.5 分;测出 L1 DCache 是否写直达可以获得 0.5 分。

  • 如果在苹果 M 芯片或其他非主流芯片上进行实验(我们不建议这么做),实验的设计和对实验结果的分析为重点。

  • 如果总分超过 10 分,则按照 10 分计算实验成绩。


最后更新: 2025年3月12日
作者:cuibst (86.36%), Zheng Hongpei (13.64%)