评分标准
- 步骤 1(Cache Size):给出访存序列,测量程序的执行结果,以及对结果的简单分析。给出思考题的答案。共 2 分。
- 步骤 2(Cache Line Size):给出访存序列,测量程序的执行结果,以及对结果的简单分析。思考题可选。共 1 分。
- 步骤 3(Cache Associativity):给出访存序列,测量程序的执行结果,以及对结果的简单分析。共 2 分。
- 步骤 4(MatMul Optimization):按照如下公式给分。除了代码内注明可修改的部分(TODO部分)外,其余代码不可修改。
分数计算公式为:max\{0, min\{\frac{优化前程序运行时间}{优化后程序运行时间}-1, 2\}\} 。即本步骤共 2 分,达到 3 倍加速比即可拿到全部分数。
- 代码:1 分。请上交四个步骤的实验代码。评分时会参考代码的风格、注释等。只要提交的代码没有明显的抄袭痕迹,基本可以拿全。
-
文档:2 分。除了上述每个步骤的内容之外,还需要给出以下内容:
- 实验机器的 Cache 参数
- 相联度算法的分析
- 如有选做,给出选做部分的实现思路和结果分析
- 对于本次实验的意见和建议
-
可选部分:1 分。验证两种替换策略可获得 0.5 分;测出 L1 DCache 是否写直达可以获得 0.5 分。
-
如果在苹果 M 芯片或其他非主流芯片上进行实验(我们不建议这么做),实验的设计和对实验结果的分析为重点。
-
如果总分超过 10 分,则按照 10 分计算实验成绩。
最后更新:
2025年3月12日
作者: