HNU计算机系统实验缓存7&缓存8

一、test-trans 64x64矩阵转置实验: 1、64×64矩阵,每行64元素,每8一组32位分8个组,故cache每4行填满整个cache。 2、测试传统8分块,结果如图,发块与不分快结果一样,没有优化。 这是因为A数组8x8读取数据的时候与之前一样,都是每组第一个miss以后hit,但是B数组按列存的时候,因为每四行一个块,在访问后四行的时候将前四行驱逐miss,然后访问第二列的时候又把
相关文章
相关标签/搜索