Intel X86 优化指南阅读笔记--通用优化(前端)

PROCESSOR PERSPECTIVES 以下优化建议,在不同微架构下收益差别较大: 指令译码的吞吐量很重要。利用好decoded ICache,Loop Stream Detector和macro-fusion能进一步提高CPU前端性能。 充分利用好4个译码器来产生代码。利用好micro-fusion和macro-fusion,这样其中3个简单译码器就再被限制为只能译码只含有一条uop的简
相关文章
相关标签/搜索