C嵌入汇编之vld1.f32和vst1.f32指令理解

想完成类似与memcpy,使用arm的neon指令完成,第一次代码 关键点 第一点: add %0,%0,#32,表示每次移动32/4=8个float 第二点: subs r0,r0,#1才能改变状态标志位,sub不行 第三点: vld1.f32 {d16-d17},[%0:128] add %0,%0,#16   //16=128/32*4,移动%0到第四个位置 与 vld1.f32 {d16-
相关文章
相关标签/搜索