NEON_1

总览
本指南介绍了Arm Neon技术,用于实现Armv8–A或Armv8–R体系结构配置文件的高级SIMD(单指令多数据)体系结构扩展。

 

Neon技术为指令集体系结构提供了专用扩展,提供了可以在多个数据流上并行执行数学运算的附加指令。

这可以通过加速音频和视频编码/解码,用户界面,2D / 3D图形或游戏来改善多媒体用户体验。 Neon还可以加速信号处理算法和功能,以加快诸如音频和视频处理,语音和面部识别,计算机视觉和深度学习之类的应用程序。

 

作为程序员,您可以使用多种方法来使用Neon技术:

支持Neon的开源库(例如Arm Compute库)提供了利用Neon的最简单方法之一。

编译器中的自动矢量化功能可以自动优化代码,以利用Neon。

Neon内部函数是函数调用,编译器将其替换为适当的Neon指令。 这使您可以直接从底层访问所需的确切Neon指令,而这些指令全部都来自C / C ++代码。

对于极高的性能,对于经验丰富的程序员而言,手工编码的Neon汇编器可以作为一种替代方法。