ARM NEON在矩阵&向量计算中的加速概述
2024-01-09一、概述 NEON是ARM上使用的一种SIMD(Single Instruction Multiple Data – 单指令多数据)指令集。可实现64位/128位的并行计算。简单理解就是一个计算指令,可以指定4个Float和4个Float并行计算(也可以是其他数据类型,但是必须包含在64位/128位内),得到4个Float结果。而不是一次只能一个Float和一个Float的计算。 比如在RGB颜色转灰色时,计算公式为:Gray = R *0.299 + G *0.587 + B * 0.114,