300字范文 > STM32的FPU体验

STM32的FPU体验

时间：2019-03-18 17:36:46

相关推荐

STM32的FPU体验

STM32-F4属于Cortex-M4构架，与M0、M3的最大不同就是有硬件浮点运算FPU，数学计算速度相比普通cpu运算快上几十倍。想要使用FPU首先包含#include“arm_math.h”，还有在keil的target选项中勾选usesingleprecision。

1.1简单的FPU运算性能测试

测试条件是开启一个100ms定时器，定时串口打印计算次数，优化级别是0，main函数中运行的代码如下：

floata=1.1,b=1.2,c=1.3,d=1.4;

1、FPU运算474566次，CPU运算64688次，除法速度快了7.3倍多。

c=b/d;

2、FPU运算722169次，CPU运算244271次，乘法运算快了3倍。FPU的乘法运算比除法运算快1.5倍。

c=b*d;

3、FPU运算19398次，CPU运算19628次，FPU的双精度除法运算没有优势，比单精度运算慢了24.5倍

c=b/1.4;

4、FPU运算503321次，CPU运算65450次，单精度常数和变量的运算差不多，单精度常数的除法快6%左右，这根编译器的关系比较大。

c=b/1.4f;

5、FPU运算519073次，跟下面比较说明整形常数和单精度常数的除法运算速度几乎一样。

c=b/3;

6、FPU运算519057次

c=b/3.0f;

7、FPU运算263643次

c=arm_cos_f32(1.3f);

8、FPU运算3949次，说明IT给的DSP库运算速度还是很给力的，速度快了67倍

c=cos(1.3f);

1.2代码设置

旧版本的keil设置如下，但是发现我使用的keil5包含的新固件库已经不需要这一步了。

如果没有启动FPU而使用数学函数运算时，CPU执行时认为遇到非法指令而跳转到HardFault_Handler()中断函数中死循环。因此，需要在系统初始化时开启FPU。在system_stm32f4xx.c中的SystemInit()函数中添加如下代码：

/*FPUsettings------------------------------------------------------------*/

#if(__FPU_PRESENT==1)&&(__FPU_USED==1)

SCB->CPACR|=((3UL<<10*2)|(3UL<<11*2));/*setCP10andCP11FullAccess*/

#endif

当__FPU_PRESENT=1且__FPU_USED=1时，编译时就加入了启动FPU的代码，CPU也就能正确高效的使用FPU进行简单的加减乘除。需要使用固件库自带的arm_math.h而非编译器自带的math.h，这个文件根据编译控制项（__FPU_USED==1）来决定是使用哪一种函数方法：如果没有使用FPU，那就调用keil的标准math.h头文件中定义的函数；如果使用了FPU，那就是用固件库自带的优化函数来解决问题。

1.3编译控制

在arm_math.h开头部分有一些编译控制信息：

#ifndef _ARM_MATH_H#define _ARM_MATH_H#define __CMSIS_GENERIC /* disable NVIC and Systick functions */#if defined (ARM_MATH_CM4)#include "core_cm4.h"#elif defined (ARM_MATH_CM3)#include "core_cm3.h"#elif defined (ARM_MATH_CM0)#include "core_cm0.h"#else#include "ARMCM4.h"#warning "Define either ARM_MATH_CM4 OR ARM_MATH_CM3...By Default building on ARM_MATH_CM4....."#endif#undef __CMSIS_GENERIC /* enable NVIC and Systick functions */#include "string.h"#include "math.h"

从中可以看出，为了使用STM32F4的arm_math.h，我们需要定义ARM_MATH_CM4；否则如果不使用CMSIS的库，就会调用Keil自带的math.h。另外，定义控制项__CC_ARM在某些数学函数中会使用VSQRT指令（浮点运算指令），运算速度比Q指令要快很多。

总结一下，需要添加宏定义ARM_MATH_CM4,__CC_ARM。