300字范文,内容丰富有趣,生活中的好帮手!
300字范文 > STM32的FPU体验

STM32的FPU体验

时间:2019-03-18 17:36:46

相关推荐

STM32的FPU体验

STM32-F4属于Cortex-M4构架,与M0、M3的最大不同就是有硬件浮点运算FPU,数学计算速度相比普通cpu运算快上几十倍。想要使用FPU首先包含#include“arm_math.h”,还有在keil的target选项中勾选usesingleprecision。

1.1简单的FPU运算性能测试

测试条件是开启一个100ms定时器,定时串口打印计算次数,优化级别是0,main函数中运行的代码如下:

floata=1.1,b=1.2,c=1.3,d=1.4;

1、FPU运算474566次,CPU运算64688次,除法速度快了7.3倍多。

c=b/d;

2、FPU运算722169次,CPU运算244271次,乘法运算快了3倍。FPU的乘法运算比除法运算快1.5倍。

c=b*d;

3、FPU运算19398次,CPU运算19628次,FPU的双精度除法运算没有优势,比单精度运算慢了24.5倍

c=b/1.4;

4、FPU运算503321次,CPU运算65450次,单精度常数和变量的运算差不多,单精度常数的除法快6%左右,这根编译器的关系比较大。

c=b/1.4f;

5、FPU运算519073次,跟下面比较说明整形常数和单精度常数的除法运算速度几乎一样。

c=b/3;

6、FPU运算519057次

c=b/3.0f;

7、FPU运算263643次

c=arm_cos_f32(1.3f);

8、FPU运算3949次,说明IT给的DSP库运算速度还是很给力的,速度快了67倍

c=cos(1.3f);

1.2代码设置

旧版本的keil设置如下,但是发现我使用的keil5包含的新固件库已经不需要这一步了。

如果没有启动FPU而使用数学函数运算时,CPU执行时认为遇到非法指令而跳转到HardFault_Handler()中断函数中死循环。因此,需要在系统初始化时开启FPU。在system_stm32f4xx.c中的SystemInit()函数中添加如下代码:

/*FPUsettings------------------------------------------------------------*/

#if(__FPU_PRESENT==1)&&(__FPU_USED==1)

SCB->CPACR|=((3UL<<10*2)|(3UL<<11*2));/*setCP10andCP11FullAccess*/

#endif

当__FPU_PRESENT=1且__FPU_USED=1时,编译时就加入了启动FPU的代码,CPU也就能正确高效的使用FPU进行简单的加减乘除。需要使用固件库自带的arm_math.h而非编译器自带的math.h,这个文件根据编译控制项(__FPU_USED==1)来决定是使用哪一种函数方法:如果没有使用FPU,那就调用keil的标准math.h头文件中定义的函数;如果使用了FPU,那就是用固件库自带的优化函数来解决问题。

1.3编译控制

在arm_math.h开头部分有一些编译控制信息:

#ifndef _ARM_MATH_H#define _ARM_MATH_H#define __CMSIS_GENERIC /* disable NVIC and Systick functions */#if defined (ARM_MATH_CM4)#include "core_cm4.h"#elif defined (ARM_MATH_CM3)#include "core_cm3.h"#elif defined (ARM_MATH_CM0)#include "core_cm0.h"#else#include "ARMCM4.h"#warning "Define either ARM_MATH_CM4 OR ARM_MATH_CM3...By Default building on ARM_MATH_CM4....."#endif#undef __CMSIS_GENERIC /* enable NVIC and Systick functions */#include "string.h"#include "math.h"

从中可以看出,为了使用STM32F4的arm_math.h,我们需要定义ARM_MATH_CM4;否则如果不使用CMSIS的库,就会调用Keil自带的math.h。另外,定义控制项__CC_ARM在某些数学函数中会使用VSQRT指令(浮点运算指令),运算速度比Q指令要快很多。

总结一下,需要添加宏定义ARM_MATH_CM4,__CC_ARM。

1.4添加库

根据使用的器件和运算模式,添加arm_cortexMxx_math.lib到工程文件中,位于\Libraries\CMSIS\Lib\ARM中。

*Thelibraryinstallercontainsprebuiltversionsofthelibrariesinthe<code>Lib</code>folder.

*-arm_cortexM4lf_math.lib(LittleendianandFloatingPointUnitonCortex-M4)

*-arm_cortexM4bf_math.lib(BigendianandFloatingPointUnitonCortex-M4)

*-arm_cortexM4l_math.lib(LittleendianonCortex-M4)

*-arm_cortexM4b_math.lib(BigendianonCortex-M4)

*-arm_cortexM3l_math.lib(LittleendianonCortex-M3)

*-arm_cortexM3b_math.lib(BigendianonCortex-M3)

*-arm_cortexM0l_math.lib(LittleendianonCortex-M0)

*-arm_cortexM0b_math.lib(BigendianonCortex-M3)

注:如果存储空间不允许,也可以不添加库,只添加\Libraries\CMSIS\DSP_Lib\Source中需要的源文件和arm_math.h。

其他DSP使用示例见\Libraries\CMSIS\DSP_Lib\Examples。

1.5DSP_Lib的文件结构

BasicMathFunctions:提供浮点数的各种基本运算函数,如加减乘除等运算。对于M0/M3只能用Q运算,即文件夹下以_q7、_q15和_q31结尾的文件;而M4F能直接硬件浮点计算,属于文件夹下以_f32结尾的文件。

CommonTables:arm_common_tables.c文件提供位翻转或相关参数表。

ComplexMathFunctions:复述数学功能,如向量处理,求模运算的。

ControllerFunctions:控制功能,主要为PID控制函数。arm_sin_cos_f32/-q31.c函数提供360点正余弦函数表和任意角度的正余弦函数值计算功能。

FastMathFunctions:快速数学功能函数,提供256点正余弦函数表和任意任意角度的正余弦函数值计算功能,和Q值开平方运算:

FilteringFunctions:滤波函数功能,主要为FIR和LMS(最小均方根)滤波函数。

MatrixFunctions:矩阵处理函数。

StatisticsFunctions:统计功能函数,如求平均值、计算RMS、计算方差/标准差等。

SupportFunctions:支持功能函数,如数据拷贝,Q格式和浮点格式相互转换,Q任意格式相互转换。

TransformFunctions:变换功能。包括复数FFT(CFFT)/复数FFT逆运算(CIFFT)、实数FFT(RFFT)/实数FFT逆运算(RIFFT)、和DCT(离散余弦变换)和配套的初始化函数。

1.6常用库函数

需要包含头文件:#include<arm_math.h>

float32_tarm_sin_f32(float32_tx);

float32_tarm_cos_f32(float32_tx);

static__INLINEarm_statusarm_sqrt_f32(float32_tin,float32_t*pOut)

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。