STM32 L431浮點數效能測試

執行的主頻是80mhz

求sin值

ticks =
hal_gettick()
;//進行浮點數計算
for(uint16_t i=
0;i<
10000
;i++
)//進行一萬次sin函式計算
ticks =
hal_gettick()
;for
(uint16_t i=
0;i<
10000
;i++
)//進行一萬次sin函式計算
ticks =
hal_gettick()
;

執行一萬次sin函式，fpu加速效果非常明顯。不是用fpu的話需要402ms，使用了fpu只需要12ms！非常誇張。相差了33.5倍。

求平方根

ticks =
hal_gettick()
;//進行浮點數計算
for(uint32_t i=
0;i<
10000
;i++
) ticks =
hal_gettick()
;for
(uint32_t i=
0;i<
10000
;i++
) ticks =
hal_gettick()
;

執行一萬次平方根操作，不用fpu執行為160ms，使用了fpu時間為10ms，相差16倍

浮點數加法

ticks =
hal_gettick()
;//進行浮點數計算
for(uint32_t i=
0;i<
100000
;i++
) ticks =
hal_gettick()
;

分別開啟fpu和關閉fpu計算10w次加法運算。開啟fpu需要25s，關閉fpu後需要130ms

相差了5.2倍

總結：fpu對浮點數加速效果非常明顯，一般粗略地可以認為在m4核心中有10倍的加速效果。這個fpu對中規模浮點數運算還是非常有用的，但是在低複雜度的計算中，1ms與0.1ms似乎對很多應用沒什麼區別，但是對於100ms和1s來說相差就很客觀了。當然更高的話就不應該用m4去做了。除了一般的加速，有了fpu還可以使用arm的數學庫，做fft運算，fir濾波等操作都非常方便。而且現在m3與帶fpu的m4**真的沒太大差別，怎麼選用還是看應用場景吧。

STM32 L431浮點數效能測試

32位短浮點數計算

Go程式語言3 2 浮點數

基於STM32的浮點數運算出錯詳解

STM32 L431浮點數效能測試

32位短浮點數計算

Go程式語言3 2 浮點數

基於STM32的浮點數運算出錯詳解

相關推薦