最近做的SES Demo

2021-04-13 13:23:46 字數 829 閱讀 3835

插值的實現通過普通的c code(1),amd的apl效能庫(2),intel的ipp效能庫(3)來分別做。

在dual core的機器上,若(1)繫結在core1上,(2)和(3)都繫結在core2上,這樣的話(1):

(2):(3)的fps大約在1:3:9,測試證明rendering基本不費時間,fps的決定性因素在於resize的過程。當時很雀躍,覺得ipp很厲害。but。。。

三種方式在quad core的機器上依次單獨執行,發現(2)的效能要比(3)高,原因在於apl內建了運算的底層多執行緒,cpu占有率不止於乙個核所佔的比例25%,可能是呼叫了openmp等非顯式的多執行緒方式。如果把apl所開的執行緒數用api規定死,三種方式各自繫結到乙個核的情況下同時執行,apl就跑不過ipp了,(1):

(2):(3)的fps大約在1:2:2.5。

apl是免費的,支援資源有限,估計國內的tce也少,team不多。同時,它的檔案做的實在太大了,解壓後有800mb+。

ipp是收費的,支援資源豐富,國內的tce人手豐富,版本公升級頻繁。而且庫的大小不過數十mb。

就兩者的易用性和使用方式來看,幾乎完全一致,無怪後出品的apl揹負了抄襲ipp的名聲。不過也難怪,做多核cpu的就那麼2家公司,推廣cpu的責任當然也由他們承擔。既然intel先下手出了ipp,自然各種該考慮到的因素都會考慮到,amd後起直追,這方面落後了只有在效能上和**上補,試圖占領更多份額,擴大自己的影響。

amd的tuning工具還沒用,潛意識覺得應該不會比ibm rational purify plus好。

順便說一句,via號稱是做cpu的第三家大廠,可是不往多核方向發展,只往低功耗的小型化方向去做,還號稱綠色環保,太讓我失望了。

最近做的測試

你 熱 愛 學 習 你 最 感 興 趣 的 題 目 取 決 於 你 的 其 他 主 題 和 經 歷 但 無 論 是 什 麼 題 目 你 總 是 受 到 學 習 過 程 的 吸 引 過 程 而 不 是 內 容 或 結 果 最 使 你 興 奮 從 無 知 到 熟 練 的 扎 實 而 執 著 的 進 程 ...

最近做專案感想

最近做專案,與同事有一些碰撞,也有些感悟。以目前的經驗感悟,專案開發核心精華在於架構 方案設計,就好比開發的核心是演算法 設計模式,這才是讓專案在整個生命週期中受益的東西。不要為了學習某種新技術,而去應用它 也不要因為不熟悉,也不用某種技術 方案。而是要根據專案場景決定是否採用。分析場景,分析使用者...

最近做頭部檢測

使用場景 最近做了乙個頭部檢測的模型,現場使用效果是考勤機在正前方的攝像頭,檢測出有沒有人頭 最終選用的網路 影象的輸入size選用 w 120,h 160,產生推選框好像是1118個 該項目的注意要點 1 因為使用了ssd框架,涉及到設定priorbox的引數,就需要統計訓練樣本resize為目標...