HLS for迴圈優化 dataflow 有疑問

有依賴關係，無法用合併。

對於有依賴關係的資料流，可以使得一有輸出就執行，提高交疊率，降低了 latency，提高了資料吞吐率。

。資料流優化就是在三個迴圈之間插入 channel（可以是 ping-pong ram、fifo 或 register）。通過配置資料流間的channel 選擇pp ram 或者fifo reg

這裡 loop2 和 loop3 是可以做迴圈合併優化的，但是不能使用 dataflow 優化，因為 temp1被 loop2 和 loop3 都使用了。

個人理解：乙個 for輸出的channel 只能作為乙個的輸入，單個扇出單端輸入，而不能簡單的考慮為wire

對於上述不能 dataflow 的**，可以稍作改變使之可以使用。

對於修改後的**，主要就是增加了乙個 loop_copy，就是把 temp1 複製兩份，分別賦給 temp2 和 te***。

ｑ：可以使用下述**達到嗎？？

for
(int i =
0;i)

接下來再看看 bypassing task 模型。由示例可以看出資料流向，din 通過 loop1 生成temp1，然後 temp1 通過 loop2 生成 te***；另外 loop1 還生成了 temp2，然後 temp2 直接到 loop3。所以相對於 loop2 而言，temp2 繞開（bypass）了 loop2。這時既不能使用迴圈合併優化也不能使用 dataflow 優化。

解決方法

在loop2中再打一拍，

改

是如何省資源的呢

vivado hls 實現 channel（即 memory）既可以用 ping-pong ram 也可以用 fifo，這取決於 producer 和 consumer 對資料的訪問方式。

如果引數是標量，指標或者引用，vivado hls 就會用 fifo 來實現。

如果是陣列的話，就可能是 ping-pong ram 也可能是 fifo，取決於 vivado hls 是否能判斷出資料流是否按順序訪問。也可以通過 config_dataflow 手動配置使用 ping-pong ram 還是 fifo。

如果使用 fifo 就要注意深度的配置，如果深度有問題的話，協同**時就會出錯。

HLS for迴圈優化 dataflow 有疑問

HLS for 迴圈優化其他方法

python優化迴圈 Python 優化迴圈

for迴圈優化

HLS for迴圈優化 dataflow 有疑問

HLS for 迴圈優化其他方法

python優化迴圈 Python 優化迴圈

for迴圈優化

相關推薦