GitHub上最全中華古詩詞資料庫又火了

2021-10-01 18:23:28 字數 524 閱讀 9871

github上最全中華古詩詞資料庫再次登上熱榜,又火了一把。根據介紹,chinese-poetry最全中華古詩詞資料庫集合了唐宋兩朝近一萬四千古詩人, 接近5.5萬首唐詩加26萬宋詩. 兩宋時期1564位詞人,21050首詞。該專案已經獲得了 22.6k 個「star」以及 4.2k 個「fork」。

github專案:

github上最全中華古詩詞資料庫又火了

最全的中華古典文集資料庫,包含5.5萬首唐詩、26萬首宋詩、2.1萬首宋詞和其他古典文集。詩人包括唐宋兩朝近1.4萬古詩人,和兩宋時期1.5千古詞人。資料**於網際網路。

為什麼要做這個倉庫? 專案作者表示,古詩是中華民族乃至全世界的瑰寶,我們應該傳承下去,雖然有古典文集,但大多數人並沒有擁有這些書籍。從某種意義上來說,這些龐大的文集離我們是有一定距離的。而電子版方便拷貝,所以此開源資料庫誕生了。此資料庫通過json格式分發,可以讓你很方便的開始你的專案。

古詩採集沒有記錄過程,因為古詩資料龐大,目標**有限制,採集過程經常中斷超過了乙個星期。2023年新加入全宋詞,全宋詞爬取過程及資料分析。

iOS最全效能優化 上

ios最全效能優化 上 ios最全效能優化 中 ios最全效能優化 下 我要給出的建議將分為三個不同的等級 入門級 中級和高階級 1.用arc管理記憶體 2.在正確的地方使用reuseidentifier 3.盡可能使views透明 4.避免龐大的xib 5.不要block主線程 6.在image ...

iOS最全效能優化 上

ios最全效能優化 上 ios最全效能優化 中 ios最全效能優化 下 我要給出的建議將分為三個不同的等級 入門級 中級和高階級 1.用arc管理記憶體 2.在正確的地方使用reuseidentifier 3.盡可能使views透明 4.避免龐大的xib 5.不要block主線程 6.在image ...

GitHub 語義分割最全資料集錦

cver 陸續分享了github上優質的ai cv資料集錦,如影象分類 目標檢測等,之前的分享詳見文末。很多同學反映這個系列很棒,因此系列將繼續更新。其中每個部分介紹的都非常詳細,比如乙個 會相應介紹其多種復現的開源 基於pytorch tensorflow等 主要涵蓋了2015 2019年間的優質...