說幹就幹 01

2021-10-03 15:55:03 字數 860 閱讀 6773

1、爬取了成語大全資料,樣例:

包括了成語名稱,拼音,解釋,出處,繁體,簡拼,常用程度,字數,情感色彩,用法,結構,年代,近義詞和反義詞。一共兩萬七千多個成語。

2、構建圖譜

用python將爬取的成語構建圖譜資訊,涉及到的python驅動有兩個,neo4j-driver和py2neo,還乙個http的neo4jrestclient

有幾個對比的資訊:

結論是雖然py2neo使用比較方便,但有人測試還官方的在大資料量上效能更好,貌似官方的使用上也沒那麼難用。

從github上看,貌似py2neo的支援更多點。

綜合考慮,先考慮用官方的吧,以後再說更換的事兒。

3、成語圖譜框架

既然從成語接龍這件事兒啟動的,那就先以接龍為引子構建吧,建立兩種接龍關係,乙個是強接龍關係,即第乙個成語的最後乙個字是第二個成語的第乙個字,乙個是弱接龍關係,即第乙個成語的最後乙個字的拼音與第二個成語第乙個字的拼音相同。

兩萬的成語,關係構建尚未結束,包括同文字的強關聯,也包括了拼音的弱關聯。預計構建完成後關係的數量超過了節點數量數十倍甚至上百倍。

4、成語圖譜應用

這個打算做個前端介面,提供的功能包括兩個,乙個是檢索,乙個是接龍,檢索提供模糊匹配的方式查詢成語,接龍是隨便找個成語,檢視最短接龍和最長接龍,完成乙個接龍的標準為第乙個成語的第乙個字是最後乙個成語的最後乙個字。最長接龍可能存在效能問題。

總結:資料爬取完畢,開始熟悉官方neo4 jpython驅動日常正常使用,並從後台往圖資料庫抽取關係了。

說幹就幹OTA加密指令碼

include include include free define maxbinsize 200 1024 int main int argc,char ar if argc 1 else if argc 2 fp1 fopen stm32f412re stm32f412rebootloader...

01《構建之法》閱讀筆記01

個人感受 我過去的做法 1 寫程式以實現功能為主要目的,所以有時候為了功能的保證,會不太注重演算法的使用。2 在團隊專案中,習慣了個人程式設計,和團隊成員溝通偏少。為什麼這樣不好 1 不注重演算法的使用,會無端的浪費空間和執行時間,使程式效率大大降低。2 團隊成員之間交流過少時,融合會經常出現問題,...

LEETCODE刷題01 顛倒整數01

為提高自己的專業技術,藝多不壓身,早上吃了飯就去了leetcode看了看,覺得挺有意思的。記錄一下答題過程吧 題目是這樣的 給定乙個範圍為 32 位 int 的整數,將其顛倒。例 1 輸入 123 輸出 321例 2 輸入 123 輸出 321 例 3 輸入 120 輸出 21 注意 假設我們的環境...