開始系統學習搜尋引擎相關知識

2021-08-29 11:12:57 字數 449 閱讀 9306

一直認為作為乙個軟體工程師,不能夠只知道寫程式,一定要有一定的領域知識才可以做得更好,更能夠成為乙個成功的軟體工程師。在研究生階段就想找乙個領域認真研究研究,但是在研究生階段做了很多軟體開發相關的研究和工作,沒有真正在「研究」生階段做很多研究,現在想想可惜了中科院良好的研究環境。

現在工作的公司重點在於nlp和搜尋,工作也不是很忙,老闆也很好給了很多時間做nlp方面的研究。自己仔細考慮了很長時間,還是決定投入搜尋這個行業中。

既然做了決定,之前的種種顧慮,猶豫都應該沒有了。從現在就實際行動起來,先定一下現在能想起來必須要做的事情:

系統學習搜尋引擎的技術,原理。這部分主要通過精讀天網李曉明老師的《搜尋引擎:原理、技術與系統》和搜尋大牛盧亮的《搜尋引擎原理、實踐與應用》兩本書和一些相關的*****。

深入學習lucene。多實踐,結合公司的專案進行學習。目標是對公司的搜尋系統能夠提出實質性的優化改進意見,並且付諸實施。

搜尋引擎相關資源

搜尋引擎相關資源 rfc the requests for ments 文件 英文rfc搜尋,很強大的rfc搜尋功能 英文rfc庫 china pub的rfc中文翻譯計畫,裡面有不少rfc文件已經翻譯成中文 china pub提供的rfc文件索引,相信國內的朋友訪問速度會快點 相信這個是目前最大的m...

搜尋引擎學習

發展的里程碑 搜尋引擎按照實現的方式分類 在計算機上表示資訊獲取流程,具體包括 資訊的表示 資訊儲存 資訊組織和資訊訪問 首先需要建立進行檢索的資料,用其構建文字資料庫 建立好文字資料庫後,就需要建立文件的索引。lucene全文搜尋元件中是通過倒排索引的方法建立索引 建立好索引後,就可以進行檢索。使...

搜尋引擎 知識梳理

按照詞被搜尋的頻率進行排序 例子 漢字提示的功能,從user log中提取出每天搜尋頻率最高的詞,和這些詞命中的搜尋結果數,更新到伺服器中,然後提供補全提示功能。資料每天凌晨增量更新一次,保證資料的實時性。使用者輸入,使用者每次按下鍵盤,觸發js的keydown事件,傳送乙個請求到cgi,cgi將使...