生不逢時的360搜尋

2021-09-30 15:15:15 字數 3331 閱讀 6178

這篇文章,我盡可能迴避專業的技術,盡可能用通俗的語言給大家分析一下360等搜尋,如有不當之處,請勿見笑。

軍事上可以從乙個統帥的性格,來判斷他可能的指揮方式。同樣,從乙個企業的產品、企業運作,我們可以看到乙個企業領導人的性格,從而從這個性格又可以進一步推測他下一步可能的行動。

周鴻禕其實是有很強的搜尋情節的,因為他的第一桶金就來自一款搜尋產品—3721,儘管後來這款產品被人評價為流氓軟體,但是不可否認一點,那就是在中國網際網路普及的階段,對於大批連com和net是啥都分不清楚的人來說,3721讓他們使用熟悉的中文就可以在網上暢遊了。

當初3721是這麼宣傳的:「3721公司提供的中文上網服務――3721「網路實名」,是第三代中文上網方式,使用者無需記憶複雜的網域名稱,直接在瀏覽器位址列中輸入中文名字,就能直達企業**或者找到企業、產品資訊。」但是在網路上3721被稱為是最大的流氓軟體之一,現已停止運營。

「3721網路實名外掛程式由奇虎公司現任董事長周鴻禕一手創辦,它通過位址列實現中文搜尋。2023年11月,雅虎1.2億美元收購3721公司,該軟體更名雅虎

助手。2023年10月,阿里巴巴宣布完成對雅虎中國全部資產收購,3721業務隨之併入馬雲手中。2023年,網際網路業內掀起「反惡意軟體」的熱潮,周鴻禕率領360安全衛士成為反惡意軟體先鋒,曾經由他一手創辦的3721軟體(雅虎助手)則成了他「圍剿」的重點目標之一。當年9月,阿里巴巴宣布投資1億元繼續開發與推廣雅虎助手,但隨後並未看到有實質的市場舉動。」這是網上對3721的一段描述。

3721最大的爭議,就在於他的傳播方式,還有安裝後排斥競爭對手、獨佔使用者電腦的網路查詢介面的技術手段。3721雖然給那些菜鳥網民提供了極大的方便,但是對於那些掌握一定技術能力的熟練網民,還有就是被3721所干擾的競爭對手,都會採取各種手段針對3721。從而使得3721在幾年後變得越來越被更多的人所排斥。

當年的3721一出來,採用的是利用windows 98的系統漏洞,用病毒的方法進行傳播,在短期內就積累了海量的使用者。有人曾經問過徽劍「你覺得中國最大的黑客是誰?」我當時回答「我也許不好說中國技術最牛的黑客是誰,但是我可以肯定周鴻禕是商業上最成功、規模最大的黑客。別的黑客只能賺點小錢,他可以通過病毒等黑客手段賺到以億來計算的財富」。

當然,時過境遷,我們今天再來評價3721已經有些過時,下面就讓我們來看看360的搜尋吧。

最原始的搜尋,就是建立在資料庫

基礎上的關鍵字匹配,後來進一步延伸到所謂模糊查詢、統計分析、知識發現等系列技術的應用。因為搜尋,可以讓網民從海量的資訊中找到他需要的資源,減少了他挨個去查詢的時間,提高了他的使用效率,從而使得今天的網民,在上網的時候,已經無法離開搜尋。

很多人把搜尋看的神乎其神,其實根本沒那麼複雜。只要乙個會做網頁的技術人員、乙個懂得儲存應用開發的技術人員、乙個對c或者c++開發tcp/ip應用比較熟悉的技術人員、乙個對索引檢索開發熟悉的技術人員,就可以組成乙個搜尋引擎開發團隊。

1、會做網頁的,去做跟使用者對接的那部分。

2、懂得儲存應用開發的技術人員,負責搭建儲存系統,乙個最簡單的方式,就是搭建一批伺服器,每個伺服器分門別類,比如a組伺服器負責儲存新聞,b組伺服器負責儲存娛樂等。再細分下去,a1伺服器負責儲存人民網的,a2伺服器負責儲存新華網的,b1伺服器負責儲存李宇春的資訊、b2伺服器負責儲存周杰倫的資訊等等,如此類推,

4、對索引檢索開發熟悉的技術人員,負責對抓下來的文字做進一步分析,利用單詞和短語庫,對文字進行分析,按照儲存伺服器的配置,把不同的資訊,儲存到對應的伺服器裡面。同時他還需要和1合作,對於網頁上使用者提出的查詢要求,他要做出文字分析,然後導引到指定伺服器上調出相應結果。

以上就是乙個搜尋引擎的技術的大致體系,當然,實際中的搜尋引擎,遠比這個複雜。區別就好比鑽天猴的烟花和火箭的那麼大。但是基本的架構原理還不會變化的。其實我們都知道,很多時候,理論很好明白,但是實際做起來會在細節上面臨大量問題。那麼這裡有哪幾個地方會比較難呢?

依照徽劍我對搜尋引擎技術差不多十來年的關注,我總結出搜尋引擎技術的兩大門檻:

第乙個門檻:海量的資料蒐集和儲存,

第二個門檻:搜尋結果的優化

下面分別表述:

這這個海量資料的蒐集就需要大量的爬蟲伺服器、還有大量的時候去處理。問題在於不光是蒐集過來,這邊還得儲存,這就需要大量的儲存系統,說白了就是需要海量的硬碟。你想想,你要把差不多整個網際網路上的各種**的資料都要抓一部分,甚至全部。這資料量多大可想而知。

第二個門檻:搜尋結果的優化,這個就涉及到好幾個方面,一是儲存系統的資料檢索需要做到快捷方便,需要定期對搜尋行為做出分析,對於不同熱度的查詢資料,用不同優先權的快取伺服器來處理。二是對網民查詢內容的優化,很多時候,網民在查詢時,並不能很好的表達他的意思,所以如何去理解,給出盡可能近似的結果,是非常關鍵的事情,打個比方,使用者搜尋張柏芝,也許是要找謝霆鋒相關的,也可能是要找跟陳冠希相關的。三是儲存時要對網頁進行語義分析,如何準確識別乙個網頁的主要內容,還有這個網頁在網路上的價值,比如是不是第乙個發布的?是不是有跟類似網頁區別的?等等,這些都需要做很複雜的工作。

也許有人不明白為啥需要人工干預,道理很簡單,因為計算機無法基於語義分析,而網民使用搜尋引擎的時候,是按照他的個人意識來檢索的,因此搜尋引擎檢索出最接近語義的結果,就成了乙個非常迫切的任務。因此這個時候,建立在基於統計結果的資料基礎上,通過對於資料做出的知識發現,然後再結合人工輔助修正,就可以得出更加完美的結果。

如果僅僅從搜尋的角度看,360的系列軟體,特別是瀏覽器有海量的安裝使用者,瀏覽器本身就是網際網路的入口,360可以利用瀏覽器上嵌入的導航頁面和搜尋框,使得使用者預設選擇360搜尋引擎。這就是360可以驕傲的資本。

除此以外,別無其他。

那麼360搜尋的瀏覽器優勢又會有多大?

很多人都在說,360有瀏覽器,所以360的搜尋肯定可以做的很好,那麼徽劍要反問一句,微軟

那麼有人會問360搜尋會如何發展呢?徽劍我把看可以分為這幾個部分:

第一,利用360瀏覽器的搜尋入口,從而帶來巨大的入口數量眾所周知,360瀏覽器在國內目前有較大份額,因此利用瀏覽器上的導航**和搜尋介面,吸引使用者使用預設的360搜尋,這個肯定是360的重點發展方向。從目前360搜尋推出來的這幾天看,也是這樣運作的。

第三,干擾其他搜尋引擎的發展,360搜尋的發展必然面臨其他搜尋引擎的競爭,但是短期內360又無法提供足夠優質的搜尋結果,那麼怎麼競爭?如同跑步比賽一樣,如果你跑不過其他人,你又想拿第一,怎麼辦?乙個最簡單的方法,就是讓其他人變慢。因為諸如360安全衛士、360防火牆等佔據了大量的使用者計算機,那麼360完全可以對其他搜尋引擎的結果展示頁面進行「安全」考察,可以採用的方法包括,利用360防火牆,干擾其他搜尋引擎的資料報傳輸;利用360安全衛士,對其他搜尋引擎的結果向使用者報警,提示「有安全威脅」,從而實現干擾使用者的選擇。

多年前,我就成功預言了360的搜尋引擎之路,今天我又對360搜尋做出了幾項預言吧。

最關鍵是,我發現今天的360搜尋,很多方面已經走上了3721的道路,所不同的是瀏覽器外掛程式變成了瀏覽器等,下一步一些像前面說的那些手法,我覺得早晚必然會出來,一旦出來,必然會重蹈3721的覆轍。

盤點10大生不逢時科技創業公司 創意過於超前

據國外 報道,有句形容創業公司的老話說,太早也是個錯誤。這絕對是個事實,在很多偉大的科技公司成立之前,相同的創意已經存在,但是因為時 機不對,結果沒有形成氣候。下文將點評10大生不逢時的科技創業公司,這些公司的專案是創新的,但是因為出現得太早,市場尚未做好準備,所以最終失敗。同型別的公司在數年後取得...

360搜尋初體驗 分享360搜尋的不同點

從昨天開始一直在觀察360綜合搜尋,畢竟是360剛剛出來的產品,具有很多的不同點,記得昨天在36氪看到這款搜尋之後,那文上寫著 融合和google的搜尋結果 rdq程式設計客棧uo 意思就是還沒有推出自己的搜尋,僅僅是融合其他兩個,可是昨天在站長網上看到360宣告了是自己獨有的搜尋資料和引擎,然後筆...

360搜尋最新動態

8月26日360搜尋橫空出世,瞬間改變了國內搜尋引擎市場格局,其在國內的市場份額在短短五天時間內超過了谷歌 搜狗 搜搜 有道等各位搜尋前輩,一躍成為國內第二大搜尋引擎。程式設計客棧最近貌似關於360搜尋的新聞漸漸少了,難道360只是為了炒一把嗎?其實,360不但沒有退出這場競爭,相反在苦練內功,不斷...