發掘內容粒度,需要仿生學

2021-04-18 04:39:33 字數 1985 閱讀 1872

[poor flickr][poor flickr]

基於抓蝦的按人訂閱的模式,我看到了sayonly的這篇高論《

發掘內容的粒度

》,這就是人們閱讀的一種方式。

這種方式是自然的,是因為我們經常會聽某位老師的系列講座,縱論天下,跨越幾千年;會把某位作家的所有作品通讀,這就是按人訂閱的原型。

當然,並不是唯一的一種。 

我們最通常的模式,實際上是按主題訂閱。 

也就是我們看電視看雜誌看報紙的時候,看到某乙個新聞事件或者視角,覺得蠻有趣的,於是展開閱讀,並且第二天如果有後續報道,我們也會優先閱讀。

這就是主題閱讀方式。 

發掘內容的粒度,需要仿生學。模仿使用者行為,抓蝦、googlereader、bloglines模仿按人閱讀。 

那麼按主題閱讀呢?

人們還有一種天然的閱讀方式。我的朋友了解我,他的小圈子在閱讀的書籍,也會優先推薦給我閱讀。這可能就是sayonly說的「sn閱讀方式」。 

現在有兩種路徑可以做到這一點。 

第一種,豆瓣式。 

第二種,機器硬算。 

我們這個團隊做過試驗,可以針對你sayonly的部落格專門給你推薦可能感興趣的文章。 

但是,機器兩年之內幹不過人。所以,我至今沒想明白,怎麼把人的發散性跳躍性和機器的嚴謹計算結合。

假定發掘粒度這個詞,sayonly指三種含義: 

發掘出你可能感興趣閱讀的人; 

發掘出你可能感興趣的主題【可能你知道這個主題,也可能你還不知道它的存在,比如新熱點,比如久遠的主題】 

發掘出你可能感興趣閱讀的文章。 

那麼,針對發掘出你可能感興趣的主題,以及發掘你可能感興趣閱讀的文章,我們做了乙個小小的有趣的嘗試:http://www.onejoo.com/ 。 

從頁面上看玩聚(onejoo)似乎不成熟,但它的背後揉合了以下技術: 

a.玩聚的熱點都是機器自動發現的,每天定時經過了大規模文字挖掘計算得到的當天的網際網路熱點;機器每天都在算。 

b.玩聚的每乙個專題的文章也絕大多數來自於機器的聚類計算或者從熱點導過來的。 

c.對於每乙個專題,機器都會每天計算後續追蹤報道,根據語義。

[限速標誌牌,司機躲不過的「陷阱」?

[山西設百萬獎金獎勵一把手

[職業乞丐增多,專家建議發放「行乞信用證明」

[李宇春搶劉翔風頭

體育界集體**?

]

,這幾個專題頁面的「時間脈絡」模組都清晰地顯示了

「李宇春搶劉翔風頭

」玩聚用到的技術: 

熱點新發現計算; 

時間脈絡計算; 

聚類計算; 

爬蟲,在酷訊大打嘴仗的今天如果爬蟲現在還算做技術活兒的話。 

這其實就是按主題閱讀的雛形。 

我們正在籌畫著另外一種按主題閱讀的表現形式,能夠更好地挖掘到內容,特別是長尾使用者真正個性化的需求。 

擴充套件閱讀:

技術英雄會【二】:問

csdn乙個資訊過濾器的問題

技術英雄會【四】:也談如何發掘到需要的內容和英雄

meme engine的原理(

)

抓蝦的未來和

web3.0的未來

發掘內容粒度,需要仿生學

poor flickr 基於抓蝦的按人訂閱的模式,我看到了sayonly的這篇高論 發掘內容的粒度 這就是人們閱讀的一種方式。這種方式是自然的,是因為我們經常會聽某位老師的系列講座,縱論天下,跨越幾千年 會把某位作家的所有作品通讀,這就是按人訂閱的原型。當然,並不是唯一的一種。我們最通常的模式,實際...

發掘內容粒度,需要仿生學

基於抓蝦的按人訂閱的模式,我看到了sayonly的這篇高論 發掘內容的粒度 這就是人們閱讀的一種方式。這種方式是自然的,是因為我們經常會聽某位老師的系列講座,縱論天下,跨越幾千年 會把某位作家的所有作品通讀,這就是按人訂閱的原型。當然,並不是唯一的一種。我們最通常的模式,實際上是按主題訂閱。也就是我...

發掘內容粒度,需要仿生學

基於抓蝦的按人訂閱的模式,我看到了sayonly的這篇高論 發掘內容的粒度 這就是人們閱讀的一種方式。這種方式是自然的,是因為我們經常會聽某位老師的系列講座,縱論天下,跨越幾千年 會把某位作家的所有作品通讀,這就是按人訂閱的原型。當然,並不是唯一的一種。我們最通常的模式,實際上是按主題訂閱。也就是我...