人腦存在搜尋引擎的實驗設計問題 回武夷山老師

2021-08-25 19:00:56 字數 1471 閱讀 1521

2023年4月5日,我在文章"

這個實驗包括兩個部分

2.在網際網路網頁上填寫同樣5個**名稱,並填寫網際網路唯一識別符號「

一。中國科學技術資訊研究所總工,研究員武夷山老師提出:「

應該用熟悉還是不熟悉的詞彙(概念)來測試?應該請教一下心理學或認知科學專家。 」

我的回答:

「武夷山老師提出了非常重要的問題,熟悉的詞彙是否會影響實驗,對於這個問題,我曾經這樣思考:

在對測試者進行詢問時,我們提到「剛才ppt是否出現下列詞彙」,這句話暗含了乙個獨特的限定情景,那就是「2023年3月24號科學院研究生院玉泉路校區15點半103教室用到的ppt中',這個限定同樣會讓測試者能夠區別資料是侷限在本次實驗,無論它們是否是以前熟悉還是不熟悉的。」

二。武夷山老師繼續提問:「

我不懂心理學,但直覺上認為,既然要與搜尋引擎比,在實驗中至少要注意三點:1、測試物件的量不能太小。比如我們在想乙個合適的詞來表達乙個意思時,是從掌握的海量詞彙中進行檢索的。2、不能只用熟悉的詞彙。搜尋引擎對於熱門資訊的搜尋效果(相當於熟悉的詞?)總是不錯的,但沒有代表性。3、應該有意識埋伏一些干擾項。現在5個也好、8個也好,都是**名稱,同質的,測試任務太容易了。 」

「掃瞄資訊,儲存資訊和檢索資訊的機制」,不需證明啊。高明棋手掃一眼棋局就記住了雙方棋子的位置,不就是掃瞄和儲存嗎?賽後覆盤,不就是檢索嗎?

我的回答:

武老師,您的確是快速指向的核心,某種角度,我是刻意選擇1,熟悉的單詞,2,數量不大,易於記憶和檢索。原因是我們是要證明大腦中包含掃瞄資訊,儲存資訊和檢索資訊的機制,而非證明其不存在,我在試圖尋找達到此目的最簡單的方法。可以增加複雜度,但會出現不穩定的結果,就需要解釋為何不匹配的原因,但這個解釋卻不是我們現在需要的,舉乙個例子,比較兩個籃球,乙個是標準籃球,乙個是包在箱子裡的籃球,我們要做的是找到箱子裡的籃球,箱子暫時不討論。不過武老師說的用不熟悉的單詞,我們會再做一遍 。

還有一點,武老師,我們用了8個詞彙進行測試,這些詞彙裡不但包含了剛才出現的,也包含沒有出現的詞彙,用這種黑白對比消除因為熟悉和數量簡單導致的誤差,中而言之,這個實驗設計是試圖尋找最簡單的方式,並以此為基礎擴充套件後續的思考。

做這個實驗,同自由落體的實驗是一樣的,我們熟知扔到空中一定要落地,但為了描述自由落體的過程,我們還是會一次次的做實驗。要證明的不是大腦中掃瞄,儲存和檢索,而是要驗證大腦和搜尋引擎有同樣的機理和結果。因此我個人認為這個實驗看似沒有意義,但不做就不能用實證的方法進行研究。供武老師指正

三 。繼續思考

武夷山老師的意見還是提醒我們可以對實驗繼續改進,把測試資料改為無論對於測試者,還是搜素引擎都沒有識別過,再進行一次實驗,雖然結果幾乎顯而易見。期待科學網心理學或認知科學專家能給與批判和指點。多謝

更多關於網際網路演化論的內容在:

垂直搜尋引擎模組設計

3 初次過濾模組 過濾廣告,導航等無用資訊 概覽頁面選定區域內包含鏈結的規則識別 位址過濾和轉換。細覽頁面選定區域內包含資料的精確識別 格式轉換 內碼轉換,位址轉換,時間轉換等等 基於視覺的網頁自動分割槽技術 vips 網頁分割槽後的區域型別和特徵的自動標註。dom樹結構分析 基於分割槽的網頁結構分...

垂直搜尋引擎模組設計

3 初次過濾模組 過濾廣告,導航等無用資訊 概覽頁面選定區域內包含鏈結的規則識別 位址過濾和轉換。細覽頁面選定區域內包含資料的精確識別 格式轉換 內碼轉換,位址轉換,時間轉換等等 基於視覺的網頁自動分割槽技術 vips 網頁分割槽後的區域型別和特徵的自動標註。dom樹結構分析 基於分割槽的網頁結構分...

lycos搜尋引擎 常用的搜尋引擎都有哪些特點?

1 基於字詞結合的資訊處理方式,巧妙解決了中文資訊的理解問題,極大地提高了搜尋的準確性。2 智慧型相關度演算法。採用了基於內容和基於超鏈分析相結合的方法進行相關度評價,能夠客觀分析網頁所包含的資訊,從而最大限度保證了檢索結果相關性。4 智慧型性 可擴充套件的搜尋技術保證最快最多的收集網際網路資訊。擁...