山東大學 資料科學導論 期末

2021-10-02 01:58:23 字數 395 閱讀 7566

一.簡答

1.dirty data在哪些過程怎麼產生

2.解釋entity resolution

3.兩個向量,計算距離(歐式,曼哈頓,漢明,切比雪夫,余弦)

二.好像也是簡答???

1.mapreduce

(1)設計map和reduce方法實現表自然連線

(2)兩個表的例項,根據表寫mapreduce自然連線過程(課件上的order和item表)

2.詞袋

(1)詞袋的含義

(2)一組句子,用詞袋向量表示

三.設計

1.personlrank,計算商品排序

2.乙個**,使用者對**評分

(1)直觀上a和哪個使用者最相似

(2)利用數學模型計算a和哪個使用者最相似

山東大學2017 2018web技術期末考試

一 填空題 html中安全色的數量,如果想要使用其他顏色需要採用的技術。html顏色表示rgb和?策劃書要點 藍圖需要考慮的三個方面 ajax apache配置檔案路徑和檔名 最好的設計 的方法 動畫的五個格式 w3c推薦的點陣圖格式 安置方法 json全稱 odbc全稱和功能 php對xml直譯器...

山東大學Python(3) 容器

使用 jupyter notebook 編寫 本章知識目錄 本節非常簡單,看ppt即可,下面的 為一些測試 考試 非常重要 查詢 增加 刪除 引用 ppt所有的都要看 list list name.remove x 刪除首次出現的值為x的元素,x不存在則丟擲異常 del list name inde...

山東大學學報稿件查詢

查詢稿件狀態並上傳郵箱,很多國內期刊模板一致隨意改動 coding utf 8 time 2019 12 1 22 17 author yemanzhongting email sggzhang whu.edu.cn file 1.py software pycharm usr bin python...