阿里2015暑期實習生資料分析筆試題 部分

2021-06-29 12:21:19 字數 1989 閱讀 9007

昨天有幸參加阿里資料分析實習生的筆試題。在群裡發現好多人的題目多不一樣,應該是從題庫隨機發放的。
總共15題,客觀題和主觀題兩部分,答題時間60min

1、以下演算法對缺失值敏感的模型包括:

a、logistic regression

b、隨機森林

c、樸素貝葉斯

d、c4.5

3、某人賣掉了兩張面值為30元的**卡,均是30元**成交的,其中一張賺了20%,其中一張賠了20%。問他總體是盈利還是虧損,贏/虧多少?

a、不盈不虧

b、盈利2.5元

c、虧損2.5元

d、盈利2元

4、以下場景中,對應使用的挖掘演算法不合適的是:

a、用關聯規則演算法分析購買了羽毛球的買家,是否適合推薦羽毛球鞋

b、根據使用者最近幾年的消費金額資料,用主成分分析法你何處使用者未來乙個月可能的消費金額公式

c、根據使用者最近一年的購物日誌資料,用k-means演算法聚類出**賣家中的高富帥和白富美

d、根據使用者最近購買的商品資訊,用決策數演算法識別出**買家可能是男是女

5、投擲均勻正六面體骰子的熵是:

a、1bit

b、2.6bit

c、3.2bit

d、3.6bit

6、某調查公司接受委託滿意度調查,滿意分數在0~20之間,隨機抽取36名消費者,平均滿意分12,標準差3,在大樣本的假設下,根據調查結果對總體平均的置信區間,結果是:

a、9~15分

b、11~13分

c、12~14分

d、6~18分

7、市場部選擇部分使用者來進行產品a的簡訊推廣,獲取了使用者在時間視窗內是否購買了a產品的資料。資料探勘同學通過這些已知的是否購買資料,用來判斷其他使用者的購買傾向,這在資料探勘中屬於什麼任務?

a、聚類

b、**

c、探索性分析

d、關聯規則

8、如何將乙個excel檔案單元格c2中的手機號13501245678的第四位至第七位隱藏為*

a、=replace(c2,4,4,**)

b、=replace(c2,4,4,」**「)

c、=replace(c2,4,7,」**「)

d、=replace(c2,4,7,**)

9、邏輯回歸中回歸引數可以用以下哪些方法求解?

a、最小二乘法

b、牛頓迭代法

c、蒙特卡洛法

d、似然估計法

10、微軟的excel軟體是強大的資料分析工具,以入門簡單、擴充套件功能強大、視覺化豐富著稱,其中excel圖表是資料分析師最常用的用於展現分析結果的工具,excel圖表選擇描述正確的有:

a、折線圖用來展現資料隨著時間推移而發生變化,並可以**未來的發展趨勢

b、散點圖用來說明同一類別的數個事物中各項的組成比重,或者某一事物隨著時間推移其各個組成的比重變化

c、餅圖主要用來分析內部各個組成部分的佔總體的比重,反映對總體的影響

d、雷達圖主要是對同類別的二組事物在多種專案上的對比

11、請說明隨機森林較一般決策樹穩定的幾點原因。

12、考察sql語句:

有一張交易表a(trade_no為主鍵),一張交易異常表b(trade_no為主鍵),

1)、計算交易表a中的交易總數;

2)、通過關聯表的方式實現a表中去除b表異常交易(保留a中的字段即可)

13、某業務部門在上週結束了為期一周的大促,作為業務對口分析師,需要你對活動進行一次評估,你會從哪幾方面進行分析。

14、世界上每十萬人中就有一人是愛滋病患者。某一種藥物可以幫助檢測愛滋病,如果一人真是愛滋病,可以百分百檢測出來,而如果乙個人沒有愛滋病,它的檢測出錯的概率是1%。請問利用這種檢測藥物,監測正確的概率有多高?

15、閱卷官明天要去爬山,希望正在答卷的你幫他準備個包,裡面放一些必須的物品,請詳述一下你會如何處理。

主要考察,統計學的基本知識、資料探勘常用的十大演算法以及對資料敏感度和思考問題是否全面。

阿里 2020暑期實習生 筆試回憶

給若干點的座標,代表每乙個村子,現在要修一條平行於y軸且無限長的水渠,求所有村莊距離這條水渠垂直長度之和的最小值。include include include include include using namespace std intmain cout minval system pause ...

筆經 騰訊2018暑期實習生 資料分析崗筆試經歷

發現今年雖然很多公司有了資料分析崗位面向本科生開放,但幾乎資料分析師的實習筆試幾乎都沒有考程式設計,注意是幾乎都沒有考!這也給了我們一些啟發,也說明現在的資料分析崗位職能方向更細化。1.同事小鵝在訓練深度學習模型是發現訓練集誤差不斷減小,測試集誤差不斷增大,以下解決方法錯誤的是 過擬合怎麼處理 資料...

阿里巴巴暑期實習生筆試題

1.kmp演算法 長度為n的主串t中匹配長度為m的子串p n m 匹配成功 存在p的每個字元依次和t中的乙個連續字串行相等 輸出主串中匹配串起始位置,匹配失敗輸出 1 思路 首先用o m 的時間對子串進行預處理,可通過子串本身的特性判斷出需要右移幾位才是可能匹配的 然後用o n 的時間去完成匹配 時...