演算法面試彙總

2021-09-12 13:27:27 字數 2472 閱讀 1986

這是我遇見最難得面試,最難,最難,重要的說三遍;

自我介紹,這都是套路了,簡單介紹就好;

介紹比賽過程,怎麼做的比賽,然後隨機提問;

從boosting到adaboost到gbdt到lightgbm介紹演變路線,各個模型到底是怎麼回事;

怎麼做的特徵工程,哪些特徵比較重要;

一定要做eda和特徵工程嗎,這裡回答比較傳統,應該比較lightgbm和nn,nn的優勢就是避免了特徵工程;

不同的模型(主要分析lgb和nn)資料應該如何處理,有什麼不同的處理方式嗎,為什麼會有不同;

比賽用的什麼指標,roc,roc是怎麼得來的,知道g-roc嗎,roc評價指標是否合理,有沒想過考慮其他的;

nn怎麼來做這種任務,從mlp到deepfm(簡單的思想);

怎麼避免過擬合,老生常談了,如何避免欠擬合,這裡簡單的整理了下,歡迎補充;

問了乙個概率題,我是很懵逼,乙個骰子,隨機往桌子上扔,求扔多少次,每個面至少出現一次,扔的次數的平均值(十分**),思路是從最少的次數到最大的次數,然後求各個次數每個面至少出現一次的概率,得到乙個數列後,對這個數列進行求和,n趨向於無窮大求極限;從這裡基本就炸了;

有兩根不均勻分布的香 香燒完的時間是乙個小時,你能用什麼方法來確定一段15分鐘的時間;我當時沒想出來,非腦筋急轉彎;

介紹下高斯分布和泊松分布,以及泊松分布和二項分布的關係;

強化學習了解嗎,簡單介紹下;

能否將乙個思想或者任務,擴充套件到多個方面,是個開放性問題,舉例子比如說強化學習除了常見的用在遊戲中,其他領域如何應用,考察理解的廣度;

leetcode medium題56. merge intervals 當時忘了最優怎麼做了,非常尷尬,哎,表現最不好的地方吧。

關於特徵工程的一些討論,是否有必要;

你的興趣是什麼,以後想從事什麼工作,其實這個想問是否和他們的工作契合吧,我換了一種回答方式;

在小公尺的工作任務是啥,**分類,簡單介紹下如何實現**分類,兩種方法分別是什麼;

關於**的一些討論,還有學校的一些事情;

自我介紹

介紹quora比賽,具體是什麼,都做了哪些工作;

aichallenger都做了什麼,這個比賽是怎麼回事;

word2vec、glove、fasttext分別是什麼,如何得到的,相互比較;

如何得到句子向量,和詞向量的關係;

什麼時候開始學nlp,專業和導師是做什麼的,是否自學;

attention機制是怎麼回事;

rnn、lstm等怎麼回事,有什麼缺陷;

attention機制的softmax是怎麼做的;

transformer是怎麼回事;

樣本不均衡如何來解決;

如何避免過擬合;

常用什麼語言,什麼框架;

神經網路如何調參,煉丹的思想;

簡述貝葉斯調參;

在瀚思科技(第一家實習公司)的實習經歷,在小公尺的工作和任務;

自我介紹

介紹自己的比賽經歷,詳細介紹科大訊飛的比賽過程;

比賽任務是什麼,都包括哪些特徵;

在小公尺的實習經歷,工作內容是什麼;

gbdt和xgboost分別是什麼回事,區別是什麼;

xgboost並行化是怎麼回事且是如何實現的;

提取了什麼特徵;

手機品牌的特徵如何進行分析的;

stacking的原理是什麼;

開放性問題(這個問題問的最久),如何根絕王者榮耀玩家的歷史資訊,對玩家進行道具和**的推薦;

對於上述問題,如何推薦金幣卡和經驗卡,提取哪些特徵;

對於大規模稀疏資料如何處理,訓練乙個模型還是多個模型;

fm、ffm相關的簡單介紹;

介紹下mapreduce和hadoop相關的原理;

spark的某個函式如何使用;

簡單介紹,本科是哪,能什麼時候來實習;

問比賽和專案經驗,非常細,挑自己最熟悉的講;

從頭到位介紹了科大訊飛的比賽過程和比賽細節,一定足夠熟悉比賽過程;

特徵選擇的方法,嵌入法(lgb)vs過濾法(卡方檢驗);

為什麼這些特徵用lgb篩選,另一些特徵用卡方檢驗來篩選;

為什麼用5折交叉;

模型融合,為什麼融合,怎麼融合,何為最優模型。這個地方討論了很多,要深刻理解模型訓練的實質,模型學習train,val,test的統計分布。這裡我的回答非常不確定,應該和實際的工程相關,模型訓練的目標不是單純的比賽刷榜,而是提高泛化能力。

有沒有做資料預處理,如何做的;

和top的差距在**,後來有發現什麼提高模型的辦法嗎;

quora比賽,如何做的,模型的輸入是什麼,這個比賽最後選擇的方案是什麼;

aichallenger比賽,細粒度,粒度都是什麼,如何訓練的。比賽內容的介紹。文字長度,模型輸入是什麼等等;

lightgbm為什麼比xgboost快;

比賽分工是什麼;

[1]

[2]

Java C 面試手撕演算法彙總

面試手撕演算法彙總 實在沒有o 1 的方法,只能實現o n 歡迎討論。方案1 建立n個數字的陣列,迴圈相加,將大於1的數字列印出來 方案2 map,先contains判斷,存在就列印,不存在就put 首先,題主你的問題其實就是乙個上的矩陣能否變成全是1的形式首先,任意乙個域上的矩陣都可以通過三種初等...

美工面試彙總

大部分的公司都會從以下幾個方面來問你一些設計基礎 先會詢問一些基礎設計理論 常見的ui設計理論和設計法則 1.色彩搭配理論 如果什麼是暖色,冷色,前進色,後退色,什麼顏色代表什麼意思。比如電子商務 配什麼色好?為什麼?2.造型和構圖理論 比如透視,變形的簡單原理等。3.css和html方面 基本的盒...

GBDT XGB Adaboost面試彙總

1 boostrap從袋內有放回的抽取樣本值 2 每次隨機抽取一定數量的特徵 通常為sqr n 分類問題 採用bagging投票的方式選擇類別頻次最高的 回歸問題 直接取每顆樹結果的平均值。1 相同點 都是由多棵樹組成,最終的結果都是由多棵樹一起決定。2 不同點 組成隨機森林的樹可以分類樹也可以是回...