騰訊 百度 滴滴最新NLP演算法面經

2021-10-16 13:35:51 字數 2878 閱讀 1261

因多方面因素,2023年的秋招形式依然嚴峻,特別是ai相關的演算法崗位,競爭十分火熱,既內卷又倒掛。

1、自我介紹

自我介紹即開場白需要提前準備並多次練習,內容不用太多,言簡意賅地講清楚學校、專業、研究方向,概括介紹實習/**/比賽等亮點即可,細節可以根據面試官的興趣再深入。

2、專案/實習經歷

這部分主要根據簡歷上的實習/專案進行,可能會問背景、怎麼做、為什麼這樣做、最終結果、是否成功上線等,再深挖一些技術細節,或順帶考察ml、dl等知識點。

由於校招同學沒有工作經驗,所以專案和實習是展示自身能力的最好亮點(一堆ccf-a的大佬請忽略並接受我的膝蓋)。面試官可以從介紹中了解你的工程能力、抗壓能力、溝通能力、思維方式等等,如果吸引到面試官肯定能加分,要是面試官覺得索然無味估計面試也就到這兒了…

所以對於簡歷上的內容要滾瓜爛熟,能知其然知其所以然最佳。如果問到簡歷上的內容沒答上或吞吞嗚嗚,將非常打臉,造成硬傷(簡歷上自己寫的都不會,別的還用問嗎╮( ̄▽ ̄)╭)。

切忌在簡歷上洋洋灑灑地寫「熟悉xgboost、svm、bayes、hmm、crf、knn、lr、cnn、attention等演算法」。是聽過名字就算熟悉?還是啃過原始碼、理解背後原理?即便真的對這些演算法理解透徹,最好也能結合例子來說明,而不是窮舉。

而對於沒有專案/實習/比賽經歷的同學,這一部分時間只能由考察基礎演算法來彌補了,這樣一來隨機性、難度都提公升了不少;所以平時盡可能多積累這方面的經驗,讓簡歷充實起來。

專案 or 實習 or 比賽 or **」最好為真,這是底線。

3、介紹乙個比賽

我從簡歷上3個比賽中,選擇了乙個最有亮點的比賽,從資料、模型、提分trick三方面做了介紹。

4、如何實現知識蒸餾,loss怎麼選擇

5、介紹tinybert的工作原理

6-9考察機器學習基礎

6、lr是線性模型嗎,為什麼?

7、梯度下降和隨機梯度下降的區別

8、gbdt和xgboost的區別(至少3方面)

9、偏差和方差的區別

10-11考察深度學習基礎

10、怎麼理解xlnet的,xlnet的輸入是什麼?

11、乙個二分類任務,假設只有乙個維度的特徵,取值範圍是0~正無窮,如何實現二分類?

12、手撕**:兩個陣列求交集

只能使用 list,如果要用其他資料結構(比如字典)需要自己實現;時間複雜度盡可能低。

關於手撕**,今年應該是非常關鍵也是必做的環節,很多公司直接將程式設計題作為通過面試與否的硬性指標。刷題要趁早!

**二面

1、詢問兩個實習專案,詳細考察細節

2、介紹textcnn實現過程,池化時loss如何反向傳播

3、假如不用bert,一大堆文字有幾百萬個詞,直接訓練詞向量很困難,如何去做特徵選擇

4、lstm門控機制是怎樣的

5、ltsm主要解決了rnn什麼問題,為什麼能解決

6-9重點考察語言模型

6、介紹gpt2如何寫詩、寫對聯

8、elmo、bert、gpt模型彼此之間有什麼區別

9、word2vec和elmo主要有什麼不同,為什麼elmo效果更好

1、詢問導師、實驗室的研究方向

2、智慧型客服系統中,你主要負責哪些模組?

3、base在深圳能否接受,多久可以來實習?

面試結束後過了2天,成功收到teg的offer call。

1、手撕**:

給定乙個字串s和乙個字元c。返回乙個代表字串s中每個字元到c的最短距離的陣列。

2、介紹簡歷上的2個專案和1個比賽

3、介紹bert和tinybert

4、bert如何實現微調

5、fasttext的實現原理

6、文字匹配如何實現

7、手推資訊增益、資訊增益率、gini指數公式

8、ngram如何過濾不合理的組合

9、還有什麼想和我分享的?

面試官給了乙個展現自我的機會,我介紹了乙個最近在實驗室新做的專案(簡歷上沒有)。

1、手撕**:

word2vec負取樣具體怎麼做的(知識點:累積概率分布、二分區間查詢)

2、文字匹配怎麼做

3、文字匹配不當分類來做,loss怎麼設計?

4、bert在中文和英文場景下使用,有什麼區別

5、介紹一下在開源組織clue的工作

6、假如給offer,什麼時候能來實習

聊個人特質、看重公司哪些方面、個人職業規劃等

1、詳細介紹1個專案和1個比賽

面試官讓現場開啟比賽鏈結檢視排名和解決方案

2、手撕**:

1、介紹1個專案

2、介紹transformer

3、介紹常用的聚類演算法(kmeans、dbscan、mean shift)

4、介紹word2vec2種實現模型、區別以及和fasttext的區別

5、手撕**:並查集

1、介紹1個專案

2、手撕**:

兩個有序陣列,求第k大,時間複雜度盡可能低(log(m+n))

近兩年ai演算法崗非常內卷,加上疫情影響給找好工作都增加了難度。但身邊的朋友基本都在頭部大廠收穫了1+offer。實習和專案經驗仍然很重要,acl、nips等**近些年在貶值。紮實的理論基礎和coding能力可以讓你進大廠後繼續保持足夠的競爭力。

手撕**是面試的一道坎,要早做準備。同時,盡可能把握住可以跳過筆試(大部分公司)的提前批面試

祝大家在新的一年offer多多,好運連連。

百度面經 實習

當然,面試官面試的前一階段肯定不止會問你寫在簡歷上的東西的,還是會問一些基本的問題,像作業系統 linux 的程序問題,資料庫的問題等等,自己會的就說會,不會的就說自己不會,同時要說 但是自己比較熟悉 從而引領面試官去提問自己會的,如果自己實在不知道 那就很無奈了!現在看來二面還是有一定的運氣在裡面...

面經 百度 feed 推薦演算法二面

總體有點涼,問推薦系統只能說不懂 1.專案介紹 正常介紹完專案,沒有太深挖 模仿學習和專案的區別 2.問基礎知識 各類啟用函式 bp 演算法流程 cnn 的引數的優化方法 各類梯度下降方法 隨機梯度下降 mini batch 整個訓練樣本一起進去的區別 gbdt 和 xgboost 的區別 bagg...

實習 演算法 百度面經之五

因為人在澳門,所以他們那邊打 聯絡不到我,自己打過去又沒人接,所以開始的時候非常惱火,不過最終找到人,就約了下午6點的電面。直到面試開始一陣,我才能確定是哪個職位。汗乙個。我還把麵官當成了hr,以為不會是技術面,結果證明人家是工程師.不說廢話了,攢人品,說電面具體內容 因為我只是把簡歷用email發...