攜程演算法筆試題知識點

2021-08-27 07:57:32 字數 904 閱讀 6950

判別式模型(discriminative model)是直接對條件概率p(y|x;θ)建模。常見的判別式模型有 線性回歸模型、線性判別分析、支援向量機svm、神經網路等。

生成式模型(generative model)則會對x和y的聯合分布p(x,y)建模,然後通過貝葉斯公式來求得p(yi|x),然後選取使得p(yi|x)最大的yi,即:常見的生成式模型有 隱馬爾可夫模型hmm、樸素貝葉斯模型、高斯混合模型gmm、lda等。

準確度並不適合於衡量不平衡類別問題

當資料有乙個 0 均值向量時,pca 有與 svd 一樣的投射,否則在使用 svd 之前,你必須將資料均值歸 0。

stage 是spark 中乙個非常重要的概念 ,

在乙個job 中劃分stage 的乙個重要依據是否有shuflle 發生 ,也就是是否會發生資料的重組 (重新組織資料)。

在乙個stage 內部會有很多的task 被執行,在同乙個stage 中 所有的task 結束後才能根據dag 依賴執行下乙個stage 中的task.

job 有很多任務組成,每組任務可以任務是乙個stage

task 是spark 中另乙個很重要的概念 ,

task 跟 partition  block 等概念緊密相連 ,task 是執行job 的邏輯單元 ,在task 會在每個executor 中的cpu core 中執行

job 是乙個比task 和 stage 更大的邏輯概念,

job 可以認為是我們在driver 或是通過spark-submit 提交的程式中乙個action ,在我們的程式中有很多action  所有也就對應很多的jobs

batchsize就是每次把多少條資料輸入給神經網路

在r 維空間中,線性決策面的vc維為r+1。

機器學習中做特徵選擇時可能用到的方法有:卡方,資訊增益,平均互資訊,期望交叉熵

筆試題 知識點總結

include using namespace std int main int b 1 int p int b 1 p 1 for int i 0 i 3 i 我去,棧裡面開闢的空間在windows是不能越界訪問的,堆裡面開闢的空間可以任意訪問,但是前提該塊記憶體沒有被使用,不然會崩潰。但是lin...

攜程2016校園招聘筆試題分析

1.記憶體空間被分成不同區域,其中用函式 void malloc unsigned int size 申請的內存在 答案 c 程式語言中的 malloc calloc 函式和c 的new 運算子都是在動態儲存區 heap 上申請記憶體空間 2.cpu輸出資料的速度遠遠高於印表機的列印速度,為了解決這...

攜程產品經理筆試題 2020秋招

題型 20道英文選擇題 2道簡答題 選擇題部分主要考察的數量關係 材料分析和語言理解,跟行測差不多,但是我沒想到是全是英文的,天哪,太久沒看英文本母了,看得讓我很跳躍,顯然基本涼涼了。簡答題1 飯卡還可以有哪些功能,講明優先順序和原因?我先說下,我的答案 1 充值消費功能 比如食堂消費 學校商鋪消費...