向量 索引變換 VectorIndexer

2021-09-24 01:50:21 字數 817 閱讀 2994

vectorindexer解決向量資料集中的類別特徵索引。它可以自動識別哪些特徵是類別型的,並且將原始值轉換為類別索引。它的處理流程如下:

​ 1.獲得乙個向量型別的輸入以及maxcategories引數。

​ 2.基於不同特徵值的數量來識別哪些特徵需要被類別化,其中最多maxcategories個特徵需要被類別化。

​ 3.對於每乙個類別特徵計算0-based(從0開始)類別索引。

​ 4.對類別特徵進行索引然後將原始特徵值轉換為索引。

索引後的類別特徵可以幫助決策樹等演算法恰當的處理類別型特徵,並得到較好結果。

在下面的例子中,我們讀入乙個資料集,然後使用vectorindexer來決定哪些特徵需要被作為類別特徵,將類別特徵轉換為他們的索引。

package org.apache.spark.examples.ml

import org.apache.spark.ml.feature.vectorindexer

import org.apache.spark.sql.sparksession

object vectorindexerexample " +

s"categorical features: $")

// create new column "indexed" with categorical values transformed to indices

val indexeddata = indexermodel.transform(data)

indexeddata.show()

spark.stop()

}}

變換 向量和矩陣

主要使用了 示例程式繪製了乙個在螢幕中間旋轉的線框花托。modelviewprojection.cpp opengl superbible demonstrates opengl the modelviewprojection matrix program by richard s.wright j...

點的變換和法向量的變換

在三維空間裡,點的變換是通過仿射變換的,所以使用齊次座標的變換矩陣來變換。不過,當乙個點作矩陣m變換時,這個點的法向量是否也可以使用矩陣m來變換呢?答案是不行,只是在特殊的情況是可以,比如沒有變形的變換。如果有變形的變換,就需要使用特殊矩陣 m矩陣的逆的轉置矩陣。之前看過一些文章,說道mesh頂點的...

向量 矩陣 變換的理解

1.3d繪圖的核心是向量運算 矩陣變換 三角函式 2.矩陣主要是用來描述兩個座標系的關係,通過定義一種運算來將乙個座標系中的向量轉換到另乙個座標系中 3.大多數3d圖形不是真正3d的,我們使用3d的概念和術語來描述物體,然後這些3d資料被 壓扁 在2d的計算機螢幕上。這種將3d資料壓扁成2d資料的處...