指定區間離散化

2021-10-09 20:39:39 字數 896 閱讀 9378

有時可以直接根據業務特徵對資料進行離散化,指定需要分割槽的區間或資料點,形成最終的標記資料。

假設有一組資料:

a = [1,3,7,10,23,50],

以10,30為分割點,將資料分為三個區間。

import pandas as pd

a = [1,3,7,10,23,50]

cut_a = pd.cut(a,[0,10,30,50])

[(0, 10], (0, 10], (0, 10], (0, 10], (10, 30], (30, 50]]

categories (3, interval[int64]): [(0, 10] < (10, 30] < (30, 50]]

import pandas as pd

a = [1,3,7,10,23,50]

cut_a = pd.cut(a,[0,10,30,50],labels=[1,2,3])

[1, 1, 1, 1, 2, 3]

categories (3, int64): [1 < 2 < 3]

import pandas as pd

a = [1,3,7,10,23,50]

cut_a = pd.cut(a,[0,10,30,50],right=false)

[[0.0, 10.0), [0.0, 10.0), [0.0, 10.0), [10.0, 30.0), [10.0, 30.0), nan]

categories (3, interval[int64]): [[0, 10) < [10, 30) < [30, 50)]

BZOJ4653 區間,離散化 線段樹

time 2016.08.09 author xiaoyimi 傳送門思路 當時打同步賽的時候 花了3h去做t3提答 大概玩了50分 回來看t1竟然是懵逼狀態 想了一會,滿腦子都是離散化後差分字首和處理blabla 但不知道怎麼處理區間覆蓋大於m時答案的最優性 為什麼當時連按區間大小排序的思路都沒有...

hdu 5481 區間離散 組合

第二個樣例解釋 集合中含有2個區間 乙個是 0,2 編號為1,乙個是 1,3 編號為2。集合的子集有4個 1 空集,集合中區間的並的長度為0 2 集合中區間的並的長度為2 3 集合中區間的並的長度為2 4 集合中區間的並為 0,3 長度為3 考慮某乙個區間對於答案的貢獻 若某個區間沒有被其它區間覆蓋...

離散化 區間和

假定有乙個無限長的數軸,數軸上每個座標上的數都是0。現在,我們首先進行 n 次操作,每次操作將某一位置x上的數加c。近下來,進行 m 次詢問,每個詢問包含兩個整數l和r,你需要求出在區間 l,r 之間的所有數的和。輸入格式 第一行包含兩個整數n和m。接下來 n 行,每行包含兩個整數x和c。再接下裡 ...