計算廣告讀書筆記(六) 資料加工與交易

2022-08-12 07:06:18 字數 3014 閱讀 9468

1.有價值的資料**

關於行為資料對廣告效果的意義,有兩條基本規律:使用者主動意圖的提公升,相應的行為資料價值越大;越接近轉化的行為,對效果廣告的精準指導作用越強。資料型別主要包括以下幾類:

對於瀏覽器行為,我們最常使用的使用者標識是cookie;在移動互聯的情形下,ios使用idfa(identifierfor advertising),其性質與cookie類似;android一般採用android idimei(international mobile equipment identity)等標識資訊。

按照對效果廣告的有效性分類,使用者行為可以分為決策行為、主動行為、半主動行為和被動行為。決策行為主要包括轉化和預轉化;主動行為主要包括廣告點選、搜尋和搜尋點選;半主動行為主要包括分享和網頁瀏覽;被動行為主要是指廣告瀏覽。

一般來說,只有一些能夠與使用者實名身份繫結的服務可以得到此資訊。我們也可以利用網路行為資料進行人口屬性標籤的**,但是這樣做的準確程度一般都很有限。

地理位置資訊隨著能獲得的精度不同其用途也會有相當大的差異。根據ip進行對映,只能精確到城市級別的地理位置;gps 或蜂窩定位往往可以準確到幾百公尺的範圍。

社交網路上的關係反映了人與人之間的聯絡,也隱含了一種聯絡人之間「興趣相似」的合理推測。因此,社交關係可以用於使用者興趣的平滑。

移動廣告對於裝置資訊的收集與深入加工有特別重要的意義。裝置資訊包括:應用安裝列表、機型、系統版本、陀螺儀、電池電量等。

2.資料管理平台

2.1三方資料劃分

第一方和第二方分別是指廣告主和廣告平台,而不直接參與廣告交易的其他資料提供方統稱為第三方。在廣告網路中,主要使用第二方資料指導廣告投放;而在實時競價環境下,不僅第一方資料可以被利用,大量第三方資料的加工和交易也逐漸發展起來。

2.2第一方資料管理平台

面向第一方的資料加工產品,是狹義的資料管理平台。第一方資料管理平台有以下核心功能:

(1)可為**提供受眾定向功能,並將獲得的使用者標籤應用於**業務。

(2)廣告主**可通過dmp與廣告採買渠道進行更方便的資料對接。

第一方dmp商業模式如下圖所示,dmp應資料來源(data provider,dp)的要求,收集第一方資料,並加工成第一方需要的使用者標籤。dp根據這些標籤進行站內運營或者指導dsp進行廣告投放。dsp利用這些標籤以rtb方式在adx中投放廣告。

2.3第三方資料管理平台

3.資料交易的基本過程

資料交易一般通過adx或ssp作為中轉來完成,資料交易過程如下圖所示,dmp的各種使用者標籤,以批量傳輸的方式提供給adx,並作為adx的乙個輔助產品售賣給dsp。標籤一般按照cpm計價,dsp如果選擇購買某種標籤,則在廣告詢價的過程中,adx將本次請求的使用者標籤傳給dsp,最終以dsp實際成交的展示量乘以cpm的**作為其購買資料的附加費用。

4.隱私保護和資料安全

4.1隱私保護問題

l要嚴格避免使用個人可辨別資訊

l使用者有權要求系統停止跟蹤和使用自己的行為資料

l不應長期保留和使用使用者的行為資料

l工程上需特別注意許可權的嚴格分配和最小資料訪問原則

一些資料組合在一起可以確定乙個人,這樣的資訊稱為準識別符號。將識別符號做一定程度的泛化,如果泛化的結果能使每一組準識別符號的例項都能找到k條與其相同的,那麼就實現了k匿名。

通過稀疏的行為資料,可以比較容易定位自己熟悉的人,進而獲取其相關的隱私資訊。差分隱私:對資料進行一定程度的修改,盡可能少損失查詢準確率的情況下,使隱私洩漏的風險最低。

4.2程式化交易中的資料安全

詢價優化技術,盡可能阻止以惡意收集資料的dsp參與競價。

避免dsp在競爭對手之間倒賣訪客集合。

5. 思考

l    資料的交易與廣告的交易有什麼不同特點,應如何借鑑廣告競價的模式發展資料的競價交易?

廣告的交易是對廣告位、人群的交易資料交易,由一方生產資料,然後賣給另一方(廣告主)進行使用。誰出價高才能用這份資料?

l    在與廣告相關的資料交易中,資料採取限量或不限量的**策略,會對流量和資料的市場**產生什麼影響。

限量**策略:這個資料標籤的流量達到一定後就不能用這個標籤?還是說只能有部分廣告主可以購買。不限量**策略:資料標籤可以任意使用?所有廣告主都可以使用?**由供給量和需求量決定。

假設廣告主的需求量是固定的,那麼不限量**將導致資料的**降低。限量**將導致資料**上公升,並產生競價。對流量的**,限量後,購買資料的廣告主針對流量能提供更加靈活的定價策略。符合需求的廣告提公升定價,不符合需求的廣告降低定價。整體會導致資料所覆蓋的流量**上公升,資料沒覆蓋的流量**降低。

計算廣告學習筆記3 5 受眾定向 資料加工和交易

來自於師徒網 劉鵬的講課,確實不錯,筆記記錄一下 有資料的未必有資料變現的能力,所以導致這些業務的出現。類似於乙個煉油的過程 第一條,所謂的精準只是把你的客戶賣給你或者把別人的客戶賣給你,不會吸引到潛在的客戶,類似於前面講的吃飯拉客的例子。第二條,短期看,分的越細,對 有傷害,長期來看,應該是互惠的...

大資料讀書筆記 2 流式計算

早期和當前的 流式計算 系統分別稱為 連續查詢處理類 和 可擴充套件資料流平台類 計算系統。流式計算系統的特點 1 低延遲 2 極佳的系統容錯性 3 極強的系統擴充套件能力 4 靈活強大的應用邏輯表達能力 目前典型的流式計算系統 s4,storm,millwheel,samza,d stream,h...

六 資料型別選擇(MySQL讀書筆記)

1 char varchar char varchar 固定長度字串 不足空格補位 可變長度字串 處理速度比 varchar 快得多 浪費空間 1.1 不同儲存引擎對兩者使用原則有所不同 myisam 建議使用固定長度的資料列 memory 都可以 均作為 char 處理 innodb 建議使用 v...