今日頭條「靈犬反低俗」公升級 100倍維基百科資料量

2022-09-28 00:45:14 字數 623 閱讀 1636

7 月 31 日訊息,近日今日頭條宣布推出新版「靈犬反低俗助手」,新增了對和文字識別。這一代「靈犬」訓練資料集總量是1. 2 個t,相當於 20 倍百度百科或 100 倍維基百科的資料總量,包含 920 萬個樣本,準確率提公升至91%。

據介紹,新版「靈犬」重點拓展了反低俗識別型別和模型能力,現已覆蓋識別(反色情低俗、反血腥暴力)和文字識別程式設計客棧(反色情低俗、反暴力謾罵、反標題黨)。後續還將支援語音識別和**識別。

在文字識別領域,新版「靈犬」同時應用了「bert」和半監督技術,訓練資料集包含 920 萬個樣本,準確率提公升至91%www.cppcns.com。在識別領域,「靈犬」採用深度學習作為解決方案,在資料、模型、計算力等方面均做了針對性優化。

2018 年 3 月 28 日,今日頭條首次上線「靈犬」,支援檢測文字和文章鏈結。 2018 年 5 月 16 日,「靈犬」增加反色情短文本模型和反謾罵模型,將準確率從73%程式設計客棧提公升至82%。 2019 年 2 月 2xepmk0 日,「靈犬2.0」正式上線,除了反色情低俗模型,加入反暴力謾罵和反標題黨模型,覆蓋了主要的低俗低質內容型別,整體識別準確率接近85%

截至 2019 年 6 月,靈犬反低俗助手的使用人次已經超過了 300 萬。

本文位址: /news/roll/260615.html

今日頭條 今日頭條三面面經

一面 1 演算法題,程式設計實現nsum 2 實現元素的居中並且寬高比為3 4 3 實現繼承 4 給了一段 給出輸出結果,這個是和非同步相關 5 http的狀態碼有哪些 6 cookie和session的區別,以及如何生成session 7 給 寫輸出和原型鏈相關 8 變數宣告提公升 三面 1 介紹...

今日頭條筆試

問題描述 給定乙個段落,由 n 個句子組成。第 i 個句子的長度為 l i 包含的單詞個數為 w i 句子不包含任何除字母和空格 外的符號。每個句子內部,含有若干個單詞,由空格 分隔。句子不會包含連續的空格。隨後給定 m 個查詢,每個查詢包含乙個句子,需要在段落中尋找相同單詞數量最多的句子。重複的單...

今日頭條emmmmmmm

迭代器的用處就是重複的運作一道一百,像乙個家庭爺爺生了爸爸才能有孫子。這個迭代器級別非常關鍵斷了乙個也不行!迭代器 只要 iter 方法的物件就是迭代物件 字串,列表,元祖,字典,集合,檔案都可迭代物件!next 其實是在遍歷可迭代物件的元素,一遍完成報錯。迭代器 是擁有 iter 方法,迭代物件擁...