的深度排名系統(tǒng)架構(gòu),這些特征帶有共享的嵌入和規(guī)范化的連續(xù)特征的乘冪。所有層都是全連接的。在實(shí)踐中,需要給網(wǎng)絡(luò)饋送數(shù)百個(gè)特征。
結(jié)論
我們描述了我們用于推薦YouTube視頻的深度神經(jīng)網(wǎng)絡(luò)架構(gòu),劃分為兩個(gè)不同的問題:候選生成與排名。
我們的深度協(xié)同過濾模型能夠吸收很多信號(hào)并使用深度的層對(duì)它們的交互進(jìn)行建模,其性能優(yōu)于YouTube原來使用的矩陣分解方法。比起科學(xué),選擇推薦的代理問題(surrogate problem)更像是一門藝術(shù);而且我們發(fā)現(xiàn)通過獲取不對(duì)稱的聯(lián)合觀看行為(co-watch behavior )和預(yù)防未來信息的泄露,對(duì)未來觀看的分類可以在實(shí)時(shí)評(píng)估中表現(xiàn)良好。抑制來自分類器的判別信號(hào)也是獲得好的結(jié)果的關(guān)鍵,否則模型將會(huì)對(duì)代理問題過擬合,不能很好地轉(zhuǎn)換到主頁。
我們發(fā)現(xiàn)使用訓(xùn)練樣本的年齡作為輸入特征,移除了相對(duì)于過去的固有偏差(bias),并允許模型表達(dá)受歡迎視頻的時(shí)間依賴行為。這種改進(jìn)的離線保持了精確率,同時(shí)在A/B測(cè)試中顯著地增加了最近上傳視頻的觀看時(shí)間。
排名是更經(jīng)典的機(jī)器學(xué)習(xí)問題,但是我們深度學(xué)習(xí)方法在性能上超過了之前對(duì)觀看時(shí)間預(yù)測(cè)的線性與基于樹的方法。推薦系統(tǒng)尤其受益于用戶過去和事物之間的行為這樣專門的特征。深度神經(jīng)網(wǎng)絡(luò)需要對(duì)類別和連續(xù)特征的特殊表征,我們對(duì)其分別使用嵌入與分位數(shù)標(biāo)準(zhǔn)化(quantile normalization)進(jìn)行變換。我們發(fā)現(xiàn)深度的層可以有效地對(duì)數(shù)百個(gè)特征的非線性交互建模。
邏輯回歸(Logistic regression)根據(jù)給訓(xùn)練樣本賦予權(quán)重進(jìn)行修改,其中給觀看時(shí)間正樣本,沒有觀看的是負(fù)樣本,從而讓我們可以學(xué)習(xí)接近模型預(yù)期觀看時(shí)間的幾率。這種方式相比于直接預(yù)測(cè)點(diǎn)擊率,可以在觀看時(shí)間權(quán)重排名評(píng)估指標(biāo)上表現(xiàn)得遠(yuǎn)遠(yuǎn)更好。