分類問題用機(jī)器學(xué)習(xí)的方法建模解決,下面是可以想到的特征:
(1)渠道特征:渠道、渠道次日留存率、渠道流量以及各種比率特征
(2) 環(huán)境特征:設(shè)備(一般偽造假用戶的工作坊以低端機(jī)為主)、系統(tǒng)(刷量工作坊一般系統(tǒng)更新較慢)、 wifi使用情況、 使用時(shí)間、來源地區(qū)、ip是否進(jìn)過黑名單
(3) 用戶行為特征:訪問時(shí)長、訪問頁面、使用間隔、次日留存、 活躍時(shí)間、頁面跳轉(zhuǎn)行為(假用戶的行為要么過于一致,要么過于隨機(jī))、頁面使用行為(正常用戶對(duì)圖片的點(diǎn)擊也是有分布的,假用戶的行為容易過于隨機(jī))
(4) 異常特征:設(shè)備號(hào)異常(頻繁重置idfa)、 ip異常(異地訪問) 、行為異常(突然大量點(diǎn)擊廣 告、點(diǎn)贊)、 數(shù)據(jù)包不完整等。