基于特征工程的广告点击转化率预测模型
TP274; 在大数据环境下,随着全球网络广告传播行业的快速发展,网络广告的计算也越来越受到人们的高度关注.计算广告旨在将广告投放到特定的受众人群,以广告环境和用户特征为基础进行数据分析计算,从候选广告库中选择出最佳匹配的广告.其核心问题是通过网络广告点击转化率预测的计算,将用户点击可能性最高的广告选择出来.广告点击转化率的精确预测与媒体、广告主和用户3方的利益密切相关.该研究基于TrackMaster平台提供的真实广告数据,以特征工程的视角,分别从用户信息特征、广告信息特征、上下文特征和统计特征4个角度进行特征分析,从而挖掘出对广告点击转化率影响较大的重要特征,构建广告点击转化率预测分层模型...
Saved in:
Published in | 数据采集与处理 Vol. 35; no. 5; pp. 842 - 849 |
---|---|
Main Authors | , , , , |
Format | Journal Article |
Language | Chinese |
Published |
广东工业大学应用数学学院,广州,510520%北京明略软件系统有限公司,广州,510300%广东工业大学计算机学院,广州,510006
01.09.2020
|
Subjects | |
Online Access | Get full text |
Cover
Loading…
Summary: | TP274; 在大数据环境下,随着全球网络广告传播行业的快速发展,网络广告的计算也越来越受到人们的高度关注.计算广告旨在将广告投放到特定的受众人群,以广告环境和用户特征为基础进行数据分析计算,从候选广告库中选择出最佳匹配的广告.其核心问题是通过网络广告点击转化率预测的计算,将用户点击可能性最高的广告选择出来.广告点击转化率的精确预测与媒体、广告主和用户3方的利益密切相关.该研究基于TrackMaster平台提供的真实广告数据,以特征工程的视角,分别从用户信息特征、广告信息特征、上下文特征和统计特征4个角度进行特征分析,从而挖掘出对广告点击转化率影响较大的重要特征,构建广告点击转化率预测分层模型并训练,并且结合LightGBM算法模型得出广告点击转化率的重要特征排序.实验结果表明当特征选择阈值λ=0.95,特征选择数目为19,树的颗数为100时的受试者工作特征曲线下的面积(Area under receiver operating characteristic curve,AUC)值最大,模型的对数损失函数值约为0.1368,此时模型具有最优的效果.预测模型和特征排序结果有助于企业制定最优的广告投放策略. |
---|---|
ISSN: | 1004-9037 |
DOI: | 10.16337/j.1004-9037.2020.05.005 |