- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
C++ fcr函数预处理应用技巧的实例
fcr预处理
文件:fcr_preproc.cpp
函数:preprocess()
作用:为后续选择广告和价格计算准备
处理流程如下:
winfoid去重:当两台imbs分别重启追增量,可能会出现某个广告变化了planid,则该广告会从0库到1库,0库还没删除该广告时,1库已经添加了该广告,这样对应检索会导致,0库返回该广告,1库也返回了该广告。导致后续的很多“逻辑假设”不成立。因此此处必须要对广告进行dedup,去掉双库中重复的winfoid。
业务需求的黑名单过滤
计费名对应的特定 url 过滤:如58同城上不展现赶集网的广告
用计费名查词表(charge_name, domain),若命中则过滤
外部流量黑名单过滤:若是外部流量且广告命中ursid黑名单,则过滤
客服电话类query过滤: 如query是‘服务淘宝热线’,则只能展现url 是‘’的广告。
如果query命中词表(query, urldomain),且该广告domain_sign != urldomain_sign 则过滤
标记蹊径广告:若命中线下词表(unitid),则is_mt_style标记为1,否则标记为0
计算 Click Quality: click_q代表广告的用户体验好坏,可理解成click_q=好的点击次数/总的点击次数。计算过程如下:
提取每条广告的26个特征并进行签名
从词表中获取26个特征的权重,并累加成total_weight
click_q= 1.0 / (1 + exp(-1.0 * total_weight)) * Q_FACTOR
同样也会计算一个precise_click_q【线上暂时没有使用】,因为Click_quality模型训练时,分精确匹配(PRECISE_CLICK_Q模型)和非精确匹配模式(CLICK_Q模型)两种训练方式
CLICK_Q与PRECISE_CLICK_Q大部分特征一样,除了query, wmatch相关特征。
计算hc_val:用户为广告质量付出的代价。由click_q计算而得,与click_q成反比
hc_val,公式为 Hc_val= pow((1.0 - click_q * inv_factor), factor_t)
表示广告质量越差,即click_q越小,hc_val值会越大:客户因广告质量差付出的代价就越大。
hc_val过滤: 若bid<hc_val,则过滤该广告
注意:adserver不进行hc_val过滤
计算hc_bid :hc_bid = bid - hc_val,
Mec保留价策略准备: 计算保留价策略计费时要用的三个保留价pp_hc_bid_rp, ppim_hc_bid_rp, im_hc_bid_rp及三个value值:pp_hc_value_rp,ppim_hc_value_rp,im_hc_value_rp
Value计算方法: pp_hc_value_rp = ave_bid * ratio
保留价计算方法:pp_hc_bid_rp = bid - pp_hc_value_rp
其中: ave_bid是历史的平均bid,Ratio是query级别的历史平均计费比(计费比指:price/bid)。两者都是查词表而得,词表文件路径:/data/auction/ad_rp【有pp,ppim,im三种类型各自对应的文件】
PP_bid.dat (winfoid, hour, ave_bid)
pp_rpr.dat(query, hour, ratio)
Q变形策略:q= (ori_q/10)^t
目的:因为 cpm=q*bid,通过调整t因子,控制q在cpm计算时所起权重大小。
方法:通过配置项控制变形参数T, Q=pow(原始Q/10, T)。 三类q分别有各自的T
变形后q和原始q用途区分:
变形后Q: 后面所有的排序, 计费
原始Q: ctr推左,cpm推左,作为key之一从线下词表获取ctr值用于cpm3计算
pp、ppim、im资质的黑白名单标注
目的:黑白名单标注manual_mark = (last_wht_mark << 8 ) | blk_mark; // 白名单在高位
blk_mark取值种类如下:
PP_BLK_MARK = 0x0001,
PPIM_BLK_MARK = 0x0002,
LEFT_BLK_MARK = 0x0003,
RIGHT_BLK_MARK = 0x0004,
IM_BLK_MARK = 0x0007,
(last_wht_mark << 8)取值种类如下:
PP_WHT_MARK = 0
1亿VIP精品文档
相关文档
最近下载
- 情绪管理及沟通技巧课件.pptx VIP
- 人教版八年级英语下册Unit3 Section A(3a)精品教案.doc
- 养殖场安全生产风险分级管控和隐患排查治理双体系方案资料.pdf VIP
- 退役军人事务员职业技能理论考试复习题库资料(含答案).pdf
- vte 应急预案_原创精品文档.pdf
- 专题党课:把坚定拥护“两个确立”的共识 转化为坚决做到“两个维护”的实践自觉.docx VIP
- 广东省水利行政处罚事项清单.doc
- 四年级下英语资源与评价电子版人教.docx
- 铸牢中华民族共同体意识PPT红色党政风党的民族工作微党课.pptx VIP
- 可爱的四川七年级下册 第八课 四川的东西南北中(一) 教案.doc VIP
文档评论(0)