风控算法(3)阿里云-风险商品图算法识别
【阿里安全 × ICDM 2022】大规模电商图上的风险商品检测赛
比赛链接:Https://tianchi.aliyun.com/competition/entrance/531976/introduction
ICDM 2022: Risk Commodities Detection on Large-Scale E-Commence Graphs:https://github.com/EdisonLeeeee/ICDM2022_competition_3rd_place_solution
ICDM2022大规模电商图上的风险商品检测比赛(第六名):https://github.com/JaySaligia/SGHQS
ICDM 2022 : 大规模电商图上的风险商品检测 -- top1方案分享+代码:https://github.com/fmc123653/Competition/tree/main/ICDMCup2022-top1
ICDM2022_competition_3rd_place_solution:https://github.com/EdisonLeeeee/ICDM2022_competition_3rd_place_solution
【论文笔记】KGAT:融合知识图谱的 CKG 表示 + 图注意力机制的推荐系统:https://zhuanlan.zhihu.com/p/364002920
一、黑灰产VS风控系统
近年来,图计算尤其是图神经网络等技术获得了快速的发展以及广泛的应用。
在电商平台上的风险商品检测场景中,黑灰产和风控系统之间存在着激烈的对抗,黑灰产为了躲避平台管控,会蓄意掩饰风险信息,通过引入场景中存在的图数据,可以缓解因黑灰产对抗带来的检测效果下降。
在实际应用中,图算法的效果往往和图结构的质量紧密相关,由于风险商品检测场景中对抗的存在,恶意用户会通过伪造设备、伪造地址等方式,伪造较为“干净”的关联关系。 如何能够在这种存在着大量噪声的图结构数据中充分挖掘风险信息,是一个十分有挑战性的问题,另外该场景中还存在着黑白样本严重不均衡、图结构规模巨大且异构等多种挑战。

二、赛题背景
在电商平台上,商品是最主要的内容之一。风险商品检测旨在识别平台上存在的假货商品、违禁商品等,对维护平台内容信息健康、保护消费者权益起着至关重要的作用。
风险商品检测和其他风控领域一样,面临风险的对抗和变异,如对商品风险内容的刻意隐藏等,而使用平台广泛存在的各类图关系数据可以提供更多证据,提升黑灰产的攻击成本。
本次比赛提供了阿里巴巴平台来源于真实场景的风险商品检测数据,需要参赛者利用大规模的异构图结构以及比例不均衡的黑白样本,利用图算法,检测出风险商品。

三、结题思路
3.1 DeepFM模型

低阶和高阶特征选择
3.2 序列模型


3.3 图模型


