给您最好的
阿里云优惠券!

随笔记阿里业务中台电商知识图谱开放日

多 图 预 警 。

本次开放日是阿里业务平台事业部发起,从整体分享来看,品牌资产营销方面的算法分享为该事业部的主打,比较给力;知识图谱模块,几位讲师可能不太了解此类分享日的套路,倒是没把阿里电商知识图谱牛逼的地方show出来。不如阿里搜索事业部的该篇分享《为电商而生的知识图谱,如何感应用户需求?》,不过,还是有很多干货。

有两场知识图谱,后面一位偏向于理论讲解。阿里电商图谱主要是链接人 - 货 - 场。

知识获取:

文本特征,直接根据字符编辑距离,来求相似;

共现特征,word2vec,这边协同过滤没看懂具体怎么做,才有:做发型 - 烫头?

语义特征,同义词林特征

知识融合阶段:

- 聚类,KNN,直接有效,下面有一页单独将聚类实体关联

实体背后属性,属性是否相关,来判定实体是否同类(口味,品牌,规格都一样,那么两食品即为同款);

图同款算法

1.2 知识推理

知识推理的前世今生讲解了一下:

基于本体推理;

类层次,哺乳动物-人类

属性层次推理,

基于规则推理;

前向/后向

rete算法,高效规则匹配(开源的语义推理引擎,在py中有 cwm,支持RDF推理)

一阶逻辑(对象,关系,逻辑,因果)

霍恩子句(目前该事业部在使用的)

规则知识表示

规则推理算法以及引擎

基于数据驱动的推理

transE,实体节点向量 + 关系属性向量 = 下一个实体节点向量

基于路径的推理,path based reasoning

基于embedding 的推理,embedding based reasoning

这边提一下笔者感兴趣的。

2.1 优惠券智能算法推荐

商品券卡券使用敏感度模型。特征工程的时候,特意把数据集分桶,去观察特征的稳定性,一些不稳定的特征会去除;第一版模型GBDT,参数网格搜索,2亿,3天时间;

使用深度学习之后,一开始一股脑子全放进去,效果反而不好;

后面调整策略,把特征分为三块,店铺信息、店铺历史销售、用户以及使用卡券信息,然后分模块跑模型,然后融合,效果显著推升。

所以,给出的结论,特征工程才是天花板,而算法只是辅助。

2.2 智能化品牌资产管理

整个算法体系感觉挺完善的。不过,该模块笔者并不感冒,所以只是记录一下。。。

本章节虽然干货很多,但是笔者对该模块比较感兴趣,把热点打造成一款完整的产品,包括了:热点发现(新词发现、人工梳理),热点归属,热点事件关联,热点商品关联,热点管理。