当前位置:首页 >> 探讨
试析商业银行“协同过滤推荐算法”
2017-06-16 06:33   撰文   王慧  
   协同过滤推荐算法是诞生最早的数据挖掘方法,并且是较为著名的推荐算法,其主要功能是预测和推荐。此算法通过对用户历史行为数据的挖掘来发现其偏好,基于不同的偏好,对用户进行群组划分并推荐品味相似的商品。
  目前,协同过滤推荐算法分为两类,分别是基于用户的协同过滤算法(user-based collaboratIve filtering)和基于物品的协同过滤算法(item-based collaborative filtering)。简单地说就是“人以群分,物以类聚”。

  协同过滤推荐算法是大数据应用中一个十分常见的数据挖掘算法,目前在互联网领域炙手可热。简单地说,这种算法就是利用某些兴趣相投、拥有共同经验的群体的喜好来推荐用户感兴趣的产品。上世纪90年代初,这种算法首先在亚马逊等互联网电子商务企业的推荐引擎上应用,并且成效显著。近年来,在更多非电子商务的推荐引擎(如搜索引擎、新闻推送等)上又有愈演愈烈的趋势。
  但是,在商业银行领域,协同过滤算法成功的案例并不多见,是什么原因导致这样一个成熟的推荐算法在商业银行应用中“水土不服”呢?其中,有算法本身的限制,当然与银行业的特殊性也有密切关系。为此,笔者归纳后大概有以下几点:
  1. 在很多商业银行的组织架构中,产品归口于各个产品管理部门,各个部门为实现自身利益最大化,对于产品的营销思路及产品的推荐优先级有自己的“小算盘”,导致目前很多银行的产品推荐都是各自为政。其中,网络金融部根据自己的协同过滤模型推荐自己的产品,个人金融部同样又有一套算法来推荐一个同质的个人金融产品,在造成资源浪费的同时,也使算法成效大幅降低。
  2. 客户对于金融产品的认知,也是影响该算法在商业银行运用的一大因素。对于金融产品,客户由于接受渠道的相对单一以及信息不对称,导致购买的认知成本相对一般商品较高,造成其对于金融产品有强烈的排他性,同时,很多客户也遇到被金融资产总量限制的困扰。在智能投顾还未完全成熟的今天,客户一般没有足够的能力来合理配置自己的金融资产,所以,在缺乏专业引导的情况下,很多客户不愿意轻易尝试新产品。
  3. 商业银行金融产品的特殊性,也是导致这一算法在商业银行应用受阻的一大瓶颈。由于银行业是涉及个人财产管理的行业,因此,一直以来受到高度严格的行业监管。商业银行的产品在这种高度监管的环境下,不管价格灵活度,还是产品便利性都受到一定的限制,导致协同过滤算法的推荐模式受到掣肘。比如,保监会规定每个网点只能同时代理销售三家保险公司的产品,那么,如果不考虑这个监管规则,盲目推荐客户去就近网点办理某个代理产品,很可能因为办理资质问题让客户败兴而归,造成一次不愉快的营销。
  那么,协同过滤推荐算法在商业银行领域一定就无法大显身手?为此,笔者提出几点改进建议,希望对这一算法应用提供一定的帮助。
  1. 尽快建立企业级产品池,构建“大个金”的营销体系。笔者认为,产品部门之间深厚的壁垒,是协同过滤算法在商业银行发展缓慢的一大症结。前面提到的后两个原因,可以通过一定的数据及算法上改进予以解决,不过,这需要商业银行高层对于产品营销要有一个整体意识,对于产品也要有一个整体规划。有了这样的体系及规划,对于客户来说,既免去了被重复打扰的烦恼,又可以在整个银行的大产品池中获得自己感兴趣的产品,对于提高营销效率、降低营销成本都有百利而无一害。只有这样,才能使协同过滤推荐算法在商业银行领域中打下扎实的基础。
  2. 对于客户认知层面除了加强产品宣传、提升客户金融知识外,也可以在客户维度方面进行一些拓展,通过加入一些客户的金融认知度系列指标以及客户的偏好指标,来帮助我们获取客户对于推荐产品的接受度信息。金融认知度指标可以反映客户对于金融产品的认知度及接受速度,而偏好指标则着重反映客户的产品接受广度。通过这些指标的建立,可以辅助我们去认知客户对于银行产品的了解程度,进而结合协同过滤算法做出合理的推荐。
  3. 对商业银行来说,一方面,要不断进行产品创新,用更充实的产品池来丰富协同过滤算法;另一方面,对于银行客户间的协同过滤算法,需要考虑的维度必须更多更广更深,如客户的征信记录、客户的购买力、客户是否达到产品销售的最低门槛、客户的生命周期、客户的关联人信息等需要逐一分析,从而设置出独特的客户维度。如果把独特的客户维度加入到模型进行分析,就可以避免出现无效推荐的问题,从而切实提高推荐引擎的效率。
  当然,好的算法并不一定能无缝移植到所有领域,对于优秀的算法,数据专家们要根据自己在应用领域的深厚背景知识,对算法进行一定的改进,从而能够大大提高模型的适用性。
  (作者单位:建行上海市分行)