Updated 1137 days ago

基于隐私计算的推荐系统研究

通过结合隐私计算,从根本上解决用户的各类数据(行为数据、基础信息等)被推荐系统底层算法明文处理,并打破数据孤岛,在数据确权的情况下加密使用联邦学习,使得多方数据得到安全有效的利用。

  • Crypto / Web3
  • PlatON

Members 1

浅浅社区是致力于拓展PlatON社区生态的大型社交项目,社交项目一定绕不开的是用户所发布的一系列文章、动态等相关数字化信息的内容推荐。

以知乎、抖音、Soul APP等为代表的传统互联网行业,包括但不限于社交、电商、短视频、广告分发等行业属性,都存在利用用户所产生的相关数据(包括但不限于个人基础信息、创作数据、用户行为数据等)为平台发展谋取一定的收益,创造不菲的盈利。当然在这个过程中,也许存在双方共赢,但对于用户隐私而言并没有太多的保障。

2020年4月9日,中共中央、国务院印发关于要素市场化配置的第一份文件《关于构建更加完善的要素市场化配置体制机制的意见》,首次将数据纳入生产要素当中,并就加快培育数据要素市场提出三点意见:一是推进政府数据开放共享;二是提升社会数据资源价值;三是加强数据资源整合和安全保护。

数据确权成为当时的热点,浅浅社区是基于PlatON隐私计算链上的生态拓展项目,不仅是基于算法部分,未来还有可信硬件的研发,本次申报的课题主要是研究如何在推荐系统中引入隐私计算。

推荐系统是一种解决信息超载的办法,从上个世纪出现万维网开始,互联网资源呈现指数性地爆发,无论是谁,穷尽一生都无法窥探到它的冰山一角,更别提全貌了。因此计算机科学家们提出推荐系统这一概念。通过当前掌握的信息,描述、刻画出有效的用户画像,并计算两用户间的相似性,为目标用户推荐感兴趣的内容,这是协同过滤的一种用法。

但是在上述构建推荐系统的过程中,用户的信息是明文、未脱敏的,这样就很容易造成用户的隐私被其他互联网攻击者窥探或者是截取,造成隐私泄露。

因此浅浅社区内的推荐系统有意引入PlatON隐私计算工具,以安全多方计算为代表加密手段切实保护用户的所有数据,真实有效地做到数据确权、隐私保护。

具体设计思路如下,这里以用户发布的动态(或文章为例):

用户对任意一条动态(文章)点赞之后,存在一个评分矩阵表(未来表过大时,采用矩阵分解减小空间压力),用户的点赞信息属于一种行为数据,此时仅保存在用户本地,当用户授权给浅浅社区后(浅浅社区对用户给予授权激励),浅浅社区对该用户的行为数据进行提取,拿到可以计算的部分加密上传至云平台,云平台同样有其他的用户上传信息,众多的用户加密数据在云端进行安全多方计算,得到计算结果后,返回到各自的本地进行解密,解密结果再呈现到前台,成为相似推荐的结果。

如此一来,推荐过程和推荐结果均为密文,能够更加合理地保护用户的隐私,并且减小用户隐私泄露的风险,有效做到数据确权,并且用户也能在这个过程中得到一部分的授权激励,做到双赢甚至是多赢。