主流内容平台常见推荐算法的技术原理
在著作权法上如何界定算法推荐行为
作者|李洪江乔昱达
第一步,找到用户A的兴趣爱好{item1,item2};
第二步,找到与用户A具有相同兴趣爱好的用户群{B,C};
第三步,群体{B,C}除了喜欢{item1,item2},还喜欢{item3,item4}(即“协同”之意义所在);
第四步,下一次将{item3,item4}推荐给用户A,完成推荐。
基于内容的推荐算法,基本逻辑是通过挖掘用户历史行为数据中感兴趣的内容,抽象此类内容的共性,向该用户推荐具有共性的其他内容。其步骤为:
第一步,找到用户A历史感兴趣的物品集合;
第二步,找到该物品集合的具化内容;
第三步,抽象具化内容的共性内容;
第四步,由这些共性内容查找其他物品实施推荐。
相似性推荐不是个性化推荐,其要解决问题的基本逻辑是,当系统面对新注册用户时,没有历史行为数据可挖掘,在用户点击了某一物品(user-item_X)时,将与该内容最相似(距离最近)的user-item集合推荐给他/她。对于新用户A,没有A的历史行为数据,在A点击了内容itemX的情况下,将与itemX最相似的item集合推荐给新用户A。问题转化为如何用一种方法计算内容之间的相似度。
经过对上述主要推荐算法技术原理的了解,如果推荐的内容是作品,可以得出以下结论:
第一,推荐算法不涉及将作品置于信息网络的上传环节,但确实将作品精准呈现到了用户面前;
第二,推荐算法对作品的处理并未触及作品实际内容,只针对作品数据的属性标签进行识别、匹配、推荐;
第三,推荐算法向用户推荐作品是经计算后自动完成的,无需人工干预(实务中是否存在人工干预推荐结果的情况在所不论);
第四,算法向用户推荐作品的效率远远高于人工推荐。[1]
(一)算法推荐作品与信网权意义上的“提供作品”
讨论算法推荐作品是否构成信网权意义上的“提供作品”直接决定了算法推荐行为是否构成直接侵权,若该行为构成直接侵权将排除其构成间接侵权的余地,因此,前置的对其进行考虑尤为必要。
那么,司法实践中,算法推荐的内容平台是否绝对不可能构成直接侵权?现实情况是复杂的,平台企业基于运营的考虑,可能会存在签约的PGC用户,当PGC用户将涉嫌侵权的作品上传平台后,平台算法自动匹配并实施作品推荐,在此情况下,平台与PGC因“签约”而被认定存在意思联络,进而认定构成分工合作共同实施直接侵权行为也是完全有可能的,但需要明确的是,这一直接侵权的认定是基于“分工合作”导致的,而与是否推荐无关。[2]
(二)算法推荐与人工推荐
最高院《信息网络传播权司法解释》第九条第(三)项规定了认定平台是否构成应知可以综合考虑的因素之一,即网络服务提供者是否主动对作品、表演、录音录像制品进行了推荐;针对热播影视等作品,该司法解释第十条规定了以设置榜单、目录、索引、描述性段落、内容简介等方式进行推荐,可以直接认定为平台应知。算法推荐是否属于上述司法解释规定的“推荐”呢?
与上述观点相对,也有观点认为[4][5],算法推荐与人工推荐无本质差别。其认为算法推荐在运行时没有人工干预,但算法本身是人工设计的,是按照人的意志与选择在运行。算法并不当然是客观的、正义的,其背后有价值观的存在,这种价值观反映的是设计者,即人之意志。从某种程度上讲,算法推荐下的内容推送完全可以理解为产品设计,产品的设计者应当为产品设计中的缺陷负责,这并不会加重产品设计者的责任。在原理上,“算法推荐”要做到内容的“精准”推荐,首先要对用户上传的内容采取类型化(如区分影视剧、体育、新闻等)、标签化等干预手段。这都是平台对用户上传内容进行的主动选择和编辑的过程。
一般而言,学界通识和司法实践中也不要求网络平台提供者对海量的信息内容进行主动审查。
也有学者认为应该根据网络服务提供商的不同类型区分过滤审查义务的高低,使其承担与其“信息管理能力”相适应的注意义务,并就构建分层级的不同类型网络服务提供商的过滤审查义务提出了建议[7]。
(1)网络存储空间服务商:较高的注意义务
(2)网络搜索、链接服务商:中间的注意义务
(3)基础性网络服务商:一般的注意义务
提供自动接入、自动传输、自动缓存等技术的服务商,应用算法推送技术的空间有限,不应苛以严格的注意义务,可以通过对“通知-必要措施”规则进行合理管控,构建其具体的注意义务。此类服务商处于互联网信息服务的基础设施层,服务目的为信息的便捷传输,而非具体内容的管控。
在“应知”的认定上,司法实践中“作品热度高”+“置于显著位置”即可认定平台构成“应知”。在具体影响因素上,(1)作品热度;(2)侵权作品在平台中传播的情况(播放量、侵权用户数量、上传数量等);(3)是否置于显著位置或被置于特定频道、榜单、话题之中;(4)作品是否在国家重点作品预警名单中或权利人是否事先发送了合格的预警函等因素可作为法院判定“应知”的重要影响因素。
在“合理措施”的认定上,关键在于对“及时性”和“有效性”的解释。对于“及时性”,需要根据权利人通知的形式、准确程度、采取措施的难易程度、网络平台所提供服务的性质以及涉案作品类型、知名度等因素,由人民法院在具体案件中进行综合判断。对于“有效性”,一方面要考察平台采取措施后的客观效果,即是否起到防止损害扩大的效果;另一方面应结合新类型平台的特点、实际技术能力以及权利人通知的准确程度、侵权信息的明显程度等因素,考虑必要措施的可行性与合理性,既要防止平台拒不履行“理所应当”的责任,也要避免让其承担“难以承受之重”。
[2]同上。
[3]熊琦:《“算法推送”与网络服务提供者共同侵权认定规则》,载《中国应用法学》2020年第4期。