继此前在今年3月上线抖音安全与信任中心网站,面向社会公开抖音算法原理、机制和治理政策后,在日前举行的开放日活动中,抖音相关业务负责人基于网站版块就外界关切的算法和治理问题进行了介绍。
据了解,推荐算法作为人工智能机器学习技术的重要应用场景,本质上是一套高效的信息过滤系统。在实际应用中,抖音推荐系统采用“人工+机器”协同的方式进行风险治理,并通过多目标体系算法主动打破“信息茧房”,为用户呈现更丰富多元、实用可靠的推荐内容。
据抖音算法工程师刘畅介绍,抖音的推荐算法与国内外大部分内容推荐平台相似,包含召回、过滤、排序等环节,重点在于对用户行为(点击、浏览、喜欢、转发、收藏等)的学习。
而关于用户行为背后的算法推荐逻辑,据了解,基于人工智能机器学习和深度学习构建的推荐算法,其本质是数学模型的运算过程,只是在建立用户行为与内容特征之间的数学统计关联,并非理解内容本身。而抖音推荐算法的核心逻辑可以简化为“推荐优先级公式”,即综合预测用户行为概率×行为价值权重=视频推荐优先级。
通过分析用户的行为,抖音的推荐算法能够在完全不理解内容的情况下,找到兴趣相似的用户,将其他人感兴趣的内容推荐给该用户。值得一提的是,目前抖音算法已基本不依赖对内容和用户打标签,而是通过神经网络计算预估用户行为,计算用户观看这条内容获得的价值总和,将排名靠前的内容推给用户。
刘畅指出,由于推荐算法通过各种“目标”来预估用户行为,而且随着抖音的用户愈发多样化,内容风格也日益多元,所以抖音已经发展出非常复杂的多目标体系,比如将收藏率纳入多目标,帮助知识类内容推送给有需求的用户;增强“收藏+复访”、“关注+追更”、“打开+搜索”等组合目标,预估用户长期行为,帮助用户探索长期需求;设置探索类指标,帮助用户探索可能他们自己都还没发现的潜在需求,助力破除“信息茧房”;设置原创性目标,鼓励优质、新颖且具有独特价值的内容推荐。
同时在平台内容治理方面,抖音生态运营经理陈丹丹指出,鉴于算法虽能学习并预估用户行为,但因其无法理解内容语义,可能会导致违法违规及不良内容被推荐传播,所以在实际应用场景中须通过平台治理体系对算法进行约束和规范。
据了解,抖音方面构建了“人工参与+机器学习”相结合的内容治理体系,并组建了专门的平台治理团队,为算法设置“护栏”。在内容审核层面,抖音方面采用“人工+机器”协同模式,其中“机器”负责“宽度”、评估所有投稿,“人工”则负责“深度”,针对专业、敏感或疑难等问题进行精准研判。
据陈丹丹透露,在内容上传后,首先会进入机器识别环节,如果相关内容被识别出含有高危特征,将被直接拦截。若未命中高危特征但模型判断存在问题,则会送至人工审核。如问题概率较低,则获得基础流量进入下一环节。同时视频内容被举报、评论区出现集中质疑、流量激增等情况,均可能触发“人工+机器”审核机制。
【本文图片来自网络】
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.