详谈算法进展：本质是一套高效的信息过滤系统

“内容治理体系采用“人工参与+机器学习”相结合的模式。”

作者：苏打

编辑：tuya

“推荐算法作为人工智能机器学习技术的重要应用场景，本质上是一套高效的信息过滤系统。”

公司情报专家《财经涂鸦》获悉，4月15日，抖音相关业务负责人在“安全与信任中心开放日”活动中，就抖音算法原理、平台治理体系以及社会关切的问题，展开了详细介绍。

现场，抖音算法工程师刘畅表示，抖音的推荐算法与国内外大部分内容推荐平台相似，包含召回、过滤、排序等环节，重点是学习用户行为。

基于用户行为，抖音的推荐方法包含多种技术模型，如协同过滤、双塔召回、Wide&Deep模型等。算法可以在完全“不理解内容”的情况下，找到兴趣相似的用户，把其他人感兴趣的内容推荐给该用户。

刘畅透露，目前，抖音算法已几乎不依赖对内容和用户打标签，而是通过神经网络计算，预估用户行为，计算用户观看这条内容获得的价值总和，把排名靠前的内容推给用户。

其中，用户长期价值，是抖音推荐算法的“北极星指标”，也即最核心的业务目标。”为此，抖音算法考虑了众多目标，如完播、评论、点赞、对作者长期消费、分享、跟拍等。

为引导算法打破“信息茧房”，抖音算法在多目标建模体系下，设置了专门的探索维度。一是对用户在平台上已经表现出的兴趣，尽可能推荐更多样的内容，通过多样性打散、多兴趣召回、扶持小众（长尾）兴趣等方法控制相似内容出现的频次。二是帮助用户探索更多新兴趣，采用随机推荐、基于用户社交关系拓展兴趣、搜索推荐联动、“不感兴趣”不再展现等多种方式，让用户的主动行为影响推荐系统，使推荐更加个性化和多样化。

由于在真实使用场景中算法可能会因对内容的理解存在不足，导致违法违规、不良内容被推荐传播，因此必须由平台治理对其进行约束和规范。

据抖音生态运营经理陈丹丹介绍，抖音的内容治理体系采用“人工参与+机器学习”相结合的模式，并组建了专门的平台治理团队为算法设置“护栏”。

据悉，该抖音平台治理体系包括异常感知、标准定义、机器识别、人工研判、风险处置等过程。

创作者将内容上传至抖音后，首先进入机器识别环节。如果内容被识别出含有高危特征，将被直接拦截；若未命中高危特征但模型判断有问题，则会送至人工审核；若问题概率较低，则获得基础流量进入下一环节。视频被举报、评论区出现集中质疑、流量激增等情况出现，均可能触发“人工+机器”审核。一旦内容在任一环节被处置，系统会立即停止进一步推荐和分发。

针对社会普遍关心的、对用户造成较多困扰的焦点问题，抖音已成立数个专项治理团队，针对诈骗、网暴、虚假摆拍、未成年人保护、网络水军、AIGC技术滥用等一系列重大专项风险进行治理。例如，在不实信息治理方面，抖音于近日上线了辟谣卡，遏制不实信息的传播。

目前，抖音安全与信任中心网站处于试运行阶段，正广泛征集意见。