很多头条的自媒体小伙伴一直很好奇一个问题:
头条的审核机制是怎样判定的?
坚持发文是不是就能等来爆款?
这些问题,很多创作者、甚至大V们都有进行过经验分享,也试图破解这个「谜团」,答案部分雷同,但又千人千面。

那么,到底有什么规律,它的原理是什么?作为前AI人工智能公司的一名普通员工,从原理的角度,尝试进行一下分析,看能否为头条的自媒体小伙伴们解开部分谜团,也顺便简单了解下人工智能的基本运作原理。
透过表象看本质
近段时间以来,进入创作中心的小伙伴们,如果认真看的话,会频繁看到『头条安全中心』发出的公告:同质化博流量内容专项治理、恶意重复发文专项治理、治理健康作者人设不一致、亚冠、疫情谣言行为治理等,动辄数万条帖子删除下架,数千个账号封禁或扣分。
那么有些小伙伴一定有疑问了,『头条安全中心』到底有多少个工作人员,又是怎样从每日数百万条、甚至上千万条数据内发现这些违规内容的?

那么,带着这些问题,我们就可以引入『人工智能』这个话题了!
在这里我们知道了,『头条安全中心』这个部门是负责在头条审核一篇文章是否存在违规内容,以及决定后续是否进行推流的一个关键性部门,也可以叫枢纽部门,而百万千万级的内容很明显也不可能由工作人员一个一个来审核,通过到底通过什么审核的呢?答案就是:人工智能或者叫大数据应用。
人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,人工智能可以对人的意识、思维的信息过程进行模拟。人工智能不是人的智能,但能像人那样思考、也可能超过人的智能。
人工智能到底做了哪些事情
〓 文本校对
主要是对标点符号、拼写错误、语法错误和常见格式错误的智能判断和识别,并返回修改建议,另外也会对政法、教育、科技等垂直行业的专业词汇进行的智能校对(垂直行业这部分的校对,头条的人工智能引擎大概率还未介入)。

就地取材^_^
〓 内容审核
这部分内容比较多,涉及到:色情、违禁、恶意推广、辱骂、灌水、政治、法规等很多方面,不仅限于文字,还包含图片、音频及视频。
这也是近年来随着人工智能的迅速发展,显卡越来越贵的原因之一,这些内容判断的精准度及效率,除了依靠算法的先进程度,主要依靠的就是GPU的运算能力。甚至直播内容也可以通过人工智能进行实时判断,当然也需要更高的算力和更为复杂的人工智能算法。
〓 大数据分析
大数据分析:就是指对规模巨大的数据进行数据分析,大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,而数据分析是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。
小伙伴们的帖子发布成功之后,那么恭喜你:从现在开始你就进入了大数据分析阶段;
这个阶段就出现了对小伙伴们影响最大、也是最关心的问题:展示量、阅读量以及收益到底如何。
而这个问题的答案,很明确地告诉各位:有答案,但没标准答案!
原因很简单:因为人工智能在这方面是通过多维度进行的判断,而具体在哪些维度,这个问题就涉及到了算法的持续调整和更新以及内部机密。
类似我们生活中经常遇到的:信用卡是如何提升额度的、领导是如何才能给提薪的、女朋友每次吃饭说得「随便」到底是什么?
明明觉得答案呼之欲出了,而实际践行下来后发现:好像也不是那么回事!
不过,我们还是可以从蛛丝马迹里面捕捉到一部分信息:
丨标题
就像两个人相亲,而标题就是「第一印象」,在人类平均眨眼速度的0.3秒内,能否吸引到对方的注意,让他带着疑问或兴趣,愿意更深入的进行接下来的了解,就是标题的意义。
而只要点击进去,就出现了小伙伴们在意的第一个指标:阅读量。

丨版面
版面包含文章的整体排版布局和图片搭配,相当于一个人的外在,着装合体的人总能让人目光愿意多停留一会儿,从而进行更深层次的接触。
丨内容
内容相当于一个人的涵养,外表光鲜的同时,内容如果千篇一律或者粗糙不堪,如何会让人驻足,类似相亲中遇到的:处处可以,结婚免提! 而阅读时长是千次阅读收益的重要指标之一。
好看的皮囊千篇一律、有趣的灵魂万里挑一! 满足读者的猎奇心、为读者解疑答惑、引起读者的共鸣共情,这些都是自媒体人和博主们施展「手段」的点。

丨账号权益值
账号权益值,个人认为主要有下面几个维度:
活跃度;含阅读时长、点赞量、评论量、发帖量等。
创作权益等级;百粉、千粉、万份、特约,不同阶段必然有不同的权益值。

头条认证;职业认证、兴趣认证、机构认证以及专业领域认证。

账号权益值是考量展现量的重要指标之一。另外特别要注意的是「信用分」对权益值的影响也是至关重要的一个参数。
丨数据
在人工智能通过上述考量,给出一定展现量的前提下,阅读率、阅读时长、评论数量等这些数据指标达到一定阈值的情况下,势必会投放更多的展现量,再根据阶段性的数据来判定后续展现量的高低。
可以耐心看到此处的小伙伴们,应该对『头条安全中心』这个部门产生了一个灵魂疑问:电脑把活儿都干了,他们在干嘛?

其实,他们更忙!算法(规划策略)调优、运营数据调校、政策法规落实等,这些都是他们工作中的一部分;并且,也没大家想象中的那么多人!而面对的却是每天都在持续增长的海量数据。
毫无疑问,人工智能在浩瀚的数据校验工作中发挥着至关重要的作用,但局限于算法及硬件的瓶颈,也只是负责了部分重复性较强或在规律方面有迹可循的部分;好比一个工厂,产品从生产线上面下来后,还需要质检、营销、推广、售后等一系列的工作。
Ending
从头条君发的公告里面也可以看出,不管是头条的工作人员还是在持续优化的人工智能算法,都在积极致力于打击同质化博流量、恶意重复发文等「搬砖」做法,以及编造虚假故事、歪曲利用热点事件的行为;
再华丽的「招式」,也需要深厚的「内力」支撑;
头条君最终的目的必然是这个平台发展得越来越好,所以更会爱惜自己的羽毛,而人工智能的参与,也是为了让头条留下更多更好的原创作者们;
头条是一个信息交换平台的同时,也是一个学习平台,期待与各位一起勿忘初心、砥砺前行!

如若转载,请注明出处:https://www.zzibang.com/3251.html