审查术语
来自China Digital Space
网络审查指中华人民共和国国家互联网信息办公室对互联网进行的言论审查,是一种行政行为,属于中国大规模监控的一部分,具体负责网络审查的“互联网信息审核员”在“中华人民共和国职业分类大典(2015年版)”中,被中国人社部正式编入工种,此后几乎再没有企业避讳自己招聘审查员,进行网络审查的事实。审查员是为网站后台管理人员,是审查制度中的一线操作工人,需要对网站内的被认为对中国当局或网站自身有害的内容进行删除或隐藏等处理。“有害内容”的分类包括:“涉政言论”,“国家领导人”,“社会敏感事件”,“民族宗教”,“境内外分裂势力”,“色情和有害价值观”,“涉枪涉赌犯罪信息”等不一而足。审查员往往通过学习审查部门制定的规章和敏感词库来辅助判断,此外,还需要根据不同的内容采取不同的审查策略、进行不同的审查操作,也因此产生了一套审查术语。中国数字空间根据独家材料新浪微博审查员交班日志以及其他审查材料,将中共审查机制中的审查术语特别总结加以解释。
敏感词
关键词:审查系统针对的具体字词,或是用来检测审查的具体字词。
延伸关键词:由关键词延伸出来的关键词,如习包子延伸出包子、包帝、庆丰包子、庆丰帝。(背景相同)
相关关键词:背景不同,比如邹幸彤和香港支联会,就是互相相关的关键词
关键词组合:如用两个关键词去测审查情况,邹幸彤+香港支联会 邹幸彤+维园六四烛光晚会
敏感词:会出发审查机制的关键词或是关键词组合。
禁搜词:禁止搜索的关键词或是关键词组合。各个平台不一,有时是全网禁搜词。
禁发词:禁止发表的关键词或是关键词组合。各个平台不一,有时是全网禁发词。
审查词/审核词:经过审查(大多是人工审查后,符合党国意识形态的)可发表的关键词或是关键词组合。
官宣词:国家宣传机器特别宣传的关键词或是关键词组合(如三孩政策)。
注:关键词的性质可能会有以上好几种,且会不断变化,所以能写时间写上时间。若是无法具体明确,就可写敏感词。
敏感词审查描述
关键词审查描述:CDS 平台从七个方面去描述一个关键词或是关键词组合的审查情况。
审查内部记录:
审查记录:404文库
敏感测试:
媒体报道:
党国话语:异闻观止、麻辣总局、党国话语等栏目
民间话语:网络民议、中国哭墙、漫画等
公民抗争: 陈秋实、张展、天安门母亲、709律师等一类全网禁搜禁发,只有海外媒体能报道的关键词
用户分类
在新浪微博,审核后台会将用户分组,分为一般用户和敏感用户,其中,敏感用户又会分为普通敏感用户和VIP敏感用户。
敏感用户,是新浪微博的一种用户分组策略。只存在于网站后台,不会对用户进行提示。当用户被删除或私密等处理,或因为转发敏感内容造成被通私,通止等积累一定分值后,会被自动划入普通敏感组。届时,该用户的所有微博及评论,不论是否踩中敏感词,全部会进入后台进行审核,以便监控绕过敏感词的行为,监控关联用户,学习新敏感词。
少数敏感用户会被手动划入VIP敏感组。该用户组为影响力较大的经常讨论公共议题,或发布第一手消息的VIP用户,本身能为微博带来巨大流量。微博除了对其发布的所有内容进行全量审核,还将其划给高级编辑进行审查。
"转世党"用户不会被视为敏感用户,因为新浪对其坚决封杀,并不允许其讨论任何议题。
机器审查
机审: 在新浪微博,审查员打开后台,首先系统会对平台进行第一次内容审核:关键词过滤,系统根据敏感词库自动对平台内容进行第一次审核,因此敏感词也叫审核词。
敏感词库:敏感词库是网络平台慢慢积累的一个词库,来源主要来自两方面,一面来自外部,网信办、公安部等各个有关部门发来样本,要求全网清除,审查员根据样本摘除敏感词;另一方面,通过转发,或是敏感用户,或是“评论翻车”发现未命中的敏感词,总结后加入词库,这是平台内的样本积累的结果。
有了敏感词库,系统就会对平台进行第一次内容审核,若是踩中一些高危敏感词,如六四、法轮功等,直接进到删除状态,然后人工审核;若是踩中低危敏感词,会进入默认通过的状态,然后审核员会用先审后放或是先放后审两种策略对待。
人工审查
机审之后就是人工审查,没有纯机器审核。
人工审查操作
系统根据敏感词库进行第一遍机审之后,新浪微博审查员媒体都要根据指示对帖子内容进行审查,其具体操作主要有删、隐、止、私、封等几种,各个品台也许叫法�各不相同,这里来自审查员交班日志的总结。
人工审查策略
2 单审
3 清理负面评论
4 删单通私
5 普删V私
6 负责人监控
5 海外私密