我来迟了,刚才机房那边正在跑最后一轮的数据。”
艾尔肯注意到她用了“艾哥”这个称呼,单位里古丽娜对他的称呼一直在这两个词之间徘徊,“艾处”和“艾哥”,正式场合就用“艾处”,私下或者小范围讨论的时候就会变成“艾哥”。
也就是说她今天带过来的东西不适合用太正式的话说出来。
“坐,先说你的发现。”林远山转过身,把窗帘重新拉上。
古丽娜打开电脑,投影仪嗡嗡响了几秒,白墙上出现了一张数据图表。
“这是最近四十五天的舆情分析结果。”她拿起激光笔,红点落在图表的第一个峰值上,“从二月十六号开始,境内外多个平台几乎同时出现了一批涉疆负面帖文。表面看,这些帖子的内容各不相同——有说宗教问题的,有说就业问题的,有说文化传承问题的。但我们做了语义分析之后发现,它们有一个共同的特点。”
“什么特点?”林远山问。
“结构高度相似,”古丽娜切换到下一张幻灯片,屏幕上出现两段文字对比,关键词用红色标注,“你们看,这篇讲清真寺的,这篇讲棉花采摘的,表面上风马牛不相及,但是如果我们把它们的句式结构提取出来,就会发现——”
她敲了几次键盘,文字就消失了,出现的是两条几乎重合在一起的曲线。
“叙事节奏一模一样,都是先用第一人称建立可信度,然后铺垫情绪,三到四个‘个人经历’,最后抛出一个开放式的问题引导讨论,这不是人写东西的方式。”
艾尔肯看着那两条曲线,沉默了几秒。
“你的意思是,它们都是机器生成的?”
“不只是机器生成。”古丽娜的脸色变得严肃起来,“我们拿当下主流的检测工具试了试,结果显示这些文本人工参与度极高,就是说,并不是让程序简单地写一段话这么简单粗暴,而是——”
“人机协同。”艾尔肯接过话,“有人先设定好模板、关键词,让生成式程序出个底稿,然后人工润色,加点本土化的细节,对吧?”
古丽娜点头,眼睛里有一种被理解的释然。
“对的,而且修改得很高明,那些细节,‘老城区巷子里的烤包子摊’这样的描述,被说得特别准,连用的是电炉还是炭火都说出来,这就表明参加修改的人要么是当地人,要么就是一直在南疆生活的。”
会议室静悄悄的。
林远山把嘴里的那根没点着的烟拿下来,在手指
本章未完,请点击下一页继续阅读!