2021年,这群青年怀着对AI的热情加入华科大。
经过三年的学习,
他们发现AI安全似乎冲击着网络环境,
面对层出不穷的AI伪造威胁,
鱼龙混杂的风险内容,
这群年轻的本科生能做些什么?
今天,一起走近我校七十二辨团队,
听听这群本科生如何攻坚克难,
最终揭榜夺擂的故事。
随着通信技术和数字技术的快速发展,诈骗、谣言等风险内容日益增多,成为社会管理和网络治理的新挑战。尤其是利用AI技术合成的多模态风险内容,如诈骗短信、诱骗电话、伪造人脸、合成声音、篡改视频等,正在渗透人们的日常生活,给受害者带来严重的经济损失和心理创伤。更严重的是,这些风险内容对国家安全、经济发展和社会稳定构成了巨大威胁。然而,现有的内容识别技术在应对这些日益复杂的威胁时显得力不从心,迫切需要更强大、敏锐的检测手段。
在11月中旬结束的第十九届“挑战杯”大学生课外学术科技作品竞赛2024年度“揭榜挂帅”专项赛终审决赛中,我校七十二辨团队凭借自主研发的“声画留痕、智御万象——基于多模态大模型的高风险内容识别系统”,将人工智能领域的前沿大模型技术成功应用于反诈这一社会性命题,赢得了评委的一致好评,并荣获大赛擂主称号。
七十二辨团队主要由我校未来技术学院和人工智能与自动化学院的本科生组成。团队成员在大二时便加入了VLR-lab实验室,深入学习专业知识、培养科研能力。为了将所学知识应用于解决实际问题,他们始终坚持不懈地努力与奋斗。
当团队成员看到中国联通发布的“基于大模型的多模态风险内容识别技术研究”命题时,纷纷产生了共鸣。这正是他们一直想做的项目:一个既紧密结合专业知识,又直接关系到社会民生的重要课题。
然而,系统设计与构建面临诸多难题。新型多模态风险数据涉及公民隐私,获取难度极大;不断升级的音视频伪造技术,极大挑战了系统的检测准确性;不同模态数据之间的形式差异,也使得模型统一处理变得异常复杂……这些难题,团队需要一一克服。
敢做敢拼是七十二辨的团魂所在,在详细的命题分析后,团队针对难点进行了数月的重点攻关。在实验室的会议室中,成员们有过激情讨论,有过灵感碰撞,有过互相打气,历经无数个日夜,提出三项核心技术,精心打磨成果,完成系统构建。
其中,团队负责人万金鹏统筹整个项目,从时间计划到成员分工,亲自把控每一环节;从数据合成到模型设计,深入研究每一个技术,从打磨讲稿到反复练习,精心打磨每一处细节。他的答辩队友张凯乐也对整个系统了如指掌,负责系统展示设计、精通技术细节、准备问辩题库。作为团队中最富创造力的一员,在系统研发、成果转化以及答辩现场均发挥了至关重要的作用。在团队所有成员的努力下,两人最终携手,在决赛的舞台上大放异彩,夺得擂主桂冠。
当然,团队的成功离不开团队成员、指导老师以及实验室的深厚积累。成员在实验室的这两年里,共发表学术论文4篇,获得过ACL 2024最佳论文;曾指导学生夺得互联网金奖的诸位教师给团队指明方向、提供宝贵经验;作为校年度十大学术进展的多模态大模型Monkey,为系统的构建打下了夯实的基础。
将最前沿的学术成果应用到实际中,切实惠及人民、造福社会是每一个团队成员,也是每一个研究者所希望的。面对多模态风险内容识别这一全新命题,七十二辨团队深入研究技术难题,精心设计模型架构,反复试验优化,最终使系统成功落地。未来,团队也将继续加强与相关企业的合作,共同推动系统的研发与应用,为构建更加安全的网络环境贡献青年力量!
