2024年3月18日下午15:00,G-Seminar计算机学科全球学术前沿系列讲座第十六期暨计算机学院第39期“未来计算”学术前沿论坛在信息技术科研楼B413会议室举行。计算机学院邀请了新加坡南洋理工大学计算机学院助理教授张天威博士为学院师生作主题为“大语言模型的越狱探究”的学术报告。论坛由计算机学院副院长向涛主持,计算机学院师生参加论坛。
张天威博士介绍了大语言模型(LLMs)的背景知识。他指出,大语言模型不仅仅是一个模型框架,更是一个全面的生态系统,已被广泛应用于商业领域中,尽管大语言模型为众多应用提供了驱动力,并优化了人机之间的交互流程,但不能忽视其存在的安全问题,这些模型不仅面临着传统的安全威胁,也引发了一系列新的安全问题。在这次报告中,张天威博士借助团队的三项研究工作,为我们深入剖析了大语言模型所面临的越狱攻击(Jailbreak Attack)问题,并在报告的最后对团队未来工作做出了展望。
报告结束后,现场的师生积极提问,问题涵盖了报告中的技术细节和未来研究方向等方面,张天威博士为每一个问题都给出了详实的解答。通过此次学术报告,老师和同学们对大语言模型越狱有了更全面的理解,同时也为学院内从事相关研究领域的师生提供了更广阔的研究思路。
报告人简介:张天威,新加坡南洋理工大学计算机学院助理教授。于2011年在北京大学获得本科学位,并与2017年在普林斯顿的电子系获得博士学位。他的主要研究方向是计算机系统安全,对人工智能系统,机器人系统和分布式系统的安全都有浓厚兴趣。在安全(S&P, CCS, NDSS, Usenix Security),人工智能(ICML, NeurIPS, ICLR, AAAI, UCAI, CVPR, ICCV, ECCV, MM, ACL, EMNLP, NAACL)和系统(Micro, SC, OSDI, ASPLOS, Usenix ATC, NSDI)的顶会和顶刊发表了130余篇文章,获得包括ASPLOS在内的多个最佳论文奖。他是多个会议的组织委员,担任IEEE TCSVT的副主编,并获得2022年最佳副主编奖。