11月14日,受计通学院赵付青教授邀请,印度统计研究所Swagatam Das教授在线做了“UnveilingGenerative Language Models: Bridging Foundations, Commitments, Ethical Bias, and Responsible Applications”学术报告,计通学院部分教师和研究生50多人参加了学术会议。
生成语言模型(Generative Language Models GLM)生成语言模型是一种通过学习大量文本来生成新的文本的人工智能技术,近年来GLM被广泛用于自然语言处理、内容创作、聊天机器人等领域。它们主要基于深度学习技术,如神经网络。尽管这些模型非常强大,但它们也面临着偏见、可解释性和高资源消耗等挑战。生成语言模型正快速发展,对现代技术有着重要影响。 在学术报告中,Swagatam Das教授首先简要介绍了深度学习技术,并先后介绍了概率生成模型,隐式生成模型,传统生成对抗网络和深度生成对抗网络。接着,Das教授讲到,世界正在经历一场大语言模型(Large Language Models (LLMs))的风暴,并以GPT模型为例解释了大语言模型的工作原理以及存在的问题。最后,介绍了人工智能和GPT需要解决的4个问题和挑战。
会后,师生向Swagatam Das教授就生成语言模型等AI技术的理论方法和应用进行了深入的探讨。
Swagatam Das教授简介:Swagatam Das教授在2003年、2005年和2009年分别在印度贾达布尔大学获得电子与通信工程学士、控制工程专业硕士和工程学博士学位。他目前是印度统计研究所(ISI)的教授,并且在2021年至2023年期间曾担任ISI电子与通信科学系主任。此外,此外,他还在TCG CREST下的推进智能研究所(IAI)担任教授和副主任。Swagatam Das教授的研究兴趣包括深度学习和非凸优化,他已在同行评审的期刊和国际会议上发表了超过400篇研究论文。他是Elsevier国际期刊《Swarm and Evolutionary Computation》的联合主编,并曾在《IEEE Transactions on Neural Networks and Learning Systems》、《IEEE Transactions on Cybernetics》、《IEEE Transactions on Evolutionary Computation》、《Pattern Recognition》、《Neurocomputing》、《Information Sciences》、《IEEE Transactions on Systems, Man, and Cybernetics: Systems》等多个知名期刊担任或正在担任副主编。他也是Elsevier《Information Fusion》、Springer《Progress in Artificial Intelligence》、Elsevier《Applied Soft Computing》、Elsevier《Engineering Applications of Artificial Intelligence》等期刊的编辑委员会成员。Das教授在谷歌学术上的引用超过30,000次,H-index为82。他还积极参与NeurIPS、AAAI、AISTATS、ACM Multimedia、BMVC、IEEE CEC、GECCO等国际知名会议的程序委员会和组织委员会工作。Das教授目前是ACM杰出演讲者,他曾获得2012年印度国家工程学院(INAE)青年工程师奖,在2010年至2014年间成为印度工程与计算机科学领域引用次数最高的研究人员,并在2015年获得汤森路透研究卓越印度引文奖。(撰稿:赵付青;审核:高国礼)