讲座题目:从多模态大语言模型到通用人工智能
讲座时间:2024年1月5日 14:00-15:00
讲座人:费豪 博士
地点:L1912
讲座内容:
本次报告将简要介绍多模态大语言模型的最新趋势,并基于此引出我们最近的工作——NExT-GPT,一个端到端的通用任意到任意的多模态大语言模型系统,它能感知文本、图像、视频和音频的任意组合输入,并生成输出。接着,报告将会讨论关于多模态大语言模型最新趋势的更多讨论,这方面将帮助引导未来人工智能的更聪明的智能体。
讲座人简介:
费豪(http://haofei.vip/),新加坡国立大学博后研究员,同时担任新加坡昆仑2050研究院的联合研究员。他的研究兴趣点主要包括面向结构的自然语言处理、多模态语言视觉理解和大型语言模型。他在顶级人工智能会议和期刊上发表了30多篇CCF-A/一区论文,例如ICML、NeurIPS、ACL、WWW、AAAI、SIGIR、IJCAI、ACM MM、EMNLP、TOIS、TKDE、TNNLS等。他的工作在谷歌学术上被引用超过2300次,H指数为29。他获得了2022年中国中文信息学会优秀博士论文奖,并在2023年获得世界人工智能大会云帆奖明日之星。他在多模态学习和大语言模型方面的研究获得2023年CCF-百度松果基金资助。他所开放的XNLP demo系统(http://xnlp.haofei.vip/)受到社区人员的大量调用。他主持构建的NExT-GPT通用多模态大语言模型受到了全球AI社区的高度关注,开源代码(https://next-gpt.github.io/)超2.6K星标。他(曾)担任了顶级AI/NLP领域的学术会议的组织委员会成员,(高级)领域主席、或高级程序委员会成员,担任重要学术期刊的编委(如副主编),包括ACM TALLIP和Neurocomputing等,也是包括TPAMI、TNNLS、TKDE、TOIS、TAFFC和TASLP等著名期刊的常邀审稿人。