计算机科学与技术学院欢迎你 |

新闻通知

  • 重要新闻
  • 综合新闻
  • 讲座通知
  • 学生工作
  • 通知公告

光熙论坛(第125期)语言智能驱动的多模态理解及推理方法研究

来源: 作者:发布时间:2025-04-23阅读:

讲座人:李云鑫 博士生

题目:语言智能驱动的多模态理解及推理方法研究

时间:2025年4月24日17:00-18:00

地点:信息楼L1711


讲座内容:

本报告以语言智能为核心,系统阐述多模态理解与推理的突破性进展。基于大语言模型,提出多专家混合架构(Uni-MoE)和Shapley值驱动的视觉数据筛选方法,构建700k高质量多模态数据集使模型性能提升10%。研发VideoVista视频评估基准(25,000样例)和多模态图论数学基准,突破复杂逻辑推理评估边界。设计目标导向的反向推理数据构建范式与混合Reward机制,结合KaLM-Embedding多语言嵌入模型(40万下载量),支撑WebQA多跳推理连续6月夺冠。同步开源ComfyUI-Copilot等工具链,并首创多智能体动画生成框架Anim-Director2,实现从理论到产业应用的闭环突破。



× 学术夏令营 招生信息