主讲人:王萌
时间:2025年4月7日 14:30—15:30
地点:文昌校区第五教学楼东303
报告摘要:
随着信息技术的迅猛发展以及社交媒体的流行,人们越来越广泛地使用图文并茂的方式进行社交分享,导致图像文本等多模态数据呈爆炸式增长。面对海量的多模态数据,如何挖掘不同模态内容之间的语义关联关系,从而弥合跨模态语义鸿沟,是实现多模态数据处理和利用的一个重要问题。细粒度图像文本跨模态语义关联通常可以分为三步,即首先通过对齐交互确定投影到公共表示空间中的图像和文本片段特征之间的语义关联关系,然后衡量模态间相关片段特征相似程度,最后基于所有片段相似度推理整体图文匹配程度。尽管现有跨模态语义关联技术取得了快速的进展,但在对齐交互、语义衡量、匹配推理三方面仍面临诸多挑战。
主讲人简介:
王萌,教授,硕士生导师,现任广西科技大学启迪数字学院副院长。主要研究方向为计算机视觉智能分析技术、深度学习算法及应用和教育大数据信息系统研究与构建。近年来主持了广西科技攻关和自然科学等10多项科研项目,完成转移转化100余万元,发表学术论文30余篇,其中被三大检索收录10余篇,授权发明专利8项,曾获得广西科技进步三等奖和广西教学成果奖一等奖,二等奖。