2024年11月7日,应西北师范大学计算机科学与工程学院邀请,合肥工业大学胡珍珍副研究员在线为我院师生做题为“面向长视频的跨模态理解”的学术报告。此次报告由学院魏伟一教授主持,200多位教师和研究生参加了学术交流。
胡珍珍副研究员首先从研究方向切入本次报告的主题,阐述视频-文字的跨模态理解、跨模态的对齐与融合、面向长视频的跨模态理解、跨模态的对齐与融合、长视频的表征等重要问题,针对自动驾驶、智慧教育、人机交互等应用场景中视频问答、视频时刻检索、文本视频检索、视频摘要生成等经典应用为例,带领师生了解什么是视频-文字的跨模态、特征嵌入、注意力机制、时序对齐等问题。
最后,胡珍珍副研究员就视频模型的选择、视频的显著性检测、如何面临数据丢失等问题与参会师生进行了互动交流,并答疑解惑。
版权所有©西北师范大学计算机科学与工程学院 管理登录 甘公网安备62010502000939号 陇ICP备17000462号-1