来源:新闻网
(通讯员 数智大模型新闻助手、叶龙)12月21日,由中国传媒大学媒体融合与传播国家重点实验室、数据科学与智能媒体学院、媒介音视频教育部重点实验室和广东南方新媒体股份有限公司共同承办的第20届数字多媒体通信国际论坛(IFTC 2023)在中传学术中心举行。
中国传媒大学副校长柴剑平出席会议并致辞,来自中国传媒大学、清华大学、北京大学、上海交通大学、南京大学、天津大学、中国科学技术大学、北京理工大学、华东师范大学、中国海洋大学、西安电子科技大学、北京工业大学、上海师范大学、中国科学院计算技术研究所等高校、科研机构与百度、中国电科等头部企业的100余位嘉宾围绕“多媒体通信中的人工智能”展开深入探讨。
柴剑平在致辞中首先对参加论坛的各位嘉宾表示欢迎与感谢。他表示,数字多媒体通信是当今社会信息化、数字化、智能化的重要载体和推动力,不仅为人类提供了丰富、高效、便捷的信息服务,也深刻影响着文化创造、社会交流、知识传播、教育培训等各个方面。中国传媒大学“国重、国传、国舆”三国科研平体系发展的核心是以自然科学的方法解决社会科学的问题。由衷的希望通过本次论坛的举办,能够凝聚出数字多媒体通信领域的先进理论与核心方法,解决社会治理与国际传播中的关键问题。
上海市图像图形学学会秘书长周军在致辞中介绍了学会情况,并希望通过此次论坛建立起学会与中国传媒大学交流的桥梁,共同推动学术合作与人才培养。
数据科学与智能媒体学院院长叶龙主持了论坛。论坛分为主旨报告、口头报告和墙报展示三个环节。
罗切斯特大学罗杰波教授在线上做了题为“GPT-4V (vision) as A Social Media Analysis Engine”的主旨报告。报告首先介绍了GPT-4V在社交多模态分析任务上的表现,并通过情感分析、仇恨检测、谣言识别、人口统计学推断和政治倾向判断等五个代表性任务,展示了GPT-4V在图文理解、上下文与文化认知以及常识推理等方面的强大能力。罗教授同时指出,尽管GPT-4V在理解社交多模态内容方面表现出色,但仍面临多语言和社交媒体最新趋势的理解挑战,新的基准数据集的建立势在必行。
中国传媒大学张勤教授做了题为“Theory Emotional Intelligence Model Based on A Networks”的主旨报告。报告以ChatGPT为例,分析了大模型时代科学研究的特点,特别关注了智能作曲中情感模型在底层逻辑、上层逻辑和脑结构原理等方面的挑战。随后提出了建立情智模型理论的关键,介绍了基于AI网络的情智模型理论中的主要问题,并强调了情智模型与人工智能结合的重要性。报告还介绍了通过情智机理中'非感性调节'和'感性调节'的交叉可以构建更完善的类人智能,指出情智模型的科学意义,并强调了其在系统控制、社会意义和经济意义等方面的巨大潜力。
清华大学季向阳教授做了题为”Vision-based object pose estimation”的主旨报告。报告中介绍了语义三维场景重建的应用场景和社会经济价值,并分享了团队在相关领域的成果,包括机器人寻路和无人机路径规划等。其中重点介绍了六维自由度下的姿态估计算法,并讨论了实例级、分类级、物体和场景等估计算法的细节和改进方向。并对光流估计法在相关领域的前景给予了肯定,强调了与语义分析的关系,引起了与会者的兴趣和热烈讨论。
百度计算机视觉首席架构师王井东博士做了题为”Towards Large Vision Models: Self-Supervised Pretraining and Video Generation”的主旨报告,报告详细介绍了大视觉模型中的问题,并探讨了对比预训练和遮掩图像建模等主流研究方向。分享了团队在对比预训练、语义空间内的表征学习和部分注意力表征学习等子领域的工作,并展示了在OCR文字识别和文字到视频生成等领域的相关成果。
会议主题聚焦大模型和视觉模型的研究与应用,通过四位行业专家的主旨报告,参会者深入了解了GPT-4V在社交多模态分析任务上的能力、情智模型理论的重要性、语义三维场景重建的应用场景以及大视觉模型中存在的问题。报告紧扣会议主旨,突出了大模型和视觉模型在不同领域的应用和挑战,引起了现场观众的热烈反响,激发了对未来研究和应用的广泛期待。大会为主旨报告嘉宾颁发了证书。
会议录用论文中审稿成绩排名前11位的文章作者受邀进行了口头报告。通过现场评审,南京大学团队的论文“ULIC: Ultra Lightweight Image Coder on Wearable Devices”获评最佳论文,中国传媒大学团队的论文”Acquiring Rotation Invariance of 3D Object Reconstruction via Adversarial Rotation”获评最佳学生论文。中国传媒大学校长助理金炜、上海交通大学教授翟广涛分别为最佳论文与最佳学生论文获得者颁发了获奖证书。
会议其它46篇录用论文进行了海报展示。通过评选,中国传媒大学团队的论文“MABC-Net: Multimodal Mixed Attentional Network with Balanced Class for Temporal Forgery Localization”获评最佳海报论文,中国科学院计算技术研究所团队的论文“End-to-End Image Compression Through Machine Semantics”获评最佳学生海报论文。清华大学教授季向阳与百度计算机视觉首席架构师王井东分别为最佳海报论文与最佳学生海报论文获得者颁发了获奖证书。
IFTC2023作为国际交流和有组织科研的桥梁,积极促进了学术界与产业界的沟通与合作,各高校师生积极参会,共智共力。中国传媒大学为论坛的深度对话和知识共享提供了坚实的学术支撑。本届论坛的成功举办,不仅为参与者提供了一个关于人工智能和多媒体通信交流的高端平台,也为相关领域的研究与应用指出了新的方向。参会人员纷纷表示,通过本次论坛的学习与交流,他们将能够更好地把握行业发展的脉搏,促进科研成果的转化应用,并为推动全球数字多媒体通信领域的发展贡献力量。