人工智能技术与应用学术研讨会(第四期)成功举办

由 苏智会 发布于 2025-06-23

  2025年6月22日,由江苏省人工智能学会主办,江苏省人工智能学会人工智能教育专业委员会、南京师范大学计算机与电子信息学院/人工智能学院联合承办的“人工智能技术与应用学术研讨会(第四期)”在南京师范大学仙林宾馆第二多功能厅圆满举办。此次研讨会邀请了国内人工智能领域知名专家:中国科学院自动化研究所徐常胜研究员、国防科技大学刘新旺教授、浙江大学杨易教授、清华大学自动化系韩军功长聘教授、南京邮电大学副校长刘青山教授和南京理工大学计算机科学与工程学院/人工智能学院/软件学院副院长李泽超教授,以人工智能技术与应用为主题做学术报告。本次报告由南京师范大学计算机与电子信息学院/人工智能学院杨明教授、杨琬琪副院长和南京理工大学杨杨教授共同主持。研讨会旨在针对人工智能领域机器学习等新技术与新方法展开研讨,共同促进了学术的碰撞与交融。

  刘新旺教授的报告以“攻与防:鲁棒图机器学习”为题,系统性地介绍了图机器学习领域的对抗攻击与防御技术,并结合实际研究成果展望了未来发展方向。报告聚焦于训练数据污染、测试数据扰动和图谱结构异构性三大核心问题,刘新旺教授分别从研究背景、研究目标和研究内容对三大核心问题进行了详细阐述。训练数据污染重点关注如何从被污染的训练数据中筛选出毒节点以防御图后门攻击,测试数据扰动的关键问题是如何消除测试数据中潜在的对抗扰动使得模型给出正确结果,图谱结构异构则关注如何在异构的知识图谱中添加或删除关系从而降低模型的预测准确率。刘教授团队创新性地提出了基于重要度采样的图对抗防御和路径引导的知识图谱对抗攻击等方法,并展示了其在不同数据集上的优势与有效性。在报告的最后,刘新旺教授还前瞻性地探讨了大语言模型增强的对抗攻击、图认证鲁棒性和GraphRAG等未来研究方向,为构建安全可靠的图学习系统提供了重要理论支撑和技术路线。

  徐常胜研究员的报告以“开放世界的多模态大模型研究与应用”为题,从研究背景出发,系统梳理了机器学习、深度学习到大模型的历史演进,并详细介绍了多模态大模型的发展时间线及研究现状。随后在Libra多模态大模型部分,徐老师阐述了其研究动机,提出理想视觉系统的三大原则:视觉系统独立于语言模型、合理的跨模态交互机制、视觉系统的自监督学习。基于此,Libra模型采用路由视觉专家模块实现视觉与语言的解耦,并通过统一自回归建模强化自监督学习,显著提升了模型的泛化能力。针对跨域迁移挑战,徐老师团队介绍自步课程自适应方法,实现无监督环境下的高效知识迁移。而在小样本迁移方面,介绍了隐式知识蒸馏技术,使模型在有限数据下仍能保持优异性能。在报告的最后,徐老师总结了多模态大模型在开放世界应用中的广阔前景,并展望了未来研究方向。

  杨易教授的报告以“混合模型协同的智能内容生成技术”为题,深入探讨了在算力资源受限条件下实现通用技术行业落地的创新路径。报告首先提出了“多重知识表达与混合模型协同”的技术框架,通过整合不同类型的人工智能模型,如预训练大模型、领域专用小模型和先验知识模块等,有利于发挥通用性和专用性优势,实现多重表达互补增强。这种协同机制有效解决了垂域下单一模型的局限性问题。随后,杨易教授还介绍了在可控图像生成技术,其针对方位控制和属性绑定两大挑战,提出了知识加数据的创新解决方案。采用分治思想实现文本链属性隔离,结合空间布局知识进行特征定位,显著提升了多实例生成的精确度。报告还介绍了单图引导的定制肖像生成场景,深入剖析了身份保持和姿态控制两大技术难点,提出了融合海量预训练数据与领域专用知识的混合建模方法,在保持人物身份特征的同时,实现了姿态、表情的精准控制。最后杨教授总结指出,混合模型协同是多重知识表达在大模型时代的成功实践,通过有机整合不同类型的人工智能模型,不仅实现了知识增强,更显著提升了技术的适用性和外推能力。这一创新框架为在有限算力条件下推动AI技术行业落地提供了重要方法论指导。

  韩军功教授的报告以“多模态场景理解”为题,首先梳理了从专业模型到通用模型、单一模态到多模态的范式演进历程,揭示了多模态技术发展的必然趋势。针对核心科学问题,韩教授结合具体应用场景进行了深入剖析:在模态交互效率提升方面,以Referring Image Segmentation任务为例,展示了如何通过跨模态注意力机制实现精准的视觉-语言对齐;针对模态融合挑战,重点介绍了RGB-T视觉追踪中的特征融合策略;在有限训练数据条件下,详细阐释了基于一致性正则化的半监督学习新范式。韩军功教授针对大模型应用痛点提出系统性解决方案:通过模型压缩加速技术显著提升推理效率;建立知识边界度量体系有效抑制幻觉现象,并构建了“评估-增强-引导”的闭环优化框架。最后韩教授总结指出,多模态场景理解正迎来重要发展机遇,未来将在模型轻量化、推理高效化和生成可靠性三个方向持续突破。

  刘青山教授的报告以“情感智能:从表情识别到多模态分析”为题,首先从心理学基础切入,深入解析了伊扎德提出的情感三成分理论,包括主观体验、外在表现和生理唤醒,为情感智能研究奠定了坚实的理论基础。刘教授随后分享了其团队在情感计算领域的最新研究进展。首先,针对传统三维卷积神经网络在时空特征提取中的局限性,创新性地将相空间重构思想引入表情识别领域,提出了相空间驱动时空表情特征学习的方法,通过改进相空间重构模块和学习互相关矩阵,有效解决了全局时序信息缺失问题。其次,针对情感标签相似性问题,提出了基于反馈的表情软标签协同学习框架,通过引入软标签机制,显著提升了情感识别的准确性。最后,在情感交互层面,提出了多情感智能体协同计算模型,通过构建多个具有感知能力的情感智能体,实现情感信息的交互与协同决策。报告特别强调,随着大模型时代的到来,情感计算面临着新的机遇与挑战。一方面,大模型强大的表征能力为情感细腻度刻画提供了新的可能;另一方面,如何在人机交互中实现自然流畅的情感调控,仍是亟待解决的关键问题。刘教授指出,未来的情感智能研究需要更加注重多模态信息的融合,同时深入探索情感生成与理解的认知机制。

  李泽超教授的报告以“面向视觉异常检测的预训练模型知识增强”为题,首先指出在大数据与大模型时代背景下,异常检测与定位在工业领域具有重要价值,但传统记忆模块方法存在明显局限。针对这一挑战,李教授提出了基于记忆和误差估计的创新方法。该方法在自动编码器架构中引入分区记忆块(PMB),通过新颖的查询生成机制和分区存储策略,有效提升了异常检测性能。其中直方图误差估计模块,在不增加计算负担的前提下,实现了图像累积重建误差的自适应消除。李教授以高速铁路道床裂缝检测和轨道扣件异常检测为典型案例,展示了该方法在工业场景中的实际应用价值。最后,李教授系统梳理了开放环境视觉异常检测的关键技术链条,包括特征表示、异常检测、定位和语义分割等环节。李教授强调垂直领域检测、模型泛化能力和可解释性将是重点研究方向,为多模态大模型的知识增强技术发展指明了路径。

  研讨会后,各位人工智能专家与在场的师生对相关问题进行了深入的讨论与交流,现场学术氛围热烈。此次研讨会不仅为师生提供了一个了解人工智能前沿动态的宝贵机会,也促进了学术交流与合作。

  • 智领江苏(资讯)

  • 加入JSAI学会