近日,我校计算机科学与工程学院教授姜枫带领的泰州市大数据与人工智能重点实验室在少样本图像分类领域取得重要研究进展。团队骨干教师、论文第一作者叶志鹏与合作者完成的论文"IDEA: Image description enhanced CLIP-adapter for image classification"在人工智能与模式识别领域顶级期刊Pattern Recognition (PR)正式发表。该研究由我校与西交利物浦大学、昆山杜克大学共同完成,叶志鹏为第一作者,姜枫为通讯作者,我校2022级优才班学生黄佳琦为第五作者,我校为第一通讯单位。
CLIP的下游任务适配是深度学习领域的研究热点和重要方向之一,在图像分类、图像分割等计算机视觉任务中具有广泛的应用。然而,现有方法大多聚焦于视觉编码器适配与文本提示词适配,缺乏细粒度特征的感知能力。本研究提出的(T)-IDEA方法,创新性地充分挖掘训练集中的文本信息,显著提升了模型在细粒度图像感知中的能力,在多个基准数据集上取得了领先水平。
Pattern Recognition是人工智能与模式识别领域的顶级期刊,属于中科院一区Top期刊,在全球机器学习与模式识别领域具有很高的影响力。中国自动化学会(CAA)将其列为A类推荐期刊,中国计算机学会(CCF)评价该期刊为“国际重要期刊,具有重要的国际学术影响力”。
此次研究成果的发表,充分展示了我校科研团队在计算机视觉前沿领域的科研创新能力,也体现了团队青年骨干教师叶志鹏的突出科研贡献。
论文链接:https://doi.org/10.1016/j.patcog.2025.112224。

