科研部与计算机与软件学院联合举办题为《从DeepSeek展望大模型技术的行业前景与挑战》学术讲座
日期:2025-03-05  作者:科研部   来源:  浏览量:0

近日,为培养和提高我校教师科研创新意识,提升教学科研能力和水平,促进学术交流,科研部携手计算机与软件学院,特约蒋韬博士,讲解AI大模型DeepSeek的创新点、战略意义以及给高校科研领域带来的机会和挑战等方面的内容。会议由计算机与人工智能系副主任张启龙博士开场,张老师首先介绍了本次讲座的主题,指出DeepSeek的出现对人工智能技术与产业都带来了深刻影响,本次讲座的主要目的就是在介绍前沿技术的基础上探讨人工智能技术如何对我校教师在教学与科研方面进行助力,张老师还简要介绍了主讲教师蒋韬博士的基本情况。

3月5日讲座6

 

【讲师简介】

蒋韬,博士,有20多年在一流企业研发及管理工作经验,对行业趋势和产业落地有丰富的实战经验,作为主要负责人和参与人近年来参加过科研项目8项,获得发明专利2项,实用新型专利3项,目前已在《软件学报》、《通信学报》、《计算机研究与发展》等学术刊物以及IEEE系列等国际会议上发表论文十余篇,并有多篇论文被EI等国际权威机构检索。

讲座伊始,蒋韬博士首先从大模型技术的特点与发展趋势谈到了DeepSeek的创新点和战略意义。他提到,DeepSeek在模型架构、训练方法到硬件利用等多个层面进行了创新,这些创新使其在大语言模型领域取得了取得了“多快好省”的成就,并为相关技术的发展提供了新的思路和方向,同时标志着中国已成功构建起完整的人工智能生态,打破了美国在人工智能大模型上的垄断,为中国及世界上大多数国家充分应用人工智能技术提供了可能。

3月5日讲座1

如同航空发动机的突破带来的井喷效应一样,DeepSeek的出现也快速在AI应用方面带来巨大的连锁效应,仅仅短短几个月就引起巨大反响,众多企业和科研单位和高校纷纷接入DeepSeek。针对我们目前所处的教育行业,围绕大家在AI应用方面的需求和担心,蒋韬博士也提出了AI在“AI助教、AI伴学、AI服务”方面的思路,并介绍了上海交大、浙江大学等著名高校的一些优秀实践,引起了与会老师的强烈共鸣、思考与启发。

最后,蒋老师话锋一转,提出人工智能大模型在高歌猛进的同时,在行业应用方面却面临巨大挑战。首先从大模型的原理和本质入手解释了大模型Seq2Seq的特征能够大力出奇迹(数据、算力和算法),“涌现”的不确定性以及大模型产生“幻觉”的内在因素。接着分析了行业大模型在专业性、确定性、可靠性、稳定性、灵活性、一致性、可解释性和低时延等方面的要求。与此同时,就可能的解决方案进行了探讨:除了不断加大网络参数规模(百亿,千亿,万亿),不断重新训练(改进梯度寻优,改进网络结构,改进训练方法),不断增加数据量,不断改进数据质量,不断重新训练和微调、优化模型之外,还需要不断探索新的算法模型与优化技术(如世界模型、高效模型压缩、边缘计算与蒸馏),从本质消除大模型幻觉产生的原因,从而真正实现高可靠性的行业应用。

 

3月5日讲座5

此次讲座不仅让与会教师更深入了解了人工智能技术的最新发展趋势和实际应用中的挑战与机遇,也激发了大家对人工智能技术的在教学领域引用的兴趣和热情。我们相信,在未来的工作中,大家将积极拥抱人工智能技术,不断提升自己的专业素养和综合能力,为迎接智能未来做好充分的准备。


收藏本页