首页 - 科技处 - 通知公告

半导体学术沙龙【第十九期】- 揭开大语言模型的神秘面纱

通知公告 尚雅轩 2025-02-21阅读量:

所属各部门:

加强所内各科研方向之间的学术交流与相互了解,围绕半导体领域的重点攻关方向进行头脑风暴,形成轻松活跃的学术氛围,凝练新的科学与技术问题,碰撞出高度合作的全链条解决方案,为重大项目部署建言献策,半导体学术沙龙将于2025年2月27日在半导体所1号楼715会议室举行,诚邀各位老师的参与!

本期主题-题目:揭开大语言模型的神秘面纱

报告人:吴敏

主持人:杨华

联系人/记录员:贾政恺

时  间:2025年2月27日 15:00

地  点:中国科学院半导体研究所1号楼715会议室

摘  要:

近年来,大语言模型(LLM)在人工智能领域掀起了一场革命,尤其是最近发布的DeepSeek大模型,其强大的文本生成、理解和推理能力令人惊叹。本报告将带您揭开大语言模型的神秘面纱,从基本概念、发展历程、工作原理、应用场景以及潜在挑战等方面进行科普讲解。我们将探讨大语言模型如何从海量数据中学习语言规律,并像人类一样理解和生成文本。您将了解到大语言模型在机器翻译、文本摘要、问答系统、代码生成等领域的广泛应用,以及它如何改变我们的工作和生活方式。同时,我们也将直面大语言模型带来的挑战,例如数据偏见、幻觉问题和安全隐患,并探讨如何负责任地开发和利用这项技术。通过本次报告,您将对大语言模型有一个全面而清晰的认识,并思考它如何为我们的未来带来更多可能性。

报告人简介:

吴敏,男,中国科学院半导体研究所人工智能与高速电路实验室助理研究员,致力于最优化算法、大语言模型和人工智能驱动的科学研究(AI for Science),是中国运筹学会和中国电子学会会员,曾获得中国运筹学会科学技术奖运筹应用奖,国际运筹学联合会二等奖,是半导体领域大模型Semi-GPT建设核心成员,国家自然科学基金重大研究计划项目“知识融合的神经网络分治约简符号回归方法”核心骨干,主持中国科学院半导体研究所青年人才科技推进计划课题“基于深度学习的符号回归及其在半导体器件研发中的应用”等项目,在国内外期刊会议发表学术论文10余篇,其中包括人工智能顶级期刊TNNLS,Neural Networks和顶级会议ICLR、ICML,AAAI等,申请发明专利10余项。