上海交大师生畅用满血DeepSeek!昇腾加速中国自主创新大模型
发表于 2025-02-17 20:40:42

近日,上海交通大学基于昇腾Atlas 800T A2算力集群,成功完成DeepSeek全系列模型的本地化部署,成为国内首个实现千亿级大模型全栈国产化部署的高校。此次部署涵盖DeepSeek-R1、DeepSeek-V3等核心模型,重点服务于教学、科研、管理和服务等多场景,标志着高校AI基础设施建设迈入新阶段。

这背后,是昇腾先进架构带来的卓越性能以及原厂服务FAE的支持,为多个DeepSeek模型提供算力支撑。针对高校场景的特殊需求打造三大技术突破:

轻量化推理架构:通过昇腾Ascend核间通信优化技术,实现4台Atlas 800服务器承载DeepSeek-R1和DeepSeek-V3千亿参数推理,硬件投入成本降低65%;

动态资源调度:基于昇腾AI原生算力平台,实现教学、科研、管理和服务等各类场景的算力弹性分配,算力资源利用率实现一定程度的提升;

全栈自主可控:从昇腾处理器到MindSpore框架的深度适配,使DeepSeek-V3在复杂数学推理任务中的端到端时延较传统方案实现有效缩短。

借助华为昇腾的独特优势,DeepSeek在推理效率上得到显著提升,成本也大幅降低。2025年2月4日,DeepSeek-V3、DeepSeek-R1、Janus-Pro正式上线华为昇腾社区,支持一键获取DeepSeek系列模型。

从即日起,上海交大师生可通过网页/APP申请体验“满血版”DeepSeek,无需担心“深度思考用不了”“对话提问无反应”。同时,上海交通大学鲲鹏昇腾科教创新卓越中心也将推动DeepSeek系列模型与课程设计、科研创新等方面融合,探索AI加持下的学习与科研新范式。

鲲鹏昇腾科教创新卓越中心定位为基于鲲鹏昇腾技术路线的校级生态合作平台,在校企合作、产教融合方面发挥重要作用,卓越中心将持续推动DeepSeek等重要AI创新在高校领域落地,进一步将人工智能技术带到师生生活、学习、科研的方方面面,逐浪世界科技最前沿。


「免责声明」:以上页面展示信息由第三方发布,目的在于传播更多信息,与本网站立场无关。我们不保证该信息(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关信息并未经过本网站证实,不对您构成任何投资建议,据此操作,风险自担,以上网页呈现的图片均为自发上传,如发生图片侵权行为与我们无关,如有请直接微信联系g1002718958。

CSDN官方微信
扫描二维码,向CSDN吐槽
微信号:CSDNnews
微博关注
【免责声明:CSDN本栏目发布信息,目的在于传播更多信息,丰富网络文化,稿件仅代表作者个人观点,与CSDN无关。其原创性以及文中陈述文字和文字内容未经本网证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本网不做任何保证或者承诺,请读者仅作参考,并请自行核实相关内容。您若对该稿件有任何怀疑或质疑,请立即与CSDN联系,我们将迅速给您回应并做处理。】