点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:DeepSeek开源周收官 V3/R1推理系统概览于知乎独家发布
首页> 经济频道> 光明经济 > 正文

DeepSeek开源周收官 V3/R1推理系统概览于知乎独家发布

来源:光明网2025-03-01 22:09

3月1日,DeepSeek于知乎开设官方账号,独家发布《DeepSeek-V3/R1推理系统概览》技术文章,首次公布模型推理系统优化细节,并披露成本利润率关键信息,标志着全球关注的“DeepSeek开源周”正式收官。不久前,月之暗面、微软研究院、清华大学、阶跃星辰等开源项目参与者,均在知乎分享研究成果和经历。

作为“DeepSeek开源周”的收官之作,DeepSeeK知乎官方账号正式亮相,并发布文章详述V3/R1推理系统。文章写道:“DeepSeek-V3 / R1 推理系统的优化目标是:更大的吞吐,更低的延迟。”为实现这两个目标,DeepSeek的方案是使用大规模跨节点专家并行(EP),但该方案也增加了系统复杂性。文章的主要内容就是关于如何使用EP增长批量大小(batch size)、隐藏传输耗时以及进行负载均衡。

据了解,“DeepSeek开源周”自2月24日至2月28日,陆续开源最新技术进展。其中包括,FlashMLA、DeepEP、DeepGEMM和3FS四个开源项目,以及DualPipe、EPLB等代码库。

此次收官文章再次点燃了知乎对AI的讨论热情,相关问题下从业者云集。事实上,“发完论文,上知乎亲自答”,已成为人工智能研究者的风潮。2月20日,月之暗面开源MoBA框架研发人员鹿恩哲、苏剑林分别在知乎讲述了研发思路,引发了业界对“稀疏注意力”框架的讨论。与此同时,微软研究院、清华大学团队以及阶跃星辰开源模型参与者,均发文分享研究了各自成果与历程。这被业界称为继模型开源、论文开源之后的一次“思维链开源”。(张经)

阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 新疆举办春季招聘会

  • 浙江宁波志愿服务进乡村

独家策划

推荐阅读
有鉴于此,2025开年以来,各家安全公司严阵以待,纷纷探索新路径、新范式,以筑牢网络安全防线,为国产大模型保驾护航。
2025-03-03 09:02
伴随生成式AI大模型迭代升级,越来越多的AI创作工具入驻各大互联网平台,人工智能正融入内容创作生产的方方面面。
2025-03-03 08:59
想要真正让AI给网络内容生态带来积极影响,互联网平台、政府机构、媒体、公众必须加强协同,构建“法律—技术—伦理—行业”的四维治理框架。
2025-03-03 08:58
专家表示,对主带彗星311P进行探测,有助于了解小天体的物质组成、结构以及演化机制,填补太阳系小天体研究领域的空白。
2025-03-03 08:57
雷圣宾介绍,未来,这项技术有望在自旋电子器件、量子计算、光学器件、材料科学等领域实现超越传统碳材料的独特功能。
2025-03-03 08:52
在加快实现高水平科技自立自强、建设科技强国的新征途上,需要汇聚政府和社会多方力量,加快形成多元化投入机制,为基础研究注入更加丰沛的“源头活水”。
2025-03-03 08:51
27日,记者从广州大学获悉,该校与中国科学院、同济大学、美国宾夕法尼亚州立大学等高校科学家合作发现,位于火星北半球乌托邦平原南部的“祝融号”着陆区,其地下10—35米深处存在多层倾斜沉积结构。
2025-02-28 09:51
2月27日15时08分,长征二号丙运载火箭在酒泉卫星发射中心点火升空。
2025-02-28 09:50
北京大学常林研究团队与中国科学院空天信息创新研究院合作,成功开发出世界首款光子时钟芯片,可将芯片上的时间调控速度提升100倍。
2025-02-28 09:47
在宇宙中,有一类神秘天体——流浪行星
2025-02-28 09:46
从市场监管总局获悉,国际电工委员会近日正式发布由我国牵头制定的养老机器人国际标准。
2025-02-28 09:44
国际数据库事务处理性能委员会(TPC)近日宣布,阿里云PolarDB云原生数据库以远超原纪录的性能,登顶TPC—C基准测试排行榜,以每分钟20.55亿笔交易和单位成本0.8元人民币的成绩,刷新该榜单性能和性价比两项世界纪录。
2025-02-27 09:15
当物质处于地球上最低温度、最高压力等极端条件下,可能出现怎样的“超能力”?物态调控是物理学研究造福人类社会的重要途径,科学家对于物理世界极限的探寻从未停止。
2025-02-27 09:37
记者26日从中国科学院西北生态环境资源研究院获悉,该院敦煌戈壁荒漠研究站柳本立研究员团队以退役风机叶片为原料,成功研发出新型防沙材料,为循环利用退役风机叶片提供了新的解决方案。
2025-02-27 09:22
为学生量身定制学业规划、24小时解答疑难问题,为研究人员查找资料……“DeepSeek+高校”的智慧教学研究场景正在北京部分高校实现。AI浪潮已至,智慧校园是大势所趋,但AI与教育的融合仍有赖于师生素养提升、技术适应性及相关制度的建设完善。
2025-02-27 09:18
根据美国航天局最新测算结果,一颗编号为“2024 YR4”的小行星在2032年12月22日撞击地球的可能性已基本排除,撞击概率已降至0.004%。美航天局表示,小行星“2024 YR4”不再对地球构成重大威胁,它为天文学家提供了宝贵的机会来测试行星防御科研和预警流程。
2025-02-27 09:16
26日,全国规模最大、总投资最大、新能源占比最高的“沙戈荒”新能源外送基地电源项目——青海省柴达木格尔木东沙漠基地电源项目在青海格尔木开工。
2025-02-27 09:24
为加快补齐农村地区公共充换电设施短板,进一步释放新能源汽车消费潜力,财政部办公厅、工业和信息化部办公厅、交通运输部办公厅日前联合发布《关于开展2025年县域充换电设施补短板试点申报有关工作的通知》,明确2025年计划支持75个试点县改善充电基础设施。
2025-02-26 09:52
中国第四十次南极考察队利用我国自主研发设备,成功钻穿545米厚的冰层及冰岩夹层,获取了连续冰芯样品和基岩样品。拉斯曼丘陵地区位于伊丽莎白公主地冰盖末端,是东南极冰盖的溢流区之一。
2025-02-26 09:51
青藏高原高山特有物种是什么原因导致的?中国科学院青藏高原研究所生态系统功能与全球变化团队汪涛研究员联合瑞士巴塞尔大学、中国科学院西双版纳热带植物园和北京大学研究人员,
2025-02-26 04:20
加载更多