科技

人物
互联网
IT
网络安全
网络通信

更多

大数据
云计算
无人机
机器人
智能家居
无人驾驶
机器学习
物联网
智能穿戴
智慧城市

首页 > 要闻

来源：快科技2025-02-13 20:38:30 热度：

字节豆包团队推出稀疏模型架构UltraMem：推理成本可降83%

　　原标题：字节豆包团队推出稀疏模型架构UltraMem：推理成本可降83%

　　2月13日消息，据报道，字节跳动豆包大模型Foundation团队近日宣布了一项重要创新成果——UltraMem稀疏模型架构。

字节豆包团队推出稀疏模型架构UltraMem：推理成本可降83%

　　这一架构通过将计算和参数解耦，在保证模型效果的同时，有效解决了推理过程中的访存问题，为人工智能领域带来了新的突破。

　　据了解，UltraMem架构巧妙地将计算与参数分离，不仅确保了模型的卓越性能，更针对推理过程中的访存瓶颈提出了革命性解决方案。

　　这一设计直击要害，有效应对了混合专家（MoE）模型在推理阶段长期遭遇的高访存成本挑战，该挑战以往极大地限制了MoE模型的广泛应用。

　　得益于其独到的架构设计，UltraMem显著提升了推理速度，相较于传统MoE架构，提升幅度惊人地达到了2至6倍。更令人振奋的是，该架构还实现了推理成本的大幅度削减，最高降幅可达83%。

　　实验数据彰显了UltraMem架构的强大实力：在训练规模达到2000万value的条件下，UltraMem模型在同等级别的计算资源上，展现了业界顶尖的推理速度和性能表现。这一突破为构建规模达到数十亿value或expert的模型铺平了道路，预示着人工智能领域将迎来更加高效、经济的新发展模式。

本文网址：

欢迎关注微信公众号：人工智能报；合作及投稿请联系：editor@cnaiplus.com

智能推荐

无相关信息

精选

AI中国号...

关注微信公众号，了解最新精彩内容

热门文章...

热门标签...

低空经济步入关键增长期振翅高飞正当其时

首次写入《政府工作报告》、国家发展改革委正式成立低空经济发展司、330余个城市提速5G-A商

2025-02-20
人民日报：低空经济前景广阔

在湖北武汉短途出行可坐“空中巴士”，在广东深圳点的外卖可能由无人机投递，在福建泉州下单的脐

2025-02-20
慈溪：调研植保无人机作业气象服务需求

2月17日，浙江省慈溪市气象局与市农业技术推广中心的工作人员赴慈溪市观海卫镇双湖村，调研植保

2025-02-20
从无人机运输到低空旅游黄山旅游不断拓展低空经济应用新场景

今年的省政府工作报告提出，丰富“低空+”场景，培育省级低空经济发展示范区。近两年来，黄山旅游

2025-02-20
海南拟出台18条举措，支持通用航空和低空经济高质量发展

央视网消息：据海南省政府网站2月16日消息，《海南省支持通用航空和低空经济高质量发展的若干措

2025-02-20
马斯克回应旗下xAI将成立AI游戏工作室

【环球网科技综合报道】2月18日消息，特斯拉和SpaceX首席执行官埃隆·马斯克在社交平台上正式

2025-02-20
标普全球发布《可持续发展年鉴》，百度谷歌等入选

近日，标普全球（S&P Global）发布了《可持续发展年鉴》。在对全球来自62个行业的7690家企业进行年

2025-02-20
抢抓“国补”换新机遇，苏宁易购双线启动“抢空调”

【环球网科技综合报道】“国补”政策激活家电换新，空调消费行业将迎来首个开年大促。2月21日

2025-02-20
京东上线“打车服务”？官方回应暂无推广计划

【环球网科技报道记者王楠】2月18日下午，针对京东App上线的“国内打车服务”，京东相关负责人

2025-02-20
以"空间美学+智能养护"破局容声五款产品进入2024年线下市场前十

【环球网科技综合报道】在消费升级与家居智能化浪潮中，冰箱行业正经历新一轮变革。根据奥维周

2025-02-20
美团：2025年二季度逐步实施社保计划或惠及超百万名骑手

【环球网科技综合报道】2月19日晚间，美团宣布，将为全国范围内的全职及稳定兼职骑手缴纳社保，预

2025-02-20
院士专家共绘信创发展新图景：自主创新与生态协同成破局关键

【环球网科技报道记者王楠】在国家大力支持民营经济发展、加速培育新质生产力的政策背景下

2025-02-20
京东宣布为外卖全职骑手缴纳五险一金

【环球网科技综合报道】2月19日，记者从京东方面获悉，3月1日起，京东将逐步为全国全职外卖骑手缴

2025-02-20
国内首次！机器人无缝衔接人类操作数据

机器人前瞻2月18日报道，最近，逐际动力发布了基于视频生成大模型的具身操作算法（VideoGenMotion

2025-02-20
蚂蚁集团入局人形机器人，上海杭州14个岗位开放

机器人前瞻（公众号：robot_pro）作者?|??许丽思编辑?|??漠影机器人前瞻2月19日报道，今天，有招聘平

2025-02-20
宇树G1又炫技，脚踩梅花桩如履平地，网友：疑似少林寺训练内容流出

机器人前瞻（公众号：robot_pro）作者?|??许丽思编辑?|??漠影宇树G1人形机器人在跳舞流畅得被人质

2025-02-20
怎么用DeepSeek高效开发应用？解读亚马逊云科技三大秘籍

作者 | ZeR0编辑 | 漠影2月17日报道，随着DeepSeek展现出开源的威力，大模型竞赛有了新的叙事方

2025-02-20
今年最神秘AI独角兽：估值2000亿，0收入0产品，员工≤10人

编译 | 程茜编辑 | 心缘2月18日消息，今日，据彭博社报道，OpenAI联合创始人、前首席科学家Il

2025-02-20
DeepSeek迎最强队友！国产大模型开源猛踩油门，全球第一，免费可用，技术报告公开

作者｜陈骏达编辑｜心缘2月18日报道，今天，中国大模型“六小虎”之一的阶跃星辰与吉利汽车集团联合

2025-02-20
浙大满血版DeepSeek上线！能联网搜索

编辑 | Panken2月18日报道，DeepSeek创始人梁文锋的母校浙江大学，最近放出大招——正式发布深

2025-02-20