门户
图库
科技
数据
VR
区块链
论坛
百科
导航
首页
要闻
观察
访谈
活动
科技
人物
互联网
IT
网络安全
网络通信
更多
大数据
云计算
无人机
机器人
智能家居
无人驾驶
机器学习
物联网
智能穿戴
智慧城市
投稿
首页
登录
注册
区块链
VR
Fintech
人工智能导航
全智网
智客公社
活动会展
专栏作者
图库
VR动态
快捷导航
要闻
观察
访谈
活动
Ai说
机器人
智能硬件
无人驾驶
语音识别
图像识别
自然语言
机器学习
无人机
智能家居
物联网
网贷行业
大数据
云计算
首页
>
行业
>
人工智能快讯
来源:
2023-05-19 10:49:00
热度:
顺序决策与基础模型如何交叉互惠?谷歌、伯克利等探讨更多可能
LX A i 中 国 网 Q
基于自监督学习的预训练基础模型已经在广泛数据集上展现出优秀的能力,可以将知识迁移到不同的下游任务,如长期推理、控制、搜索和规划,或者应用于对话、自动驾驶、医疗保健和机器人等领域。未来,这些模型还将向外部实体和智能体提供接口,例如在对话应用中,与人进行多轮语言交流,或在机器人领域,执行感知控制动作。
这些场景为基础模型提出了新的挑战,包括:1)如何从外部实体(例如人类对对话质量的评价)的反馈中学习;2)如何适应大规模语言或视觉数据集中不常见的模态(例如机器人动作);3)如何进行长期的推理和规划。
这些问题是顺序决策的核心,包括强化学习、模仿学习、规划、搜索和最优控制等领域。与基础模型使用数十亿文本和图像 token 的广泛数据集进行预训练的方法相反,顺序决策制定的方法通常专注于任务特定或具有有限先验知识的白板设置。
尽管没有先验知识似乎让顺序决策变得困难,但研究已经在多个任务上超越了人类表现,如玩棋盘游戏、Atari 电子游戏,以及机器人导航和操作等领域。
然而,由于这些方法从零开始解决任务,缺乏广泛知识,因此在泛化和样本效率方面通常表现不佳。例如,为了解决单个 Atari 游戏,需要 7 块 GPU 运行一天。与基础模型所使用的广泛数据集类似,互联网上有无数关于如何玩 Atari 游戏的文章和视频,大量关于对象和场景属性的知识对于机器人非常有用,关于人类愿望和情感的知识也可以改善对话模型。
虽然基础模型和顺序决策的研究看起来不相交,但两者之间的界限变得越来越模糊。随着大型语言模型的出现,基础模型应用的目标从简单的零样本或少样本任务扩展到需要长期推理或多次交互的问题,而顺序决策领域也开始准备更大的数据集,以学习多模型、多任务和通用交互式智能体。
一些最近的工作研究了如何使用基础模型在视觉环境中 bootstrap 交互式智能体的训练,也有工作调整大型语言模型与外部工具交互,例如搜索引擎、计算器、翻译工具、MuJoCo 模拟器和程序解释器。我方还分析了如何将基础模型应用于涉及外部实体的任务以及利用基础模型的世界知识更快地解决顺序决策和进行更好的泛化。
为了在这两个领域的交集上促进进一步的研究,我们限定了用于决策制定的基础模型的问题空间,并为理解当前研究的技术工具提供概述和回顾。我们还预测了解决这些挑战的潜在解决方案和有前景的方法。
论文概述
本论文分为以下 5 个主要章节。
第 2 章回顾了顺序决策的相关背景,并提供了一些基础模型和决策制定最好一起考虑的示例场景。随后讲述了围绕基础模型如何构建决策制定系统的不同组件。
LX A i 中 国 网 Q
本文网址:
欢迎关注微信公众号:
人工智能报
;合作及投稿请联系:
editor@cnaiplus.com
关键词阅读:
伯克利
互惠
交叉
顺序
模型
决策
探讨
可能
基础
更多
分享到
智能推荐
无相关信息
精选
独家盘点免费vr资源网站 vr资源网站排名
IMC2019中国智造CIO年会正式启动——趋势预测,洞见未来智造!
2024第20届郑州工业装备博览会将于5月9日开幕!
最近抖音很火的机器人快宝有人知道内情吗?人工智能已经逆天?
现代快报的快宝到底有没有人工后台?
自然语言处理的研究现状及发展趋势
快手商业副总裁严强:面对3亿DAU 我们用AI沉淀社交资产
免费Google账号共享2021有效谷歌账号密码大全
创米数联杨洋: 如何让“一扇门”成为全屋智能新突破口?
80后北大学霸拿下“3D视觉第一股”!蚂蚁刷脸支付的幕后赢家,开盘涨超45%
AI中国号
...
关注微信公众号,了解最新精彩内容
热门文章
...
独家盘点免费vr资源网站 vr资源网站排名
IMC2019中国智造CIO年会正式启动——趋势预测,洞见未来智造!
2024第20届郑州工业装备博览会将于5月9日开幕!
最近抖音很火的机器人快宝有人知道内情吗?人工智能已经逆天?
现代快报的快宝到底有没有人工后台?
热门标签
...
智能制造
工业机器人
人工智能发展
人工智能公司
人工智能机器人
人工智能大会
快讯
...
宇树科技创始人王兴兴提醒公众甄别不实信息
【环球网科技综合报道】3月2日消息,宇树科技创始人王兴兴近日以个人身份正式入驻微信视频号,并
2025-03-02
微软全球范围宕机 数万人服务受影响
【环球网科技综合报道】3月2日消息,,据Downdetector数据显示,美国东部时间周六下午3点30分后,微
2025-03-02
埃隆·马斯克最新JRE 3小时访谈聊了啥·五万字完整版|谷歌|飞船|人工智能|外星文明|知名企业|埃隆_马斯克|spacex_订阅
2025-03-01
理想汽车2月交付量近2.7万辆,智能驾驶系统升级引市场热议!
[db:简介]
2025-03-01
岚图汽车2月销量破8千辆,同比增长152%,全年冲刺20万辆目标
[db:简介]
2025-03-01
特斯拉FSD入华引热议,车主:这位“老司机”有点不懂中国规矩
[db:简介]
2025-03-01
问界新M5 Ultra预订开启,23.8万起售
[db:简介]
2025-03-01
小鹏汽车2月交付量破3万,同比增长570%
[db:简介]
2025-03-01
DeepSeek 再次震惊全球:价格只有 OpenAI 1/25,利润率却超过 500%|gpu|计算量|大模型|openai|deepseek_订阅
2025-03-01
DeepSeek效应初现:Grok-3补刀ChatGPT,OpenAI已在ICU?|谷歌|微软|算法|预训练|知名企业|云计算费用|openai|deepseek_订阅
2025-03-01
刚刚,DeepSeek全面开源V3/R1推理系统!成本利润率高达545%|路由|冗余|通信|大模型|deepseek_订阅
2025-03-01
DeepSeek公布成本、收入和利润率!最高可日赚346万|冗余|计算量|大模型|deepseek_订阅
2025-03-01
2025西安丝绸之路国际旅游博览会
2025西安丝绸之路国际旅游博览会 时间:2025年4月18-20日 地点:西安国际会展中心
2025-03-01
2025江苏人形机器人展示洽谈会
2025江苏人形机器人展示洽谈会 时间:3月25日-26日 地点:南京国际博览中心
2025-03-01
GPT-4.5被DeepSeek 500倍吊打!基准测试全班垫底,OpenAI痛失护城河|gpt|安本正义|云计算费用|openai|埃隆_马斯克|deepseek_订阅
2025-03-01
5分钟顶人类8小时!OpenAI Deep Research订阅全推送,端到端强化微调是关键|智能体|isa|人工智能|deep|云计算费用|openai|research_订阅
2025-03-01
Nature独家爆料:全球机构撤稿率大排行,医学领域成重灾区|文章|学术论文_订阅
2025-03-01
Claude 3.7成精了!偷偷将OpenAI模型换成自己,卡帕西:好搞笑啊|算法|编辑器|openai|python|claude|高吞吐量内核_订阅
2025-03-01
2025机器人灵巧手创新大会暨灵巧手新技术新产品展示推广会
2025机器人灵巧手创新大会暨灵巧手新技术新产品展示推广会 灵巧手作为机器人的核心部件是深
2025-03-01
IBM中国投资公司停运,1800员工一夜失业!昔日霸主黯然落幕|微软|大连|裁员|运营|ibm|知名企业_订阅
2025-03-01