Agenda
- AI Agent定义、开发过程中的壁垒、需要进行风险管理的方面
- 从0到1开发AI Agent的投入规模、成本结构
- 多代理协作系统组合的发展潜力、开发难度
- AI Agent目前的应用探索方向、现阶段在不同场景的能力和实用价值
- 国内外开发AI Agent活跃的公司
Questions
1.
首先请您简单介绍一下 AI Agent 的定义跟实现的方式是怎么样的?
2.
在 AI Agent 开发过程中,整个实现的难点跟技术壁垒主要在于什么方面?
3.
AI自动化操作过程中会设定操作优先级和一定的权限。用您前面定义来理解的话,AI Agent会被授予这样部分的权限跟能力,会有一定程度上的风险。目前行业内如何管理相应的风险?实际落地上哪一块比较容易出问题?现阶段有没有一些方式来规避它?
4.
一个最基础的AI Agent从0到1开发的成本结构跟投入规模是怎样的呢?您可以量化来估算一下吗?
5.
您刚提到的这几个都是一些大规模预训练模型,现阶段像OpenAI的这种产品,也可以理解成是某种程度在走AI Agent的方向吗?还是说它已经是一种AI Agent?
6.
9月以来,ChatGPT有多次更新比较受到市场关注,一个是9月底的GPT-4V(ision)的更新,一个是针对付费用户给到All Tools的更新,近期开发者大会上又提出了关于GPTs或者接入JSON的更新点。这几块的升级和提升的方向您可以总体梳理一下吗?
7.
GPT-4V多模态的能力水平是怎样的?业界针对GPT-4V(ision)的升级跟测试结果是如何评价的?业内人士的使用反馈如何?还是会领先其他竞争对手比较多吗?还是说会有不一样的观点?
8.
有分析认为,GPT-4 All Tools目前整体处理能力已经非常接近AI Agent。从技术来讲,您刚提到它是朝着AI Agent的方向努力,但目前还不是。如果它未来想要去做一个这样的AI Agent,您认为它要从哪些方面提升才能实现?目前OpenAI没做AI Agent,您判断主要基于什么样的考量?
9.
目前内测用户这边,它的system prompt还不支持调用。没有接入的考量您判断是因为什么?后续会微调升级接入吗?
10.
您近期一直在机器人行业负责视觉算法,您判断它的发展逻辑和趋势和自动驾驶大模型是一致的吗?
11.
近期的中国汽车软件大会上,有些专家认为我们在自动驾驶领域的算力和数据量暂时都很难“卷”过特斯拉,那国内的玩家在这块的机会、发展的契机跟潜在方向有哪些?
12.
您认为现阶段的技术发展能力,哪些是制约发展到具身智能这个愿景的瓶颈或者难点?未来随着算力不断发展和成本降低的话,这一块会有比较好的市场表现或者比较快速的进展吗?
13.
从之前爆火的斯坦福的Generative Agents小镇开始,各类Agents试验和多代理协同技术一直比较受到市场的关注,您怎么看这块的发展潜力?会是未来AI技术再创新走向AGI的必经之路吗?
14.
多AI Agent未来会走向统一的生态吗?
15.
这一块目前发展的难点主要是在于算力,还是在于您刚讲到其他维度的难点?算力在这其中可以排在什么样的位置?
16.
在运作方式上的话,AI Agent会和之前的软件一样采用云边协同,云端部署和本地部署相互结合的方式吗?不同场景的需求跟差异有哪些?这块AI Agent可以等同于AI大模型应用这样来看吗?
17.
Agent目前应用探索的方向和具体场景有哪些?在哪些行业或者场景上,现在有一些初步的探索或者不错的应用呢?目前您认为行业内有已经实现的AI Agent吗?
18.
在整个AI Agent的能力不断变强的过程中,这些能力后续是会整合的吗?整合的成本跟难度有多高?
19.
目前国内外有哪些厂商在这块投入相对比较积极、比较多?您了解的各家情况可以点评一下。
20.
在机器人领域的AI Agent具体能够带来什么样的价值和功能?目前行业内探索的方向跟进展如何呢?
21.
您对于英伟达之前开发的AI代理Eureka还有Meta的Habitat 3.0模拟器怎么看?
22.
外界有一些分析认为,Eureka深耕运动控制,Meta更注重交互能力。您怎么判断这两家在大模型参与机器人训练的算法这个开发思路上面的差异跟技术方向的差异?
23.
机器人领域有一个莫拉维克悖论,一些对于人类来讲无意识的技能或者直觉,比如举一些非常轻的东西,或者在房间内走动,或者辨识一些物体的能力,对于机器人来讲非常难,这种越简单的事对于机器人越难。如果是采用这种大模型能力的话,会对这样一个情况有比较好的改善吗?
24.
现在大模型本身具有幻觉或者说推理层面的黑箱效应吗?这会不会导致整个机器人场景的落地上面会有一些不可控性?行业内的厂商如何规避这个问题?这块未来怎么看?
25.
关于这块话题,您觉得有哪些方面有些重点,或者您在行业内观察到一些趋势我们没有涵盖到,可以最后做一个补充或者总结吗?
获取高级内容阅读权限
请提交下列详细信息,以便获取最多5篇论坛访谈记录的阅读权限或申请免费试用一周权限。
The information, material and content contained in this transcript (“Content”) is for information purposes only and does not constitute advice of any type or a trade recommendation and should not form the basis of any investment decision.This transcript has been edited by Third Bridge for ease of reading. Third Bridge Group Limited and its affiliates (together “Third Bridge”) make no representation and accept no liability for the Contentor for any errors, omissions or inaccuracies in respect of it. The views of the specialist expressed in the Content are those of the specialist and they are not endorsed by, nor do they represent the opinion of, Third Bridge. Third Bridge reserves all copyright, intellectual and other property rights in the Content. Any modification, reformatting, copying, displaying, distributing, transmitting, publishing, licensing, creating derivative works from, transferring or selling any Content is strictly prohibited