6月14日消息,川张今日2024智源大会上,鹏李在尖峰对话环节,大海的切主持人智源研究院院长王仲远,杨植与对话嘉宾百川智能CEO王小川、模型智谱AI CEO张鹏、格战月之暗面CEO,开源智源学者杨植麟、川张面壁智能联合创始人、鹏李CEO李大海围绕着“通往AGI之路”进行了对谈。大海的切


话题一:是否相信大模型是AGI之路的基石?

王小川认为,用基石这个词是模型没有问题的。大模型会是格战逼近AGI,但是开源还不够。但大家还忽略了一点就是川张符号。我们到了AGI的时代,有足够的科学家进入到AGI,但目前公开看到的状态还不能够做到AGI。

张鹏表示,站在现在看到的角度来说,目前做人工智能的还是比较实用主义的。大模型还在很有效的推进这件事,但是否能够推到顶峰上去,现在还不能找到确切的答案。是基石之一。

杨植麟认为,大模型是第一性原理,通过不断提升模型规模,本质上是对数据的压缩,但确实可以产生智能。但也有挑战,有些数据并不会那么多,怎么去解决稀缺或者不存在的数据。大模型本身没有本质上的问题。

李大海表示,大模型肯定是通往AGI方向上能够走的最远的。我觉得大模型作为知识压缩,实在处理大脑系统一的工作,慢思考的系统二,做各种推理的还需要去探索。

话题二:到底什么是AGI?

杨植麟认为,我认为AGI的定义是重要的,但不一定现在就需要进行精确的量化定义。而是需要一些定性的感性的东西。最重要的作用是能够让社会或者所有人对接下来发生什么事情有个准备。如果能够知道AGI是什么,那就可以更好的去准备做这个事情。第二个是,短期内需要一定的量化,没有量化,就没办法衡量AGI开发的进度。

王小川认为,机器掌握语言是非常重大的变化。之前我们在谈AGI的时候是将其当成工具在看,这是AGI的第一个变化;

李大海认为,更愿意从经济学的角度来去定义AGI,如果我们去执行任何一个任务,它的边际成本都为零,这就是我们理想中的AGI了。这就是为什么说我认为大模型能够走得最远。

我相信未来门槛会越来越低,当成本基本接近于0的时候,AGI时代就来了。

张鹏认为,更愿意相信AGI是个符号,其内涵和外延是在不断变化的。早期定义AI的时候是进行图形测试,但现在已经过时了,但随着技术的演进,对于事情认知越来越多,同样的三个字母,其所所代表的含义,实际上是不断的在变化,它是个动态的过程。

对我们来说,AGI可以将其作为一个目标,我们会不断更新和迭代AGI的内涵和外延。

话题三:对Scaling Law还特别坚信吗,还会起作用吗?

杨植麟:没有本质的问题。重要的是怎么很高效的去Scale。Scaling Law会持续,但Scale方法会变化。

王小川认为,美国在这方面的投入程度远高于中国的,中国需要去寻找范式新的转化,不能只是跟随。

张鹏认为,到目前为止我们还没有看到Scaling Law失效的预兆,未来一段时间之内,它仍然会有效。当然这个所谓的会有效也是一个动态的概念,就在于是说它本身所包含的内涵,会不断的去演进。

追问张鹏:从追逐GPT4到我们要突破GPT4,再往GP5的这样的方向去发展。Scaling Law有出现边界的效应吗?

张鹏认为,想要实现GPT5要探索的可能性和技术还是很多的。

李大海认为,Scaling Law是非常重要的。但我们觉得Scaling Law确实是一个经验公式,是整个行业对于大模型这样复杂系统的观察以后的一个经验总结。这个经验总结会随着我们对于模型训练工作过程当中做的实验越来越多,认知越来越清晰,会有更加细的颗粒度的认知。

话题四:关于开源。

向李大海提问:关于开源社区的事情,如何看待斯坦福抄袭事件?

李大海提到,我们完全没想到我们的工作会以这种方式出圈,挺惶恐的。因为这是海外个别学生组成的小团队的个人行为,不代表斯坦福学校。这件事情让我们更加坚定的相信开源的力量。

其实像这样一个事件,它的发现也是靠开源社区的热心参与者发现的,并不是我们自己发现。

向王小川提问:百川想把大模型对外开源的考量是?

王小川表示,因为当时开源的话,我觉得是在市场是有这样的需求;另外就是模型是在快速进步的。我们当时开源,既有贡献又没有这样的一个降低我们竞争力的事情,就毅然做了这样的决定。

话题五:AI安全不断被讨论,当下是最急迫的问题吗?

王小川认为,安全有不同的内涵和外延。第一个是意识形态安全,要跟国家发展保持一致,这是底线,这个要做好。第二个安全是比较远的安全,比如模型是不是把人类毁了,内心来讲,不希望发生像核弹一样的,把这个人类文明给搞没了。但我觉得模型是否比人类更聪明,我觉得这是需要鼓励的事情。第三层安全是比较现实的,近期还不存在安全问题,当前还没碰到人类文明安全的边界。

杨植麟认为,AI安全是非常重要的,它可能不影响最急迫。

张鹏表示,我们我其实一直很注意AI安全方面的事情,之前还签署了AI安全的承诺书。我们如何来保证或者说如何来努力让这技术真正的帮助人类,帮助社会,帮助地球,而不是去为恶。

李大海认为,现在的安全主要聚焦到基础安全和内容安全方向上。

话题六:如何看待大模型价格战?

杨植麟认为,有三个方面,第一,算力投入投入到推理到了某个时间点之后,肯定会显著超过训练的算力;第二个节点是到达某个节点,推理成本显著低于获客成本;第三个,AI在某个时间点会超过人做的事情,可能会产生新的商业模式。这三个点是改变商业模式的重要趋势。

王小川表示,价格战对于中国发展大模型是特别好的事情。

张鹏表示,非常赞同王小川的观点,给用户带来最大的收益价值,用我们的技术极大的降低成本,让更多人享受收益。大模型就是基础设施,基础设施就是非常便宜,当大模型变成水电这样的基础能力时,是个非常好的态势。

但也要过度宣扬和关注这样的事情。

李大海表示,最近有个机构做过一个调研,发现全国10亿用户手机的端测的算力差不多相当于100万片H100,这非常夸张的数字。如果能够将这些手机的算力好好利用起来,很多应用就可以落地了。未来都需要端侧模型跟云侧模型好好的协同。

我觉得当前所谓的价格战,多多少少有一些营销的成分在,但是我相信未来一定会比现在还要便宜同时大家还有利润,这才是健康的方式。(御柳)

本文系网易科技报道,更多新闻资讯和深度解析,关注我们。