在全球科技创新的大潮中,人工智能(AI)正成为推动社会进步和产业升级的关键力量。
6月3日,澎湃新闻正式推出一线财经大调研直播——《超级公司》,首期走进国内一线人工智能企业商汤科技,深入上海漕河泾总部及临港智算中心(AIDC),探寻大模型的发展方向。商汤科技联合创始人杨帆在接受澎湃新闻专访时表示,目前的人工智能和十年前的AlphaGo,两者之前有点像人脑和猴脑,模型并不是突然变大,而是持续变大,技术的进步只是一个维度,关键是如何持续保持并成为真正应用,解决现实问题。
谈算力:技术突破的关键,推动AI应用深入的前提
商汤科技成立于2014年,2021年在香港上市,一直致力于多模态、多任务通用人工智能能力,包括感知智能、自然语言处理、决策智能、智能内容生成等关键技术领域,同时也对AI芯片、AI传感器及AI算力基础设施持续布局。商汤的新型人工智能基础设施——商汤AI大装置SenseCore,打通了算力、算法和平台,并在此基础上建立“商汤日日新SenseNova”大模型及研发体系。
杨帆表示,算力是推动AI技术进步的“心脏”,在上海临港建立智算中心(AIDC),正是商汤科技对这一理念的实践。
“这里每秒可处理高达9千万亿次的浮点运算,为AI研究和应用提供强大的动力。”杨帆指出,智算中心的建设不仅提升了商汤的研发能力,更为AI技术的未来发展奠定了坚实的基础。
他强调,强大的算力支持是实现AI技术突破的关键,也是推动AI应用深入各行各业的前提。
在人工智能、大模型爆发之前,商汤在2020年就开始进行AIDC的建设。对此,杨帆表示:“简单来说,今天所谓的大模型就是有了更多的参数,这个参数你可以理解为大脑里神经元的数量更多,这是它更智能的一个基础条件。从逻辑和原理上,今天的人工智能和10年前的AlphaGo人工智能,二者之间就有点像猴脑和人脑的关系。”
杨帆认为,大家今天看到的大模型达到人类大脑水平,是一个瞬间的爆点,但它从猴脑过渡到人脑的过程,模型并不是突然变大,而是在持续变大,“在商汤过去10年的发展历程中,我们一直能看到这个趋势,所以我们在更早的时候就相信,总有一天它会变成更大的数量级。为了更好的智能,就需要一个更大的基础设施资源。我们能够感受到它背后核心的驱动力,所以我们会比别人更早地去相信这件事情。”
杨帆也表示,当时在投建时有很多不同的声音,会有人担心将来AIDC会不会闲置、会不会造成浪费等,“实际上我们发现,事物的发展比我们当时想的还要快。”
在商汤临港AIDC的机房内,一排排的机柜阵列正在运行。
商汤科技大装置事业群智算中心总经理林海在接受澎湃新闻采访时表示,算力集群通过将多个芯片连接起来,形成一个大型资源池,类似于一个庞大的GPU(图形处理芯片)在工作。这种集群不仅包括传统的土地、楼宇和机电设施,还涵盖了IT层的服务器、网络,以及各种软件、算法和训练框架。
服务器中的芯片都是在完成各自不同的工作,以云平台的形式进行任务调度,目前以单一芯片的集群组建,下一步将向异构集群努力,让不同型号的芯片纳入到一个集群里,产生更大的算力。
据林海介绍,智算中心目前容纳了约4万张GPU芯片,峰值算力达到9400p。目前AIDC最大的国产化集群已经做到3200卡并行,“很多国产芯片的厂商,目前受限于产能还有供应链,我们在做一些小范围测试,出来的结果还是偏于乐观的”。
林海介绍,目前每个机柜可以放置4台8卡服务器,也就是32张GPU芯片。随着技术的发展,下一代机柜可能会容纳更多,预计可能会达到50张甚至60张GPU芯片,让单个机柜实现64卡甚至更高水平。
杨帆表示,AIDC除了最新的AI芯片技术,同时也采用创新架构设计,包括模块化的计算单元和灵活的网络连接,以适应不断变化的计算需求。此外,智算中心还结合了先进的散热和能效管理系统,确保算力的高效运行。
谈AI发展:从“定义屋子”到“拆掉屋子”
杨帆预测,大模型会在10年之内像手机一样必不可少,大模型会持续上升发展,但不会像过去两年一样有极度的爆发,更多的将取决于场景。
随着百度、阿里、腾讯、科大讯飞、字节跳动、月之暗面等发布大模型产品,大模型近期更是打起了“价格战”。
对此,杨帆表示各家厂商都是在尽可能多地去获取用户,“大家的一个共识是,两三年之后这一轮大模型应用的用户可能是今天的10倍、100倍。如果是这样,今天花多少钱去获客都是不亏的,这意味着你占据了先手。所以从这点上来讲,很多C端的应用和互联网早期有一定的类似性”。
杨帆表示,通用大模型的存在,可以让下游场景方节省更多的资源,“通用模型就像一个全科大学生,他已经具备了很好的通用能力,而每一个行业的场景大模型就像专科研究生,把一个大学生培养成专科研究生,所需要的额外投入已经少了非常多。”
对于人工智能的未来,杨帆表示:“现在我们真正能够实用化的人工智能,更多的是我们给它定义了一个屋子,它在这个屋子里去做探索,去做摸索。最新的一个技术方向就是拆掉这个屋子,把全世界都给它,让它在更大尺度的空间去探索。当然,探索需要的时间更长,需要的资源更多,但是探索所产生的可能性,很多人对它是非常期待的。”
谈AI落地:应解决现实问题,中国有优势
杨帆认为,在AI领域,中美之间既有竞争也有合作空间。他提倡通过国际合作和交流,推动技术进步和应用落地。更多的交流和碰撞能够带来更好的技术进步,人们应该更多去思考如何对企业、产业产生更直接有效的作用。
杨帆以商汤为例说到:“我们和一些欧洲国家交流时,中国的智能座舱、自动驾驶做得很好,他们更愿意用。当他们真的用起来时,这个过程中的技术迭代、数据汇聚等,就会自然而然的发生。”
他坦言,“更多的(大模型)热潮其实是来自媒体、投资圈的关注,90%甚至99%的人,可能都没有真正的日常地去使用体验或者感受到这样的技术,在未来两三年可能会从尝鲜变成生活的一部分。”
杨帆表示,技术的进步只是一个维度,更多的维度是怎么样去跟进、去保持,以及怎样让这些技术真正的成为应用,成为每一个场景中和每个人日常生活息息相关的东西,“技术的进步如果不能够解决现实问题,它就是炫技的‘屠龙之术’,没有意义”。而对中国而言,更有意义和更有价值的,就是应用落地的优势,以实用为本。
“未来中国的人工智能落地以及产业化,将会是很大的亮点。”杨帆称,中国对于新事物、新技术会有更强烈的憧憬和冲动,大家投入的心血、资源和力量也更加集中,“所以我还是充满信心,但是过程中肯定是有挑战的”。
杨帆表示,AI未来很大的价值不仅仅是现在讨论的消费者应用和产业提升,而是给基础科学带来提升,将会对人类产生巨大影响。
值得一提的是,近期随着OpenAI核心安全团队的解散与重组,AI安全问题再次受到关注。
杨帆认为,比起可解释性,更重要的是可观测性,也就是比起理解机理,更重要的是怎样给它的质量去评价打分、做测试,“就现在的手机一样,要去弄明白手机的机理是很难的,但是手机出厂要经过大量测试,你看得到测试报告,测试报告做得足够全、足够多,那你就可以踏实放心地去用”。
对于AGI(通用人工智能),杨帆表示一定会实现,但何时能够到来仍未可知。
杨帆表示,希望通过大装置、智算中心,给整个行业提供更加完善、更低成本、高效率低门槛的基础设施能力,“让更多的人真正进入人工智能的技术迭代和产品迭代生态中,这是未来10年最值得我期待的事情……无论是AI基础设施,还是大模型,从产业侧包括从商汤未来的定位来看,更有意义的改变是它能够让接触使用的门槛和成本越来越低,这样就会让更多人参与进来,才能产生更大的裂变的价值。”