7月4日,2024年世界人工智能大会(以下简称WAIC)在上海浦东开幕。本次WAIC以“以工商促共享,以善治促善智”为主题,重点围绕核心技术、智能终端、应用赋能三大板块,聚焦大模型、算力、机器人、自动驾驶等领域。
南都记者现场获悉,今年有500余家企业参展,展览面积超5.2万m²,现场集中展示一批“人工智能+”创新应用最新成果,展品数量超1500项,其中包括上百款通用基础模型、行业模型及特定场景模型,以及大量AI智能助手、文生图、文生视频类产品以及AI办公、AI教育等产品涌现。值得关注的是,大会首日不仅普通观众排长队进场,还有不少企业组团参观,可见人工智能大模型在消费者端和企业端的应用热度之高。
智能助理、飞行器、人形机器人等“镇馆之宝”亮相
支付宝智能助理作为八大“镇馆之宝”在蚂蚁集团展区亮相。据介绍,“支付宝智能助理”是支付宝推出的一款全新的生活办事AI产品,可以为用户提供吃、喝、行、游、办事、买票、娱乐等数十种生活场景服务。
为了让智能助理的服务能力得到具象化展示,蚂蚁展区搭建了智能助理与咖啡机器人的联动。南都记者现场体验,只需简单对话,就能获得一杯热气腾腾的咖啡。同时,AI点单这一新功能,也已在支付宝App开启测试,首批支持星巴克、瑞幸、喜茶、霸王茶姬、蜜雪冰城等12个茶饮品牌的支付宝小程序。用户通过支付宝智能助理下达指令,比如“我想点一杯星巴克的中杯冰拿铁”,AI便会进入小程序自动下单,用户确认并付款后,就能到附近的线下门店取到咖啡。
南都记者马宁宁摄
入选镇馆之宝的另一款大模型应用产品是阿里云基于通义大模型推出的智能编码辅助工具“通义灵码”。据悉,通义灵码精通200多种编程语言,可以辅助写代码、读代码、查Bug、优化代码,是国内最受欢迎的辅助编程工具,其下载量超350万,每日辅助开发者生成代码超3000万次,已广泛应用于金融、制造、互联网、交通、汽车、能源等行业。
在智能飞行器展示区,御风未来、时的科技、峰飞航空科技,三家电动垂直起降航空器(eVTOL)头部企业亮相,产品创新核心是依托人工智能算法进行实时飞行决策与精准操控,可载货或载人进行低空飞行,将在城市立体交通、跨省/跨区物流和应急救援等典型场景中开展应用。三款产品共同入选为2024年世界人工智能大会的“镇馆之宝”。
智能飞行器展区的飞行器模型。(南都记者马宁宁摄)
智能飞行器展区的M1电动垂直起降飞行器模型
其中御风未来自主研发的M1电动垂直起降飞行器,是一种新型的电动化、智能化的载人低空飞行器,拥有高安全性、低成本、低噪声等优势。5座载人设计、可高效飞行250公里、巡航速度达到每小时200km,未来将主要用于解决城市内、城市间200公里左右的中短途空中出行需求,也被称为未来的“空中出租车”。M1已于2023年10月成功首飞,并在今年1月正式获得中国民航华东管理局适航审定受理。
峰飞航空位于“无人驾驶体验活动区”的盛世龙eVTOL载人航空器,纯电动力,可载5人 (1名安全员+4名乘客),最大航程250公里。
在展区一楼醒目位置设立的“十八金刚”专区,有18台人形机器人组成的阵列“迎宾”。这群人形机器人也是本次WAIC的“镇馆之宝”。
在2024世界人工智能大会上展出的人形机器人先锋阵列“十八金刚”。南都记者赵唯佳摄
其中,由复旦大学工程与应用技术研究院智能机器人研究院研发的“光华一号”人形机器人是“十八金刚”中唯一高校制造的人形机器人。从外观上看,“光华一号”在外形上与人类相近,身高165厘米,体重62公斤,全身拥有45个变传动比的混联智能关节和层次化生成式具身大脑模型,以最小自由能原理驱控关节、躯体和全身,能够自如地摆动手臂和直立行走。
据了解,为了实现“情感”功能,研发团队融合类脑启发的动因与多巴胺激励机制,采用多层次协调的激励算法,使得感知和行为更加拟人化和精细化,形成可控的多模态情感生成模式。“多巴胺和内啡肽是生物机制,我们在设计过程中学习融合了这一生物机制,形成一套AI算法逻辑,使得机器人能够具备类似于人的情感。”复旦大学工程与应用技术研究院副院长、智能机器人研究院院长甘中学解释道。
基座大模型加速升级,垂类模型百花齐放
大模型层面,智谱旗下基座大模型GLM-4和商汤科技旗下可控人物类视频生成大模型Vimi 均入选为2024WAIC的“镇馆之宝”。
今年以来大模型走向应用,但基础模型的升级迭代仍是头部大模型企业的攻坚方向。智谱于2024年1月推出新一代基座大模型GLM-4。从底层算法、预训练框架、国产硬件适配,智谱AI大模型全链路技术都由团队独立研发,安全自主可控。目前智谱AI 拥有完整对标OpenAI的模型产品,包括基座大模型、对话模型、多模态模型、代码模型等。
与此同时,基于特定行业和场景的垂直模型也呈现出百花齐放的态势。其中,Vimi人物视频生成大模型是由商汤科技打造的首个面向C端用户的可控人物视频生成大模型。基于商汤日日新大模型能力,它可以通过动作视频、动画、声音、文字等多种驱动元素来驱动人物类图片,从而生成和目标动作一致的人物类视频。除了可控性外,Vimi在生成人物稳定性、生成视频时长上,也突破了其它大模型AI视频生成的限制,可以稳定的生成分钟级的单镜头人物视频。
同时商汤还展出了“拟人对话大模型”、“农业种植大模型”等特定场景的垂直模型。其中“拟人对话大模型”支持个性化角色创建与定制、知识库构建、长对话记忆、多人群聊等功能,可实现行业领先的角色对话、人设及剧情推动能力,应用于情感陪伴、影视/动漫/网文IP角色、明星/网红/艺人AI分身、语言角色扮演游戏等拟人对话场景。
商汤拟人对话大模型↑、农业种植大模型↓。(南都记者马宁宁摄)
大模型落地教育场景,猿力科技、网易有道携全家桶亮相
与农业、工业领域相比,人工智能大模型在教育行业的落地更为成熟。7月4日,猿力科技携全国首个多场景应用的教育“全家桶”亮相世界人工智能大会。南都记者了解,猿力科技于今年5月通过大模型备案后,首次通过世界人工智能大会展示其自研大模型支撑的教育产品“全家桶”,包括飞象星球、猿编程、小猿学练机、海豚AI学等国内教育服务产品,及旗下两款AI教育出海产品CheckMath、LeapMath。
其中,小猿学练机本次展出了与大语文场景深度融合的“AI伴读大模型”与“AI百科大模型”,其中,“AI伴读大模型”可就阅读内容与学习者展开深度互动,实现主动阅读、主动思考,进而提升深度表达、理解和写作能力。
“飞象AI写作伙伴”利用大模型的自然语言生成能力,为学生提供作文辅导,通过多轮启发式的对话,帮助学生理解题目、发散思维,引导其逐步列出提纲并成文。该功能已随“飞象智能作业”产品在北京朝阳、平谷全区的100多所学校落地。
海豚AI学所展示的“AI答疑功能”与“超时空对话AI名人”在展会现场引发围观。AI答疑再升级,区分学练场景。学习环节新增视频AI答疑,利用多模态技术,学生可以与视频内容实时问答。
同样瞄准“AI+教育”赛道还有网易有道。基于教育大模型“子曰”,网易有道首次亮相AI大模型学习硬件有道词典笔X7,独家内置了国内首个教育大模型“子曰”的两款原生应用:AI全科家庭教师有道小P、虚拟人口语私教Hi Echo。其中,Hi Echo是网易有道推出的全球首个虚拟人口语私教应用,提供随时随地的一对一口语练习,日前应用规模已达百万级别。7月初,专为小朋友量身定制的有道Hi Echo儿童模式也即将上线。
特斯拉二代人形机器人模型、联想透明屏笔记本概念机亮相
世界人工智能大会首日,网易发布首个机器人品牌“灵动”。据介绍,网易灵动是网易伏羲基于自研工业大模型和AOP技术思想打造的机器人品牌,旗下的挖掘机器人和装载机器人两款核心产品,已参与10多个省份的50个重点建设项目,覆盖矿山、港口、搅拌站、学校等多种应用场景。
参展的观众不仅可以像打游戏一样通过操作飞控手柄、AR眼镜控制现场的微型挖掘机,还可以实时连线施工现场,远程遥控几百公里之外杭州桐庐矿山场景的挖掘机器人工作。
世界人工智能大会不仅有成熟的科技企业,还有积极探索未来技术可能性的新生力量。第一次参展的Noetix Robotics是一家专注于人形机器人研发与制造的初创科技公司,于2023年9月在北京成立。这次他们带着人形机器人Dora产品亮相世界人工智能大会,行走于展馆间。据展台工作人员介绍,人形机器人Dora是国内首款轻量化、产品化的通用型人形机器人,适用于科研教育、展览展示、服务陪伴等场景。
Noetix Robotics新发布的人形机器人Dora产品。南都记者赵唯佳摄
备受关注的特斯拉的Optimus二代人形机器人模型在世界人工智能大会亮相。据工作人员介绍,和上一代Optimus相比,二代Optimus的行走速度快了30%,重量轻了10公斤。
为吸引观众,特斯拉在现场举行Optimus二代人形机器人社交平台打卡兑换礼品活动。南都记者赵唯佳摄
据介绍,特斯拉预计将于2025年开始限量生产Optimus人形机器人,届时将有超过1000个Optimus人形机器人在特斯拉北美工厂帮助人类完成生产任务。下一步,特斯拉的目标是将其成本控制在1万美元左右,对外售价预计2万美元。
此外,联想在现场展出了全球首款17.3英寸Micro-LED透明屏笔记本概念机——ThinkBook透明屏笔记本电脑,包含无边框的屏幕、透明的键盘区域杭州股票配资平台,以及悬浮感的底座设计。这款具有未来感的产品还将利用AIGC技术,将AI与透明显示技术相结合,开启全新交互体验。