作者|黄楠
编辑|袁斯来
12月9日,在香港科学园2025商汤科技AI论坛上,商汤正式发布旗舰平台“商汤方舟”全面升级路径。
当前,视觉AI已成为智慧城市与产业智能化升级的核心驱动力。然而,传统视觉 AI 的算法生产方式高度依赖专业算法专家,普遍面临研发周期长、成本高、上手门槛高的三大痛点。随着长尾场景不断涌现,传统算法模式难以满足规模化应用的需求。
商汤科技董事长兼CEO徐立博士表示,“过去十年,是人工智能认知变化最快的十年, 我们正在经历可能是史上最大的技术浪潮。AI从感知到生成、从云端到端侧,再到现在的具身智能与世界模型,正重塑每一个行业的工作方式。”
商汤科技董事长兼CEO徐立博士
商汤科技智慧城市与商业事业群高级总监朴元奎也指出,大模型时代的到来正在加速行业范式重构。算法设计不再只依赖专家,而是向现场工程师开放,模型应用也从“定制开发”转向“智能生产”。行业迫切需要一种全新的视觉AI生产模式,推动模型能力更快适配业务、更高效部署落地。
为此,商汤推出视觉AI 2.0“商汤方舟”升级版,并围绕 “通专融合”与“智训闭环”两大体系,构建了新一代视觉算法生产模式。
在“通专”模型编排层面,方舟通过轻量小模型与通用大模型的多级协同,实现长尾视觉任务的渐进式推理,既保障识别精度,又显著降低算力消耗;在“智训”体系方面,方舟以Agentic Training为核心,围绕数据智能构建、模型训练、评估与部署形成全流程闭环,使视觉模型生产从图像采集到业务决策实现端到端自动化,让一线工程师也能快速构建可用的视觉模型。
商汤科技新一代视觉算法生产模式
同时,方舟平台正打造“感知—决策—行为”一体化的视觉智能体平台,将数字世界的视觉理解与物理世界的具身行动打通,支持无人机、机器狗、无人车等异构终端协同感知与决策,推动巡检与巡逻场景迈向空地一体化智能。
基于多模态大模型能力,商汤方舟SenseFoundry能够高效调度多类视觉模型,构建贯穿场景感知、数据处理与智能决策的闭环工作流。其核心优势在于突破传统视觉AI的能力边界,不仅“看得见”,更能“读得懂、会思考、能决策”,推动城市治理从“被动回应”向“主动预判”转变。
这一技术突破也加速了产业智能化进程。以政务领域为例,商汤科技基于AIGC技术和传统计算机视觉技术,打造“昆明人工智能赋能中心建设运营一体化项目”,致力于构建一个全方位、多层次的城市级人工智能服务体系,涵盖人工智能基础设施服务、人工智能基础共性应用支撑服务及典型智能化应用服务场景。
除内地核心市场外,商汤方舟的技术能力与平台体系也在港澳及海外市场持续拓展。
其中在港澳市场,随着香港智慧城市建设提速,城市治理场景对视觉AI提出了更系统化的需求。商汤科技香港及澳门业务总经理冯愈表示,方舟全新的平台化、模型化、智能体化体系,满足港澳市场“从分析到洞察、从洞察到决策”的需求。
目前,商汤方舟已在城市安全、交通、制造、无人机巡逻、具身智能等多个关键场景形成规模化应用,服务覆盖海内外近200个城市。
活动现场,在《从能力涌现到价值闭环,多模态大模型价值与创新之路》主题演讲中,商汤科技联合创始人、首席科学家林达华教授指出,经过三年“烈火烹油”式的发展,“我们再次走到了关键十字路口”,接下来行业发展有两条重要路径:一是AI需要真正落地应用,以价值驱动技术和应用的发展;二是需要回归实验室,探索下一次技术范式的原始创新。
林达华教授在主题演讲中分享多模态大模型价值与创新之路
为此,商汤通过底层创新,包括原生多模态融合架构NEO、跨视角预测训练范式,以及高效率推理系统SekoTalk,可以有效提升模型的空间认知与实时交互能力,推动大模型从“AI for X”向“AI in X”深化,实现智能体与场景的死循环融合。
随着人工智能迈入“大模型时代”,具身智能与世界模型正成为驱动产业变革的关键技术方向。王晓刚博士在论坛上宣布,大晓机器人将于12月18日正式亮相,发布多项全球领先的技术与产品矩阵,并将推出首个国内开源且实现商业应用的“开悟”世界模型3.0;与生态伙伴共同构建“模型—硬件—场景”一体化产业生态,推进具身智能产业进步。
圆桌论坛:从“数字世界”到“物理世界”:具身世界模型如何重塑人机交互
具身智能正逐步跨越从“数字世界”到“物理世界”的鸿沟。大晓机器人将为机器人装上聪明的“大脑”,让它们从“被动执行”转向“自主探索”;更要将前沿的智能,转化为可靠的产品,融入每一个具体的生活场景。