原标题:打破虚拟壁垒,AI如何走进物理世界?


当人工智能不再局限于线上文字交互、虚拟运算,而是借助感知设备触达真实场景、主动完成决策与执行,一场全新的技术变革已然到来。


  //  

香港极视科技有限公司、图灵极视(深圳)科技有限公司创始人沈务耀博士深耕物理AI领域多年,在第六届覃塘区全面对接融入粤港澳大湾区建设暨产业发展招商大会上,他结合AI发展趋势与实地调研经历,解读了这项前沿技术的发展逻辑与落地场景。


(访谈视频)



沈务耀


图灵极视(深圳)科技有限公司一家面向真实物理世界的 Physical AI 平台公司,具备国际化视野、顶尖人才团队和较强的产品落地能力。公司由香港知名高校教授及博士团队联合创办,核心能力覆盖视频图像处理、计算机视觉、多模态感知、AI Agent 及视觉大模型等关键方向。围绕真实场景中的“视觉不可达”难题,图灵极视正构建以“多模态感知 + AI Agent + 云端平台”为核心的三位一体 Physical AI 平台,为康养、医疗、工业、机器人及更多复杂空间场景提供智能感知与风险理解能力。

团队核心成员来自香港中文大学、中国科学技术大学等高校,拥有国家级创业人才、长江学者、国家超算中心执行主任等顶级背景,并在《Nature》以第一作者发表论文,曾获得香港政府、香港中文大学、香港科学园科创基金计划支持。

公司技术路线以“非视觉世界模型”为核心,融合视觉AI与毫米波雷达点云,实现全天候、高可靠、隐私合规的物理感知。产品已应用于智慧康养、森林防护与应急救援(无人机察打一体系统)、工业安全(矿井、化工厂、电力巡检)、防务感知(边境监控、生命探测)等场景,曾与富士康、中国航发、深圳政府、意大利都灵大学、天津大学等机构合作,完成国家应急管理部、国家消防总局等国家重点科技计划。


1

AI 将走进物理世界


在沈务耀看来,下一个五年,AI全面进军物理世界是毋庸置疑的主流趋势,多模态感知与物理智能也将像曾经的互联网一样,彻底改变大众生活与产业运行模式。


邓璐:

当多模态感知能力、计算机视觉运用到智能生活、工业系统、智能制造、物流体系等基础设施的时候,它带来的最直观的改变在哪里?

沈务耀


我觉得最直观的改变,是系统不再只是“看到问题”,而是开始“理解问题、判断风险,并推动响应”。过去很多智能系统更多停留在识别层面,比如看到了人、看到了设备、看到了异常动作,但下一步该怎么处理、风险有多大、是否需要联动其他系统,往往还需要依赖人工判断。多模态感知和 Physical AI 的出现,正在推动 AI 从“识别工具”走向“场景能力”。


从技术上看,Physical AI 并不是简单把 AI 接到硬件上,而是让系统真正具备理解真实空间、感知复杂环境、识别风险状态和辅助决策执行的能力。也就是说,AI 的价值正从“会说、会写、会生成”,进一步走向“会感知、会判断、会响应、会协同”。这也是为什么越来越多行业开始把它看作下一代智能基础设施的重要方向。


更关键的是,真实物理世界和数字世界不一样。现实场景中的核心问题,不只是信息生成,而是安全、效率、协同和治理。无论是康养、医疗、工业、机器人,还是物流、车舱安全、低空无人系统,大家真正需要的都不是一个停留在屏幕里的 AI 工具,而是一个能够进入具体场景、理解空间关系、识别异常风险并形成闭环响应的系统。


这也意味着,传统以视觉为主的感知方式正在接近边界。摄像头和视觉模型当然重要,但在隐私敏感空间、恶劣环境、遮挡场景和复杂动态空间里,单一视觉方案往往不够。比如病房、卧室、厕所、养老机构、地下空间、夜间公共区域、烟尘环境、车舱等场景,对“可感知”和“可部署”都提出了更高要求。要让 AI 真正进入物理世界,就必须突破“只依赖看见”的限制,走向多模态、全天候、高可靠、可闭环的感知和理解体系。


我们公司现在重点布局的,正是这一方向。图灵极视围绕“真实物理世界中的视觉不可达问题”,构建“多模态感知 + AI Agent + 云端平台”的 Physical AI 能力体系。我们希望解决的,不只是“发生了什么”,而是进一步回答“风险在哪里、谁需要响应、系统应该如何联动”。从这个角度看,多模态感知带来的最直观改变,不只是感知能力更强了,而是 AI 开始真正走进现实场景,并具备参与执行和协同治理的能力。


2

城市公共管理率先迎来物理AI运用


谈及物理AI的产业增长点,沈务耀十分看好城市公共管理领域,目前相关技术已在多个安全治理场景实现落地应用,展现出极强的实用价值。



邓璐:

您觉得物理AI在哪一个产业和场景可以率先找到第二增长曲线?

沈务耀


如果从第二增长曲线来看,我认为会率先出现在城市公共安全和复杂环境治理相关场景。因为这些场景对全天候感知、隐私友好、高可靠运行和快速响应都有非常强的需求,而这恰恰是 Physical AI 最容易体现价值的地方。


比如我们已经在推进山林火灾防控和应急救援方向的项目。我们与天津大学等高校合作,参与国家消防总局、国家应急管理部相关重点科技计划,把 Physical AI 应用到森林防火与应急处置中。这里的关键,不只是“看见火点”,而是把实时感知、态势分析、风险研判和处置支持连接起来。系统可以结合飞行器采集的风速、飞行高度等环境数据,对火情进行持续监测,并辅助执行更精准的应急处置任务。


另外一个值得关注的方向,是城市环境异常感知。比如我们正在推进的街道气味异常检测项目。不同区域通常会形成相对稳定的环境气味特征,一旦出现危险品、违禁品或异常污染源,相关气体和气味信号就可能发生变化。通过引入多模态感知设备,城市安防和治理就不再只依赖视觉监控,而是可以结合更多维度的数据提升识别和预警能力。


从我们的角度看,这些场景之所以重要,不只是因为它们有项目机会,更因为它们验证了 Physical AI 的平台价值。图灵极视做的,不是单一视觉识别,也不是某一个孤立设备,而是一套围绕“视觉不可达问题”建立起来的能力体系,也就是“多模态感知(视觉、毫米波雷达点云)+ AI Agent + 云端平台”。它的核心,不只是发现异常,而是进一步理解风险、判断优先级、识别响应对象,并推动系统联动。


我们已经在康养场景完成了第一个较为典型的落地验证。康养之所以成为切入口,是因为这是一个真实需求高频存在、同时又受到隐私与人力成本双重约束的领域。过去传统照护高度依赖人工,纯视觉方案又往往受限于隐私和部署条件,而多模态感知和非视觉世界模型正好能够补上这块短板。对我们来说,康养是第一步,但不是终点。山林防火、城市治理、工业安全、机器人感知、车舱安全、低空无人系统等方向,都有机会成为下一阶段的增长曲线。


所以我觉得,Physical AI 的第二增长曲线,不会只出现在某一个单点行业,而会优先出现在那些“环境复杂、风险高、传统视觉方案不够、又迫切需要闭环治理”的场景里。谁能先在这些场景把能力跑通,谁就更有机会建立真正的平台型优势。


据了解,图灵极视自主研发的物理AI技术与无人机察打一体系统正逐步落地应用于山林火灾防控与应急救援领域,打造出集火情监测、态势研判、智能处置于一体的现代化森林防火解决方案。

依托多模态感知、AI 算法以及无人机装备,这套系统突破了传统防火模式的局限,不仅能够实时发现火情,还可结合风速、飞行高度等现场环境数据,自主规划飞行航线,指挥飞行器精准开展灭火作业。

同时,系统搭载的AI模型可预测火情未来1至72小时的蔓延趋势,构建起火点定位、态势分析、指挥调度、精准扑救的全链路火场管理体系,实现从被动预警到主动处置的转变。

(概念图)


3

Physical AI 如何赋能覃塘


覃塘坐拥超2100家木材加工企业,是国家级绿色家居产业集群,同时布局新材料科技园与化工产业集群,现代物流仓储产业也在加速崛起,丰富的产业场景为物理AI落地提供了优质土壤,沈务耀对双方合作前景充满信心。


邓璐:

覃塘拥有2100多家的木材企业,而且是国家级的绿色家居产业集群,同时它也拥有新材料科技园、化工产业集群,您刚刚所讲到的Physical AI、多模态感知,是否也可以运用在这方面?

沈务耀


我觉得非常有空间,而且这些产业场景和 Physical AI 的结合点其实很明确。像覃塘这样的产业结构,一头连接木材加工和绿色家居,一头连接新材料和化工园区,本身就非常适合多模态感知和智能执行能力的落地。


例如在化工园区,最直接的需求就是安全巡检、危险区域预警和应急联动。这类场景对人员安全要求高,而且很多区域并不适合单纯依赖摄像头。通过无人机巡检、多模态感知设备和 AI 风险分析能力结合,可以更早发现异常情况,也可以减少高风险环境下对人工巡检的依赖。


在木材产业链里,也有很多具体应用空间。比如原材料堆场管理、生产线安全监测、木材品质检测、厂区物流调度、夜间巡检等,这些都可以与计算机视觉、多模态感知和智能分析能力结合起来。尤其是在一些复杂、动态或者存在粉尘、遮挡等问题的环境里,单一视觉并不总是最优方案,多模态感知反而更有价值。


从区域协同来看,这里面也有很大的产业组织机会。香港在研发和国际合作上有优势,深圳在技术转化和制造配套上有优势,覃塘则有非常扎实的产业场景和应用基础。如果把研发、制造、场景落地和区域市场拓展打通,其实是有机会形成一条比较完整的产业协同链条的。


所以我的判断是,真正有价值的 AI,不只是能观察、分析、研判,更重要的是能够进入产业现场,解决安全、效率和协同问题。像覃塘这样有明确产业基础、有应用需求、也有升级空间的地区,我认为是非常值得布局和合作的。我们也期待未来能和当地企业、园区以及相关机构一起,把 Physical AI 在具体产业里的应用一步一步做深、做实。


新时代的AI技术不能只停留在 “看、写、思考” 层面,更要具备落地执行的能力。覃塘产业基础扎实、发展潜力巨大,期待双方携手推进物理AI与本土产业深度融合,为传统产业转型升级保驾护航。




覃塘区委宣传部指导 覃塘区融媒体中心出品 未经授权不得转载

来源:璐演微信公众号

编辑:黄芳芳

校对:吴晓菲 杨秋莲

审核:韦东保

投稿邮箱:qtnews202@163.com

爆料热线:0775-4861517

法律顾问:广西正大五星律师事务所  18978598787

版权归覃塘融媒及原作者所有,如需转载,请注明出处