苹果用设备端人工智能升级无障碍功能:Vision Pro已经能用眼神控制轮椅

苹果用设备端人工智能升级无障碍功能:Vision Pro已经能用眼神控制轮椅

苹果发布了今年的无障碍功能更新,核心思路是把自家人工智能平台的端侧处理能力深度注入到屏幕朗读、放大镜、语音控制等辅助功能当中。其中最引人注目的新功能是头戴式显示设备可以通过精准的眼球追踪技术来控制兼容型号的电动轮椅。

这个功能的底层技术原理并不复杂,苹果的头戴设备本身就已经配备了高精度的眼球追踪传感器,把眼球运动信号映射到轮椅的前进、转向和停止等控制指令上,在技术层面是水到渠成的事情。但对于行动受限的残障用户来说,意义完全不同。仅靠眼神方向的变换就能驱动轮椅移动,完全不需要手部的任何操作,这对上肢功能严重受限的人群来说是一个真正能够改变日常生活的功能,而不是科技发布会上的噱头。

另一个同样值得关注的更新是端侧语音识别引擎现在可以为没有字幕的视频内容实时生成文字说明。苹果表示旗下的手机、平板、笔记本电脑、电视盒子和头戴设备都能使用这个功能,设备本地的人工智能模型会实时分析视频中的语音内容并生成同步字幕。这实际上已经超越了无障碍功能的范畴,对所有在嘈杂环境或者不方便外放声音时观看视频内容的普通用户同样非常实用。

端侧本地处理是苹果区别于竞争对手的关键差异点。苹果反复强调这些人工智能功能全部在设备本地运行,不需要把任何用户数据传输到云端服务器。对于无障碍功能的使用者来说,隐私保护的重要性尤其突出,他们的健康状况数据和日常使用习惯比普通用户更加敏感。端侧处理意味着这些高度私密的信息永远不会离开用户自己的设备,也不会被用来训练模型或者定向投放广告。

苹果在无障碍功能研发上的持续投入一直是整个科技行业的标杆。谷歌和微软也各自推出了类似的辅助功能方案,但苹果的竞争优势在于软硬件一体化整合能力,从自研芯片到操作系统再到应用层面,苹果可以实现端到端的深度优化。这种整合能力是竞争对手短期内很难复制的。对整个人工智能行业来说,苹果的无障碍功能更新提供了一个有价值的产品思路启发:人工智能的价值不一定体现在通用对话或者内容生成上,在特定场景下精准解决一个具体的、真实存在的问题,可能比打造一个什么都能做但什么都做不精的通用助手更有意义。