Apple正将Gemini压缩进iPhone:端侧AI的算力与隐私博弈
据多方报道,苹果公司正在与谷歌合作,尝试将Gemini大语言模型进行知识蒸馏,使其能够在手机本地运行。这个项目的目标是让语音助手具备真正的对话理解和任务执行能力,而不是目前这种只能处理简单指令的工具。如果成功,这将是手机人工智能能力的一次质变。
知识蒸馏是一种模型压缩技术,用一个大模型的输出来训练一个小模型。谷歌的Gemini最大版本拥有数万亿参数,直接在手机上运行完全不可能。但经过蒸馏后的小模型可以在保持大部分能力的同时,将参数量压缩到数十亿级别,这个规模可以放进手机芯片的神经处理单元中。压缩过程不可避免地会损失一些能力,关键是保留用户最常用的功能。
苹果选择与谷歌合作而非自研的原因很现实。苹果在2024年推出的人工智能功能表现平平,语音助手的改进远未达到用户预期。内部开发一个与主流大模型同级别的系统需要数年的研发时间和数十亿美元的算力投入,而苹果在生成式人工智能领域的人才储备明显落后于竞争对手。与谷歌合作可以在较短时间内获得可用的模型能力。
端侧运行的核心优势是隐私。如果模型完全在本地运行,用户的语音指令、对话内容和个人数据不需要发送到云端处理。这与苹果长期坚持的隐私品牌定位高度一致。但端侧模型的能力上限受限于手机的算力和内存,复杂任务仍然需要调用云端模型来完成。苹果需要在隐私保护和功能完整性之间做出取舍。
从技术实现来看,最大的挑战是在模型能力和设备资源之间找到平衡。当前手机芯片的神经处理单元算力和内存带宽对于运行一个数十亿参数的蒸馏模型来说是够用的,但要在响应速度和输出质量之间取得平衡并不容易。推理速度低于每秒二十个词元的话,用户体验会明显下降。
竞争格局也在逼迫苹果加速。谷歌的自有品牌手机已经内置了Gemini的端侧模型,三星的Galaxy人工智能功能使用了谷歌和自研模型的混合方案。如果手机厂商在2026年底之前不能提供有竞争力的端侧人工智能能力,可能会影响高端手机市场的份额争夺。消费者购买新手机时,人工智能功能正在成为越来越重要的决策因素。
苹果预计将在2026年秋季的发布会上公布语音助手的重大升级。如果蒸馏项目成功,这将是苹果首次在人工智能能力上与竞争对手达到同一水平线。但"够用"和"好用"之间的差距,可能还需要几个版本的迭代才能弥合。消费者对语音助手的期望已经被ChatGPT这类产品拉高了,达不到这个水平线的功能会被视为落后。