【行业跟踪】AI端侧深度报告之AI手机受益端侧智能体落地，驱动人机交互新范式-财富在线科技

摘要：随着AI手机出货量增长，我们预计AI手机初期仍然聚焦在高端手机，因此高端手机及其供应链企业将显著受益。

核心观点：

智能手机将迎来AI赋能的重大创新，我们从AI手机对用户的价值、AI手机发展阶段、AI手机的工作负载分配方式以及对手机产业链重构四个维度分析，认为搭载以语音交互为核心的智能体将是下一阶段AI手机的典型特征，有望带动差异化的用户体验与品牌价值，并驱动用户持续的换机动力。我们认为这一趋势有望带动以果链企业为主的电子行业标的投资机遇。

行业格局：

AI手机的发展将呈三阶段，目前处于从AI功能化向AI原生化的中途。第一阶段是AIAPP阶段。特征为各类大模型做成APP产品，搭载在手机上，典型如文心一言APP、豆包APP等；第二阶段为AI功能化阶段。特征为大模型初步融入手机应用，实现以手机预装应用为主的调用，典型如GalaxyS24、OPPOFindX7等，可实现如照片编辑、通话翻译、文档总结等功能；第三阶段为AI原生化阶段。以语音交互的智能体将成下一阶段AI手机的交互中枢，多元的、自然的交互体验成为主流，AI智能体成为链接数字生态的入口。

N端云结合、多模态是AI手机功能实现的关键。端云结合可解决手机端算力、功耗不足的特性，并且具有成本、能耗、性能、隐私和个性化五大优势。端侧AI可学习手机上用户的使用习惯和数据沉淀，结合用户社交媒体、电子邮件、消息、日历等数据，端侧AI将能更懂用户，并根据用户实际情况提供更有针对性的服务。同时，端侧AI能够设置防护栏，以防止“AI幻觉”等风险。大模型的多模态趋势将是实现AI智能体愿景的关键，可提升各应用场景下语音交互的效率、可制作图片/短视频等促进内容生态繁荣、可通过不同类型的数据迭代AI手机性能。

一、AI手机指端侧搭载大模型的手机，向着AI原生方向进发

手机是端侧AI落地的最有力载体，30NPUTOPS算力或成基础门槛为什么我们要关注大模型落地智能手机？根据Canalys，智能手机的如下特征适合大模型落地：智能手机拥有庞大的装机量：把AI应用集成到智能手机端侧将有助于触及更广泛的受众。到2023年，全球智能手机的总装机量将达到50亿部，远远超过笔记本电脑加上台式机的14亿台装机量。并且对于发展中市场和年轻一代而言，这一数量差距将会更加显著。因为这部分群体大多已经跳过了个人电脑时代，更多使用移动原生应用进行内容消费和社交媒体活动。

智能手机便携、使用场景多：口袋大小的尺寸能够使手机更适合各种日常用途，使用场景涵盖从通信到娱乐等多种需求。并且相比起在PC上更常用的生产力以及工作场景，手机相对日常的应用场景将会形成互补，从而帮助扩大AI在消费者数字生活中的影响力。智能手机应用生态系统强大，可加速第三方AI应用成熟：与其他IoT设备（例如智能手表）相比，智能手机的应用市场生态更完善、应用开发者数量更多。

强大的应用生态系统不仅有助于跨应用程序的无缝AI集成，也有利于通过茁壮发展的开发者社区创造多样化的第三方AI应用。AI手机定义：因大模型走向端侧的时日较短，产业界对AI手机的定义尚未统一，总体而言，都指向三个方面：①能够在手机上端侧运行大模型；②SoC中包含NPU算力；③满足一定性能的量化指标。

AI手机成热点，但其定义尚未完全清晰

资料来源：搜狐，中银证券

AI手机能提供差异化的用户价值与品牌价值AI手机的用户价值：是自在交互、智能随心、专属陪伴、安全可信的个人化助理。

1、自在交互：具有图文多模态的能力与全域知识智能机时代，人与手机交互获得的主要是信息；AI手机时代，人与手机交互可通过端侧的智能体获取知识和能力。用户价值体现为：能够获取此时正确的答案，整体交互更为自然、更加直接；

2、智能随心：即时意图理解和服务响应智能机时代，手机助手提供的主要是闲聊功能，无法做到精确解读自然语言并转化为指令；AI手机时代，手机助手可通过识别用户语言和习惯，并完成具体指令。用户价值体现为：可以通过简单操作/自然语言实现服务调度；

3、专属陪伴：个性化的模型微调和知识增强智能机时代，用户获取的主要是通用的、基于搜索匹配式的信息；AI手机时代，用户可以获取基于本地知识库的专属信息，可针对用户意图做有效调整。用户价值体现为：通过学习用户使用习惯、陪伴用户成长，可以越来越懂用户，提供的服务更加匹配用户需求；

4、安全可信：内容安全和隐私保护智能机时代，主要的风险在于隐私安全；AI手机时代，不仅需要关注隐私安全，还需要设法纠正大模型的一些天然缺陷，如伦理价值观对齐、幻觉消除等。用户价值体现在：个人隐私数据被妥善保护，回答贴切和信赖。

AI手机的用户价值

资料来源：OPPO、IDC《AI手机白皮书》，中银证券

二、AI手机的下一个阶段：端侧智能体是主要特征，从AI功能走向AI原生以语音交互的智能体将成下一阶段AI手机的交互中枢

随着越来越多的手机厂商开始贯彻以用户为中心的OS设计理念，智能手机可以根据用户的使用场景自动生成个性化的界面设计，包括自动调整图标布局、颜色主题和字体大小等。基于AI智能体多元的、自然的交互体验将成重要特征。随着生成式AI手机的进化，以及生成式AI应用生态的繁荣，越来越多的功能和服务将被接入AI智能体。在此基础上，AI智能体将革新智能手机的交互体验，即从传统GUI（GraphicalUserInterface）发展成VUI（VoiceUserInterface），最终升级为全新Agent（App-less）UI，这将意味着用户与手机的交互将发生在AI智能体和用户之间，弱化APP的存在感。

AI智能体将成为生成式AI手机交互的中心

资料来源：Counterpoint，联发科《生成式AI手机白皮书》，中银证券

我们预计，AI智能体会逐渐成为链接数字生态的入口，用户只需要输入想要获得的服务（通过语音、文字等形式），AI智能体会直接跳转到服务页面，同时AI智能体基于对用户习惯的了解以及当前使用场景，以更加安全和个性化的方式为用户提供数据，或是由AI智能体直接完成用户所需要的服务。这是传统APP访问模式所不能做到的。但这一演进不会一蹴而就，我们预计很长一段时间内，AI智能体与APP会同时活跃在生成式AI手机里。此外，头部APP亦可能围绕自己的业务生态打造专用AI智能体，多智能体共存或将成为常态。

Brain.ai推出App-less智能手机

数据来源：深思圈，中银证券

下一代基于AI智能体的App-less手机初现。Brain.ai在巴塞罗那MWC展示了App-less交互模式的概念手机，认为“提供App-less的界面，可以根据上下文预测并生成下一个界面，并与你的想法同步”。其目标是打通所有App厂商，替代App-Store。公司推出了名为Natural的产品，把各类App功能统一到一个全新的AI交互界面，以AI的形式调用所有的生活服务，到2023年已打通超过3000个主流App。当前是探索AI2.0操作系统的关键时期，很多厂商都在积极布局这一赛道，如魅族宣布放弃传统路线，全力投入AI时代操作系统。在高强度的探索热潮下，或将加速诞生一个真正意义上的超级APP雏形，实现AI手机的大多数功能。手机自动执行如何实现？

UI类大模型或将是关键将多模态能力用于UI界面，有望通过理解UI，来执行智能体的指令手机UI，即用户界面（UserInterface），是手机应用程序与用户进行交互的视觉和操作型层面。它涵盖了应用程序的布局、图标、颜色、字体、动画效果以及用户与应用程序交互的方式等多个方面。一个优秀的手机UI设计能够提供良好的用户体验，使得用户能够轻松、直观地使用应用程序。

苹果发布UI类大模型，意图通过理解UI来执行跨APP任务苹果的FerretUI大模型是建立在Ferret多模态模型之上。相较其他多模态模型，Ferret模型的主要长项是对于图像具体区域和定位点的认知，远远强于其他多模态模型。苹果设计了图像编码器、空间感知的视觉采样器和语言模型的架构，可以分辨出“来自区域的形状”（比如点、线和边框），用户可基于画面中具体的区域与大模型展开更深入的对话。

Ferret-UI模型的典型用

资料来源：腾讯科技，中银证券

FerretUI大模型透露出苹果意图在操作系统层学习用户使用习惯、并有望替代用户执行操作。FerretUI将Ferret模型强大的图片区域识别与定位能力，应用于手机UI上，经过苹果的优化后，可以更好的识别手机应用的界面，并将自然语言翻译为界面的操作点。简单表述，当用户与AI智能体聊关于手机界面的信息时，手机能够理解用户的意思，并找到具体的元素。

基于如上功能，FerretUI建立了对于手机应用的功能、操作等相对完整的理解，而且是GPT4级别的理解。FerretUI能够执行的任务包括，根据UI与用户感知进行交互对话，比如告诉用户相应位置具体的UI内容是什么、如何去和该UI交互、根据UI元素推断这个软件功能的推理等。

再进一步，基于上述对UI的理解，配合端侧智能体的任务规划和分配能力，AI手机具备了可实现如下重大跨越的潜力：基于用户自然语言下达的指令，AI手机理解用户意图，将该意图拆分为具体工作流，然后从UI层面模拟用户操作以执行指令。最终实现跨APP的操作与复杂任务执行。那么一个AI原生的手机操作系统的主要架构就完成了。

举例来说，当用户以自然语言向AI手机输入指令“帮我买一张明天下午2点去北京的靠窗的火车票”，手机智能体先接受语音、做语义分析和意图理解，然后进行任务拆分，拆分为：打开12306App、选择搜索车票、选择地址“北京”、选择“明天下午2点”、选择“靠窗”、选择“乘客姓名”、点击“购买”；并通过UI类模型，解读APP上不同的UI界面，并模拟用户点击操作，实现整个流程。对于用户而言，节省大量的自己操作，提升手机应用的便利性。

谷歌亦发布名为ScreenAI的大模型，可实现FerretUI模型类似的功能另一个操作系统巨头为安卓的母公司谷歌，其也发布了类似的、名为ScreenAI大模型。与FerretUI一样，也是针对UI理解的多模态模型。ScreenAI的大模型相对简单，基于Pali，包括一个视觉变换器（ViT）用来理解UI视觉，一个T5图文编码器，用于对应用户提问的文字和图像信息。

谷歌的操作和苹果类似，将UI界面分割为5*7的小块去识别细节，并利用UI的训练集加强模型对UI元素的认知。ScreenAI仅有不到5B，在相关任务的能力超过了谷歌的GeminiUltra模型。我们认为，UI类大模型作为连接用户意图与程序实现的重要媒介，有望成为AI手机执行用户跨App的指令的重要手段。

可直接操作手机的智能体已初现苗头腾讯公司发布了一个创新的开源项目：AppAgent，这是一个多模态智能代理框架，旨在赋予AI智能体自主操作智能手机应用程序并执行任务的能力。AppAgent可通过模拟人类的点击、滑动等交互行为，与应用程序进行操作，无需系统后端访问，从而增强了跨应用的通用性。

AppAgent的智能体核心功能包括：1)自主探索学习：智能体可以独立地探索应用程序，无需外部指导。2)观察人类演示学习：智能体通过观察用户的操作演示来学习任务执行。3)知识库构建：智能体通过上述学习过程积累经验，构建知识库，用于跨应用执行复杂任务

AI智能体将成为生成式AI手机交互的中心

资料来源：Counterpoint，联发科《生成式AI手机白皮书》，中银证券

综合而言，我们认为下一个阶段的AI手机将具备如下能力：端侧智能体理解用户意图并做任务规划，UI类大模型用作执行工具，可较好的完成用户指令的任务。这些新型功能将有效提升用户使用体验。

三、端云结合、多模态是手机GENAI功能实现的关键

端云混合架构可实现更好的泛化智能，解决手机端算力/功耗的限制。大模型完全运行于手机端侧面临很多难解的现实问题，端云结合是解决方案大模型“上端”面临手机算力、电池容量的现实问题：客观要求大模型的算力要求不能太高、功耗不能太高、对内存的占用不能太大。除手机硬件性能限制外，高频使用下，成本将成重要考量。根据vivo副总裁周围的测算，纯云端大模型一次对话成本为1.2分到1.5分人民币。以单次1.5分计算，假设手机厂商有两亿用户，一天用十次，一年成本为110亿元。而这些计算需求如果放到端侧来执行，仅需要支付最初购买手机的硬件费用。

云端提供的主要是更强的算力所赋予的更强的泛化智能理解能力考虑到手机的成本、性能、功耗等要求，结合目前大模型的能力，我们认为未来AI手机的大模型配置将是端+云结合的方案，预计端侧模型参数量为100亿左右，兼顾本地化运行的算力限制，做本地化快速响应；云侧大模型参数量为千亿级别，做深度用户意图理解与复杂指令拆分。根据vivo副总裁周围接受腾讯科技采访时表示，一般大模型涌现智能的基础门槛在500亿参数左右，手机端侧运行的模型在智能涌现方面效果仍有待提升，尚不能承担帮助用户做深度意图理解与任务拆分的职责，需要云端大模型协作。

以vivo的蓝心大模型矩阵为例：

手机端侧有三类模型：第一类是10亿级模型，响应速度在20毫秒到100毫秒，应用场景类似于文档的归纳总结，但这类模型的理解能力不足；第二类70亿级模型，有较好的任务理解能力，适合语言理解和文本创造方面的任务，且手机的算力和内存能够比较好的支持；第三类130亿参数左右的模型，在端侧运行的效果会更好，但是对手机硬件的要求更高。

云端应有两类模型：一类是700亿参数的大模型，综合成本和智能涌现能力考虑，这是蓝心大模型的云端主力模型，适用于角色扮演、知识问答、自然对话等任务；另一类是1300/1750亿参数的大模型，用于处理比较复杂的场景和任务，如复杂逻辑推理、任务编排等。

vivo的大模型矩阵

资料来源：环球网、vivo、中银证券

注：上图为vivo的蓝心五大模型，其中1B、7B为端侧应用；70B、130B、175B为云侧应用

四、结论：总量增长、高端化升级、核心零部件迭代。

IDC关于全球AI手机销量预测IDC关于中国AI手机销量预测

数据来源：OPPO，IDC，中银证券

综上，总量增长：AI手机出货量将取得大幅增长。根据IDC数据，全球方面，预计2024年新一代AI手机的出货量将达到1.7亿部，约占整体智能手机出货量的15%。中国方面，预计2024年新一代AI手机出货量将达到4000万部，约占中国智能手机出货量的13.2%；预计2027年将达到1.5亿台，占中国手机市场的比例约51.9%。高端化先行：根据IDC定义，需高于30NPUTOPS算力才算AI手机，截至2024年2月符合要求的仅有少数几款旗舰手机芯片。随着AI手机出货量增长，我们预计AI手机初期仍然聚焦在高端手机，因此高端手机及其供应链企业将显著受益。零部件升级迭代：如前分析，我们预计SoC为AI手机最主要的硬件升级，为配套SoC变化，存储、散热等零部件亦会同步升级。

看好苹果产业链：高端手机助力、低预期、产品化能力强因为苹果在高端手机份额占比高，因此我们预计苹果产业链将会率先在业绩端有体现。同时部分果链标的目前估值都处于近3~5年低点，有望受益AI手机的趋势得到估值提升。虽然目前苹果的大模型进度较慢，但是我们看好苹果将大模型技术落地的产品化能力，看好苹果未来推出AI手机推动用户换机。

资料来源：东方财富Choice金融终端、中银证券《AI手机受益端侧智能体落地，驱动人机交互新范式》2024/06/07；德讯证顾整理时间：2024/09/09。

风险提示：AI手机产品化落地速度不及预期。AI智能体发展速度超出预期。第三方应用生态配套进度慢。宏观经济风险。

研究承诺

本报告所采用的数据均来自合法合规渠道，通过合理判断得出结论，独立、客观地出具本报告。承诺遵守国家法律、法规及证券监管机构、行业自律组织的各项规章制度，恪守独立诚信、谨慎客观、勤勉尽职、公正公平的原则，为投资者提供专业服务。

投资评级说明

评级标准

概念标的：相对强于市场基准指数收益率5％～15％之间；

中性：相对于市场基准指数收益率介于-5％～+5％之间；

回避：相对弱于市场基准指数收益率5％以上。

文章内容仅供参考，不构成投资建议！（23）