首页 - 股票 - 研报 - 行业研究 - 正文

传媒GPT-4o:开启AI语音助手时代,关注与IOS系统和Windows系统的进展

来源:华福证券 作者:杨晓峰 2024-05-14 13:46:00
关注证券之星官方微博:
(以下内容从华福证券《传媒GPT-4o:开启AI语音助手时代,关注与IOS系统和Windows系统的进展》研报附件原文摘录)
投资要点:
一、GPT-4o模型基座:三种模态的混合模型,带来更大泛化能力
PT-4o是文本、视觉和音频的端到端训练的一个新模型,这意味着所有输入和输出都由同一个神经网络处理。对文本、音频和视觉三种模态统一进行混合训练,因而大部分数据都是通过无监督学习实现;相比过去拼接模型需要对视觉进行标注,混合模型在整体数据量规模上可以做得更大,进而带来更大的泛化能力。
二、GPT-4o奠定AI语音助手基础:低延迟+情绪感知+视觉感知
1、AI语音基础:接近于人类对话响应速度。GPT-4o可以在短短232毫秒内响应音频输入,平均为320毫秒,这类似于对话中的人工响应时间,没有表现出丝毫延迟的视觉和声音反馈。在GPT-4o之前,使用语音模式与ChatGPT交谈平均延迟为2.8秒(GPT-3.5)和5.4秒(GPT-4)。
2、情绪感知能力:情绪的感知是对语音一维输出模态的丰富。GPT-4o不仅能感受到你的情感,还自带情绪和情感,并且用户可以随时打断AI的话,互动更加拟人。
视觉感知能力:适配AI手机、AI电脑和AI智能硬件。手机端ChatGPT可以依靠手机摄像头和用户实时互动,如实时教人做题,观察房间、观察用户情绪;客户端ChatGPT能随时解决写代码、读图表等任务。
三、GPT-4o的进阶——控制中心:获得操作系统的权限,打造手机和PC的Agent
相比于网页端,手机端和桌面端可借助屏幕信息,实时跟踪用户动态需求。在获得权限背景下可以进行更多的控制。
AI手机:如果未来能获得手机操作系统权限,如iPhoneSiri权限,便可控制手机完成预置应用或第三方应用操作和控制。重点关注和iPhoneIOS18的合作进展。
AI电脑:发布ChatGPT桌面应用,尚不能下载,预计未来几周内广泛推出。重点关注后续和微软的Windows系统的合作。
四、未来的进度:GPT-4o面向免费用户,普及“AI语音交互”推广节奏:GPT-4o已向Plus用户推送模型,但展示的功能有待开放,后续关注免费用户推送。未来几周内,将在ChatGPTPlus中推出带有GPT-4o的语音模式新版本,同时向API中的一小群受信任的合作伙伴推出对GPT-4o新音频和视频功能的支持。
五、投资建议:
建议关注:1、AI语音助手硬件入口:AI手机、AIPC和AI智能音箱,小米、漫步者、国光电器;2、AI语音助手软件入口:腾讯控股;3、应用端:AI陪伴、AI陪聊、AI教育、AI游戏:汤姆猫、昆仑万维、世纪天鸿、宝通科技;4、多模态视频语料:华策影视、中广天择。
风险提示
AI发展不及预期、AI落地效果不及预期





微信
扫描二维码
关注
证券之星微信
APP下载
好投资评级:
好价格评级:
证券之星估值分析提示国光电器盈利能力一般,未来营收成长性一般。综合基本面各维度看,股价合理。 更多>>
下载证券之星
郑重声明:以上内容与证券之星立场无关。证券之星发布此内容的目的在于传播更多信息,证券之星对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至jubao@stockstar.com,我们将安排核实处理。
网站导航 | 公司简介 | 法律声明 | 诚聘英才 | 征稿启事 | 联系我们 | 广告服务 | 举报专区
欢迎访问证券之星!请点此与我们联系 版权所有: Copyright © 1996-