中国银河近日发布传媒互联网行业点评报告:Open AI发布GPT 4o,模型易用性大幅提升。
以下为研究报告摘要:
事件:北京时间2024年5月14日凌晨,OpenAI发布GPT-4的升级更新版本GPT-4o,GPT-4o将对所有用户免费开放。同时,Open AI宣布将发布一个适用于macOS的新的ChatGPT桌面应用程序,对应的Windows版本也将在今年推出。
多模态性能进步明显,语音响应延迟大幅降低:GPT-4o作为Open AI的新版本大模型,具有以下性能亮点:1)多模态性能进步明显,GPT-4o打通了文本、音频和图像的输入壁垒,使这些模态相互之间可以直接生成,无需中间转换,在输出端也可以直接生成上述几种模态。2)语音响应延迟大幅降低,GPT-4o可以在232ms内回应音频输入,平均响应时长为320ms,对比GPT-3.5和GPT-4的平均延迟为2800ms和5400ms。3)实时语音助手效果亮眼,GPT-4o能够实时翻译,识别表情,可以通过摄像头识别画面、写代码和分析图表。同时对话内容和音调、语气更接近真人,能够识别对话人的“打断”并及时响应,可以给出带有人类般情绪的回答。
模型将免费开放,API接口降价提速:GPT-4o将向所有用户免费开放,并将在未来几周先向Chat GPT Plus用户推送。GPT-4o提供的API接口对比上一版本的GPT-4Turbo,在速率提高一倍的基础上,价格仅为原来的1/2。同时,GPT-4o允许的单位时间调用次数也提高到了原来的5倍。
模型易用性大幅提升,拓宽智能设备应用场景:GPT-4o在一定程度上颠覆了以往人类与计算机交互的模式:通过几乎实时的响应速度和与人类相近的、带有音调和语气的回复,人类与计算机的交互变得更加真实和顺畅。随着后续相关应用的落地,叠加GPT-4o免费开放使得用户数量大幅度提升,我们认为:智能终端设备(手机、电脑、智能眼镜等)的应用场景有望进一步拓宽。
投资建议:随着2023年以来各种人工智能大模型的不断迭代更新,目前主流人工智能大模型的智能水平已经达到了相当的水平。GPT-4o的发布,标志着人工智能大模型在便利性和易用性上实现了突破,考虑到后续随着GPT-4o免费对用户开放,用户数量的快速增长确定性较高,我们认为,人工智能的对C端的影响力有望增强,看好相关垂类应用的发展前景。建议关注与C端用户体验密切相关的行业:1)AI+游戏:游戏内NPC互动、互动影游;2)AI+教育:智教系统、虚拟实验室;3)AI+办公:内容生成、非结构化数据处理;4)AI+出版:校对修改、智慧发行;5)AI+专业咨询:情感陪护,应用场景专业解答等。
风险提示:大模型技术发展不及预期的风险、政策监管变化的风险、行业竞争的风险、相关技术应用不及预期的风险,算力需求提升可能带来的成本提高的风险。(中国银河 岳铮,祁天睿)
【责任编辑:肖洁 】