❗OpenAI发布会总结: 视觉声音混合多模态+极快响应速度+成本下降50%,Her时刻来临,重申全面看多AI板块天风计算机[淘股吧]

#OpenAI发布会发布全新SOTA模型GPT-4o
本次更新发布了新端到端多模态大模型GPT-4o模型与API,模型本身在GPT-4tuibo基础上实现了视觉-音频的混合多模态功能,输入端接受文字/视觉(图与视频)/音频,输出端同样也可以文字/视觉/音频,同时响应速度仅320毫秒(之前GPT-4为5.4秒),模型在非英语语言上也有极大的提升,同时GPT-4o的API价格便宜50%,速度限制提高5倍。

#GPT-4o在现场完成实时多模态交互
GPT-4o可以实现快速的人机交互,发布会上,OpenAI展示了复杂的实时对话、语音翻译、视频交互等功能。语音交互十分流畅,无需等待回复加载,GPT通过音频可感知并提供各种情绪;翻译可以实现实时同声传译;视频交互则表现出复杂的多模态融合交互,包括现场写方程与ChatGPT沟通解法,根据视频拍摄内容给出情感反馈;可语音互动沟通代码内容,并解释分析代码生成的图表等。真正的个人助手时代有望到来

#个人助手时代加速来临
GPT-4o展示了桌面端与手机端的终端,用户可以通过音频与OpenAI完成多种模态的复杂交互,《Her》时代加速来临。我们预计GPT-4o将加速AGI与智能交互的时代到来,看好包括AI音频、AI个人助手等方向的应用与算力板块反弹。

推荐关注
1.应用:(1)办公软件:金山办公福昕软件彩讯股份
(2)多模态:万兴科技美图公司虹软科技光云科技
(3)TO B:鼎捷软件用友网络金蝶国际致远互联泛微网络汉得信息
(4)金融、教育、医疗:科大讯飞佳发教育视源股份润达医疗恒生电子新致软件 $新致软件(sh688590)$
2.基础设施:华为+海光算力产业链、云天励飞星环科技寒武纪景嘉微