推荐理由:[淘股吧]
1) Chatgpt即将开放图生文及语音对话功能,GPT多模态能力崭露头角;
2) 公司深耕大视频赛道,全面、深度受益于AIGC的多模态应用。

1、 Chatgpt即将开放图生文及语音对话功能,GPT多模态能力崭露头角
1) 周一,OpenAI发布重大更新,宣布开始为ChatGPT推出新的语音和图像功能,允许用户在与ChatGPT进行语音对话或展示他们正在讨论的内容,据悉,该功能将在两周内对用户开放,其中,与Chatgpt语音对话的能力仅对ios及安卓客户端开放,而图生文能力对全平台开放。
2) 往后AIGC多模态领域将催化不断:①9月21日,OpenAI发布了DALL-E3,其能够直接在对话中生成图片,成为ChatGPT实现多模态能力的重要一环,并为后续的AI视频生成打下基础;②据爆料,谷歌GPT-4竞品Gemini AI预计将于秋季发布,将对标ChatGPT,使用的训练算力比GPT-4大5倍,多模态能力将大幅提升;③OpenAI将于11月6日在旧金山举行公司的首届开发者大会“OpenAI DevDay”,期间预计将发布视频生成工具GPT-vision;④此外,在GPT-Vision之后,OpenAI有可能会推出更强大的多模态大模型,代号为Gobi。跟GPT-4不同,Gobi从一开始就是按多模态模型构建的。

2、 公司深耕大视频赛道,深度、全面受益于AIGC的多模态应用
1) 公司深耕大视频赛道,深度受益于AIGC多模态应用,公司年报披露:①随着多模态智能技术发展,更多的视频内容由 PGC向UGC、AIGC 产生,消费级视频制作的门槛将大幅降低,而生成内容将呈现几何技术增长,随之而来的视频处理、压缩、传输以及播放的市场将会有更旺盛的需求;②公司拥有AIGC多模态内容生成相关技术储备,能够为多模态大模型的训练提升精度、节省算力,同时改进多模态内容的生成效果。
2) 公司业务全面受益于AIGC的多模态应用:①数字人:2022年11月14日,公司在《投资者活动记录表》表示,公司在虚拟数字人制作方面已经有相应产品,主要应用于传媒直播、活动直播、虚拟演播室、全息文旅等场景;②AI视频:2023年2月22日互动易披露,公司目前在一些演播室、智能媒资平台等业务上已有AIGC方面的落地,可为电视台、新媒体、互联网、泛媒体行业等客户提供通过AI技术进行短视频、长视频的生产/加工等解决方案;③生成式AI监管:公司的智能审核系统拥有AI生成式对抗识别以及视觉Transformer技术,能识别特定场景的AI生成画面。
多模态AIGC将带动视频处理市场需求:
2022年11月14日,公司在《投资者活动记录表》表示,公司在虚拟数字人制作方面已经有相应产品:

2023年2月22日互动易披露,公司目前在一些演播室、智能媒资平台等业务上已有AIGC方面的落地:

公司具备生成式AI监管能力:
$当虹科技(sh688039)$