媒体融合进入智能化“快车道”
时而是龙卷风呼啸,时而是火星平原。
“我感觉整个脚下好像都在动!”有人惊呼,但依然亦步亦趋跟随数字宇航员,一步步走向火星的最高火山——奥林匹斯山。
发出惊呼的人,此时正在湖南长沙参观中国新媒体技术展。
7月12日,2023中国新媒体大会在长沙开幕。作为大会重头戏,以“智慧促深融”为主题的中国新媒体技术展尤为热闹。“沉浸式航天元宇宙”体验区超现实场景的还原,更是吸引了诸多跃跃欲试的观众。
我国媒体融合发展已走过10年。以AIGC(生成式人工智能)为代表的AI技术加速迭代演进,推动媒体融合进入智能化快速发展新时代。智媒技术不断助力媒体人,延伸“脚力”、提升“眼力”、增强“脑力”、创新“笔力”。
中国新媒体技术展,向人们生动展出了我国媒体融合“十年磨一剑”的新生态。
开展媒体融合生产应用基础研究
让人流连忘返的“沉浸式航天元宇宙”,由新华社媒体融合生产技术与系统国家重点实验室打造。
这一实验室是中宣部指导、科技部批准建设的媒体融合生产领域首个国家重点实验室,主要面向国家重大战略需求,聚焦人工智能在传媒、信息服务领域的应用,开展媒体融合生产应用基础研究。
“沉浸式航天元宇宙”是利用空间信息技术、先进计算机图形技术等前沿技术打造的下一代互联网示范体验,其仿真度、延迟性等关键技术指标全球领先。“元宇宙”利用遥感数据构筑超仿真地外行星数字环境,可支持行星地表任务模拟、航天员训练。同时,它的核心技术实时渲染能支持低延迟交互,可为国家和社会的数字化转型提供“底座”。
中央广播电视总台超高清视音频呈现国家重点实验室,则在展区搭建起了“三维菁彩声体验室”。工作人员告诉科技日报记者,三维菁彩声攻克了编解码传输、解码渲染、异构网络视音频同步传输三大关键技术,最终打破了声道限制,能满足不同场景下的音视频接收情况,为听众提供极致的沉浸式听觉体验。
“解决了8K超高清电视及‘百城千屏’采用三维声或环绕声技术难题的同时,我们还在三维声制作、传输、终端渲染的整条链路上实现了自主创新的技术解决方案。”上述工作人员表示。
新技术成就越来越多媒体虚拟人
在中国新媒体技术展上,记者看到了越来越多的媒体虚拟人。
科大讯飞展台展示了团队最新发布的讯飞星火认知大模型。基于新一代认知智能大模型强大的跨领域知识和语言理解能力,它学会了以自然对话方式理解与执行任务,从海量数据和大模型知识中持续进化,实现从提出、规划到解决问题的全流程闭环。
星火认知大模型赋予虚拟人“超能力”。科大讯飞湖南公司总经理盛军介绍,团队自主研发的虚拟人智能交互机,运用了其最新AI虚拟形象技术,结合语音识别、语义理解、语音合成、虚拟形象驱动等AI核心技术,最终通过大屏交互一体机的终端形式落地,可实现用户与虚拟人物形象间“面对面”互动交流、业务咨询、智能问答、服务导览等多场景功能。
华为展区,1∶1大小的AI数字人大模型姿态优雅。“基于云盘古基础大模型能力、渲染引擎和实时音视频能力,我们能构建数字人个性化大模型。模型生成后,用户通过文字、语音、视频等方式生产驱动向量信息,驱动数字人生成高清视频。”华为云现场工作人员肖淑玲说。
新华智云展厅大屏幕数字古画卷,则展示了一种可古今“对话”的虚拟人。
人们通过文化数字化操作系统互动屏,摄入人脸图像,便可自动生成个性化数字人偶形象,以及定制专属数字虚拟人。虚拟人可神奇地“一秒入画”,与画中古人对话交流。
“结合大模型、AIGC、数字人等先进技术,可实现地方文化地标、历史名人大数据的深度挖掘,生成的内容有助于更快更广地传播中华优秀传统文化。目前,我们的技术已服务全国300多家文旅机构。”现场工作人员梁超说。
腾讯云智能小样本数智人、北京聚力维度科技有限公司零门槛驱动超写实数字人、谦语智能AI数字人……或实现24小时不间断直播,或成为企业形象代言人。它们不断扩大应用场景,成为人们生活中触手可及的新“人力资源”。
来源:科技日报