全国咨询电话

02389108633

关注官方微信

云计算视频非编应用的技术解析
1. GPU直通和vGPU解析

GPU 直通技术通过VT-d 技术,将物理GPU 透传给某一个虚拟机,使虚拟机能够完全拥有物理GPU 的资源与性能,该方式避免了旧有GPU共享模式带来的抽象层开销,而且交付的性能能够与传统工作站相媲美。

GPU虚拟化,也可称为vGPU模式。vGPU技术采用图形命令重定向架构,在虚拟机的虚拟GPU驱动中截获图形命令调用,并转发到主机端,在主机端的物理GPU 上处理图形命令。随着GPU技术的快速发展,GPU已经可以像其他服务器其他组件一样进行虚拟化,与传统的GPU共享模式不同,vGPU不需要额外的抽象层或API的转换,延时更低。相比GPU直通模式,vGPU可以同时在多个虚拟机之间共享GPU,提升GPU的使用效率,降低投资。

理论上vGPU的模式可以为广电客户带来更大的经济收益以及最大的资源灵活度,但从目前的测试和使用情况来看,GPU虚拟化在融合媒体云平台4K或多轨高清制作应用场景,尤其在负载比较大的情况下,其用户体验稍低于GPU直通的效果,但两者在一般的高清精编和粗编应用中差别不大。本文主要对GPU直通相关的2种非编方案进行介绍。

2. 基于GPU直通的非编方案

GPU直通方式既可以满足对GPU性能要求较高的特技、渲染、精编制作,同时又可以满足低码率的粗编、新媒体类的编辑制作,给予融合媒体云更大的需求适应度。

对于服务器的形态,我们推荐采用刀片式。每台刀片服务器配备相应数量的显卡,为非编资源池构成底层支持平台。方案通过引入服务器虚拟化技术、GPU资源池化技术、GPU直通技术、虚拟桌面架构(VDI)技术,构建云非编制作资源池。其实现如下图所示:

具体实现方式为,在刀片服务器上部署虚拟化层,虚拟化管理系统将物理服务器虚拟成多个虚机,并将刀片服务器上的GPU卡构建成GPU资源池,虚拟机在启动的时候动态从资源池中获取GPU硬件资源,将GPU直通映射到虚拟机上,然后在虚机上安装操作系统、远程桌面协议以及非编应用软件,形成云非编工作站。用户使用PC机或者瘦客户机通过支持高清视频稳定传输的桌面协议访问云非编工作站虚机,所有的非编处理工作都在后台完成,前端只是键盘、鼠标操作以及显示制作画面。非编工作站虚拟机在关闭的时候自动释放GPU硬件资源到GPU资源池,可被其他非编工作站虚机调用。

3. 基于Moonshot微卡的非编方案

Moonshot System 在当今业界独具特色。它在基础设施设计上进步巨大,在4.3U的主机内扩展提供45路服务器,较传统服务器节约能耗89%、节省占用空间80%、降低成本77%。Moonshot System用更节能的 SoC(系统级芯片)替换一般用途的处理器,SoC 中包含针对特定工作负载定制的集成加速器。Moonshot机箱中包含传统服务器中常见的一切资源,包括电源、散热、管理、交换机和网络上行链路均在密集分布的 45 个热插拔服务器模组之间共享,这使得不必相应地增加复杂性和管理开销,即可实现大型扩展。

各个电视台时常面临的挑战是,如何以不同的格式和分辨率为用户制作越来越多的节目内容。而且,即将采用的超高清(4k、8k)电视将需要视频编辑工作站提供更高的处理能力,这为现有的工作站带来更大的压力。H3C凭借Moonshot上的m710 服务器模组重新界定了用于视频非编和转码应用的计算基础设施的经济效益,以 SD 的价格提供高清的性能,使流量增长了20倍。m710 由 Intel Iris Pro Graphics P5200 处理器驱动,使您能够扩展产品,采用新格式,为未来做好准备,而无需大规模地扩张数据中心设施。

如果客户对传统基于X86机架服务器的非编工作站的强劲性能、资源独占性有偏好,但又不喜欢它的资源闲置浪费、无法随时随地处理工作的缺陷,基于Moonshot的视频非编方案将会是一个很好的替代选择,该方案如下:

每片M710p微卡安装win7/win8 X64作为物理桌面,并安装视频非编应用软件,发布给客户端,客户端可以是瘦客户机也可以是移动设备。客户端上安装RGS远程图形软件,通过网络接入到M710p上,在微卡服务器端完成视频非编处理,RGS将图像压缩后传给客户端,客户端上的鼠标、键盘操作实时反馈回微卡服务器。

客户如果想采用云非编更为先进、主流的技术,可采用H3C基于刀片服务器虚拟化的GPU直通虚机技术,同样能轻松面对重负载的视频编辑渲染工作。

4. 4K非编方案的探讨

4K 无疑是近几年很火的一个话题,无论是4K电影、4K电视还是4K录像机都成了我们追逐的潮流,从2016年初的CCBN到各个宣传媒介都有提及。根据超高清电视标准规划(EBU),我们国家从2014年起 至2020年,将分阶段逐步引入4K以及8K。

我们知道图像的大小可以用像素分辨率来表示。而我们经常所说的全高清视频也叫做1080P视频其实分辨率就是1920×1080。而4K则一般指画面分辨率达到3840×2160,即横向3840个像素,纵向2160个像素。然而由于使用范围的差异,4K分辨率也存在着各种差异。例如:Full Aperture 4K的4096*3112、Academy 4K的3656*2664等。和普通高清视频相比,同样精度下,4K能展现更多的画面;而在同样大小的画面下,4K则能容纳更多的信息量。

4K不是简单节目清晰度的提升,对于整个相关产业的变化都是翻天覆地的:

● 4K摄像设备(光电参数、视频参数、接口与格式)

● 4K演播室(转播车)系统和设备(视频参数、接口与格式)

● 4K后期制作系统和设备(视频参数、接口与格式、图像质量、通道指标、声画同步)

● 4K传输编码测试(ES分析、视频参数、图像质量、通道指标、声画同步、)

● 4K显示设备测试(显示性能)

撇开专属设备,我们这里就简单讨论一下,4K来临之后对GPU、计算、存储、网络、VDI等各个组件需求:

● VDI:

云非编除了效果性能接近或者等同于传统非编工作站,我们关注更多的是能为管理、运维带来便利性。而VDI的核心是远程图形协议对视频类应用的优化程度。RGS专注于视频协议多年,无论是全球还是中国的电视台都有良好的口碑。

● GPU:
在高清时代,我们可能还面临以往vGPU和GPU直通的选择,到了4K,我认为就全面进入了视频编辑的重负载时代,这时候,GPU直通就是不二的选择了。

● 计算:
其实,到高清时代,经过我们的多个测试和实际项目中最佳实践,GPU已经不是瓶颈,当今GPU的编辑、渲染能力已经满足高清的需求,到4K瓶颈更是在CPU上,因此,高主频的CPU是我们更为看重的。

● 存储、网络:
4K视频节目制作其实对基础架构层影响最大的还是存储和网络的带宽与延迟。4K视频的制作贯穿了编辑人员的创作过程,通过非线性编辑软件,对多个视频源进行剪辑、添加特效,整个过程一旦出现丢帧,任务就可能失败,4K一般使用30帧素材,要求存储系统时延稳定于30ms以内;视频码流已经从高清的100Mbps~120Mbps上升到4K的400Mbps~1Gbps。如果是体育报道及新闻类节目制作至少需要对3~4层视频做编辑。也就是说,存储系统需要为每台非编工作站/云非编提供高达4Gbps带宽,且时延需稳定在30ms以内。