2020年1月24日晚间8点,一首开年贺岁歌舞《春潮颂》拉开了鼠年春晚的序幕。《这就是街舞》、2019第一神曲《野狼Disco》的改编版本《过年迪斯科》、《风雪饺子情》、《走过场》等众多的节目更是将春晚推向了一波又一波的高潮。
今年的春晚不仅演员阵容庞大,就连主持人阵容进行了“大换血”,各种创新的节目更是赢得观众的阵阵喝彩。本届春晚堪称一场科技的视觉盛宴,其中春晚舞台首次打造三层立体舞美,同时运用飞屏技术营造出360度环绕式景观,通过精良的视频制作,让观众在屏幕前就感受“裸眼3D”的极致体验。
不仅如此,今年春晚北京主会场与粤港澳大湾区、郑州分会场全面通过5G网络进行互动,央视首次制作8K超高清电视版2020春晚,为观众带来史无前例的视觉震撼。今年春晚还与快手合作,推出10亿春晚红包,通过创新大小屏联动方式,使得今年的春晚流量峰值再创历年新高。
然而,面对不断的流量“洪峰”和错综复杂的网络环境,对于背后的技术“后勤”却是一场实力的终极大考。为保障春晚直播的高质量、无卡顿地平稳传播,作为今年央视春晚后台技术支撑方之一的金山云,以更加完善的技术服务,协助客户迅速提升“战斗力”,全面护航央视网春晚直播、B站拜年祭,并全力支撑Top 10短视频客户打赢硬仗,以多元技术保障了千万级的互动直播,并赢得用户的一致好评。
“智能调度+多流择优”双引擎 护航央视春晚直播
多年以来,各项重大事件和活动的直播,例如央视春晚、全国两会、世界杯等活动和体育赛事,都有着来自于金山云的保障。历经直播重保实战考验的金山云,在直播保障方面有着更多的技术和经验积累。
为保障海量用户同步、高清收看央视网的春晚直播节目,金山云团队伙伴们事先对直播所需带宽进行了详细地评估。同时,利用金山云自身充足的节点资源和带宽资源,确保对直播形成的峰值带宽压力形成稳定支撑。如果流量峰值超出预测,金山云将在1分钟内在客户的流量调度组中增加节点,扩充总容量,满足带宽需求。
金山云技术团队预测,在20点联欢晚会开始的每个整点时刻,会进入流量的高峰时段;同时结合主要客户的业务推广内容,会出现由抢红包活动导致的用户访问高潮。为确保高并发、高QPS的数据流量访问,金山云采用了金山云自主研发的智能调度系统,更好地保证了直播过程中智能调度的实现。
此系统包括“负载均衡器”、“金山云鹰眼”、“智能阀”三大功能模块。金山云团队先是用“金山云鹰眼”监测数据,看数据有没有达到“水位”,如果“水位”将近,“智能阀”将开启,提前预警和分配资源,再由智能调度系统调整流量的走向,从而实现流量的智能调度。
其中金山云KVS,全称 KSyun Virtual Server,是一套基于 LVS 研发改造优化的自动负载均衡系统,具有可用性高,稳定性好,扩展性强等特点。金山云KVS可以对每台 real server 设置不同的权重值,让性能好的资源承担更多的用户请求,合理的利用现有的资源。同时,金山云KVS 还可以自动查询 real server 的负载情况,动态调整权重来进行合理的资源分配。
直播保障过程中,在央视和金山云的直播源站的基础上,搭建了多个直播源站及转码集群,通过RTMP/FLV拉源流,转码处理后支持央视HLS/HDS/FLV拉流。同时配备容灾主备解决方案,可在搭建的多个源站之间互为备份,实现秒级切换,极大地分流了源站的高并发访问请求。
值得一提的是,金山云在业内率先支持直播推拉流over QUIC,金山视频云直播QUIC+解决方案(在丢包率达到30%时流畅度仍达96.51%)在此次直播重保中发挥了重要的作用。
除此之外,金山云团队在此次保障过程中,采用了业界首创的多流择优技术。即允许同一个直播信号频道多点同时注入CDN,通过对多个原始信号源的对齐编排,确保信号共存,并通过自研的高敏感度抖动算法,及时感知不同信号源的抖动情况,在毫秒尺度上筛选出最优的信号源作为向下分发的主信号,且支持最优信号源在毫秒级别上平滑切换而不引起跳帧或者重复播放。同时,在金山云历经考验的内部链路动态优选的强力加持下,确保直播信号在CDN内部稳定传输。
“智能调度系统+源站分流+边缘直播内容预拉取+多流优技术”四招共同构造了金山云视频直播的技术实力,也成为金山云在直播架构上的优势所在。
高码率、高并发QPS请求 提供全套能力服务体系
随着互联网技术快速发展,移动设备能力越发提高,用户数量不断增加,活动方式越发新颖,高码率、高并发、高QPS已经逐步成为云服务企业基本能力要求。此次央视春晚直播更是创新性地采用了5G超清、VR直播形式,高达10亿次的全网视频播放量,高并发QPS(每秒的用户请求数)的抢红包互动,对金山云服务能力提出巨大挑战。
为更有效保障业务高峰时超清视频及VR视频传输稳定性,金山云技术团队与央视网一起重新优化系统架构,通过资源打通,实现了在技术、管理、运营等维度的全方位联动,最大程度保证了活动的顺利进行。
目前,金山云在国内有1000+CDN节点,全网带宽储备达100Tbps,能够在最大程度上保证此次央视春晚的内容快速、稳定分发。此外,金山云的CDN产品基于超大规模的分布式集群,拥有海量并发能力,能够提供稳定、流畅、丰富的网络加速服务,同时,金山云全息透明化数据支撑体系,能够实现全方位高可用服务保障,为客户提供低延时、弹性透明化的CDN服务。
针对高清视频、VR等视频应用,金山云视频云分发节点进行专门的大容量设计,在系统架构层面采用新一代Cache架构Dorado,多级缓存技术、多线程等技术的应用,提高并发能力性能,稳定性提升50%以上;在硬件设备层面,采用了第三代DMA技术(SSD+MemCache+AIO),同时针对编译器、存储和网络进行专门优化,I/O性能提高400%;在传输协议层面,金山云TCP网络经过内核优化,传输效率提升30%。
为进一步减少带宽的占用,在此次重保过程中,金山云提供了包括直播、点播、下载、小文件等完整的CDN产品矩阵以及包括边缘计算、集智高清、P2P、QUIC双边加速等一系列技术体系在内的全方位技术服务。
其中,集智高清融合多种技术使编码后的视频体积缩小,节省20%-40%视频传输带宽,配合KSC265转码技术可二次降低视频传输带宽。金山云提供AI+ AV1 智能云转码服务,压缩率高达80.57%,业界领先。
在边缘计算层面,目前金山云边缘计算在大数据上传与API加速场景中,文件上传速度加快40%,上传成功率提高到99.5%,API服务查询请求成功率提高到99.9%;在同城直播的场景中,允许同城亲友就近拉流观看,大幅节省骨干网带宽并提升观看质量。
除了集智高清、多流择优、协议优化等基础手段外,针对5G背景下的超高清、VR直播,金山云也做了相应的技术储备。CMAF低时延分发方案,不仅解决了HLS、DASH等协议的延时“硬伤”,其所具有的多码率自适应功能,结合对齐转码技术,能够同时提供8K、4K、1080P甚至更低的多档码率自适应输出,以匹配不同网络情况下的终端用户能够同时享受或高清或流畅的极致体验。
正因如此,凭借金山云所提供的包括视频云和CDN整套的技术服务体系和资源储备能力,金山云经受了高清视频的大流量和一波又一波的抢红包流量高峰冲击。
客户成功保障平台 提供全方位的保障能力
金山云对此次央视春晚直播的成功保障,除了在底层技术的优化外,金山云创新性地开发了“客户成功保障平台”,在此次央视春晚重保中发挥了重要的作用,起到了事半功倍的效果。
业内对于“客户成功保障平台”并不陌生。在2019年12月26日举办的“2019金牌运维大会”上,金山云“客户成功保障平台”被评为《2019运维行业年度优秀案例》。
众所周知,公有云为客户资源弹性提供了便利,但同时对于公有云运维人员带来了,缺乏从客户视角看问题的技术手段、缺乏有效的主动性保障手段以及缺乏客户产品体验全局实时认知等困难。为助力公有云客户业务成功,实现商业结果的双赢,金山云推出“客户成功保障平台”提供全方位的保障能力。
其中,金山云开发的“重保机器人’,可根据重保需求自动创建专门的保障沟通群,针对客户重保期间的问题集中群内沟通,避免信息碎片化;“重保机器人”根据需求监控客户的资源稳定性,添加“全方位的监控”,创建相应的“客户资源监控大屏”,设置“灵敏的告警阈值”,确保可先客户一步获悉问题所在;此外,“重保机器人”将告警、工单派发到处理人,并监督处理人在一定时间内处理完成,极大地提高了人工的工作效率。
此外,为保证央视直播重保的顺利进行,金山云成立了近50人的专项组,横跨产品、研发、运营、客服以及风控团队,提供724小时的远程加现场保障,并提供了技术驻场服务,安排应用运维、网络运维进行驻场保障,实现秒级响应和应急处理,做到第一时间解决问题。此外,在常规操作团队之余,金山云专门安排了应急团队,针对突发情况采取额外措施,两套团队独立运转,以备临时突发状态,保证重保的顺利进行。
在全民防范病毒传播的特殊时期里,当我们在家中看着春晚捧腹大笑时,金山云每个重保程序员都积极做好卫生防范,进门测体温,大家都戴着口罩在2020金山云春节保障指挥中心里,为央视春晚直播顺利进行贡献自己的力量。
不可否认,金山云为央视春晚直播成功重保,再一次证明了金山云强大的技术实力。未来,随着5G超高清以及VR时代的到来,金山云将提供更加全面的技术和服务能力,为更多的重大事件和赛事活动直播而保驾护航。