博睿数据-企业应用性能管理服务商,赋能IT运营智能化

视频直播行业案例-哔哩哔哩

哔哩哔哩现为国内领先的年轻人文化社区,于2009年6月26日创建,被粉丝们亲切的称为“B站”。 根据数据公司QuestMobile发布的《移动互联网 2017 年Q2 夏季报告》,B站位列24岁及以下年轻用户偏爱的十大App榜首,同时,在百度发布的2016热搜榜中,B站在00后十大新鲜关注App中排名第一。 截至2017年第四季度,哔哩哔哩的月度活跃用户为7180万,用户日均使用时长达到76.3分钟,正式会员第十二个月的留存率超过79%。用户中81.7%是出生于1990-2009年之间的年轻人,在招股书中被称为中国的“Generation Z”(Z世代) 。

合作背景


播放页面的加载性能对用户体验影响较大,不清楚同行业的性能情况以及自身调优方向;
不清楚各地用户访问效果如何,CDN发生故障时不能确定受损范围和快速响应;
App用户量大,如何有效抽样采集和流量分配,尽量降低监控成本;
针对VIP用户、企业领导使用App期间发生的故障没有良好的统计,无法复现排障;
服务进入移动互联网时代 ,对移动客户端产品没有监测机制。

解决方案

竞品分析 
主要问题:播放页面的加载性能对用户体验影响较大,不清楚同行业的性能情况以及自身调优方向。
通过Bonree NET主动式监测对同行业视频点播网站播放页面的监控,能够清晰了解到自身服务缺陷。通过分析业内播放页资源构成详情,进行了页面内容重组与优化。可以看到在下载量保持大致相同的情况下,B站的播放页加载耗时缩短了了50%,较明显领先于同行业均值。


CDN品控 
主要问题:不清楚各地用户访问效果如何,CDN发生故障时不能确定受损范围和快速响应。
通过Bonree NET对静态资源进行较高频率的监测,能够实时监控不同区域、运营商的访问效果和访问错误,明确故障节点。通过NET监控。配合Bonree NET的智能动态基线报警,B站及时发现了CDN调度、负载问题并重新分配资源,提升了视频点播质量。
截止2018年5月,最近三月平均传输速度环比上一周期提升13.16%,成功率提升至99.72%,错误数量减少了一倍以上。


数据采集 
主要问题:App用户量大,如何有效抽样采集和流量分配,尽量降低监控成本。
由于B站App月活超过7000万,全量采集会造成数据量过大,对监控服务的负载压力极高,也造成了资源浪费。而传统的抽样采集模式需要在嵌码时写死,不能灵活调整。

Bonree SDK平台提供了灵活抽样采集设置:
1.在限定了日独立设备采集上限后,可以根据流量特性自由分配每个小时的采集比例,这样高度自定义化的流量分配策略有效避免了在每天一开始(深夜)就把当天的日活资源占满。
2.博睿数据在SDK原有启动概率控制接口的基础上,新增了云端控制启动概率的设置,这样可以无需更新App版本,即可实时调控SDK的启动概率,有效节约了监控成本,无需更新客户端的模式增强了用户体验。


VIP用户问题追踪 
主要问题:针对VIP用户、企业领导使用App期间发生的故障没有良好的统计,无法复现排障。
首先,VIP用户和企业领导使用App的数据必须要被全量采集,不能受到启动概率或抽样的影响造成数据缺失;之后,对于所有样本产生的错误、崩溃数据要有良好的报表模块,并提供根据客户信息检索的功能。

1.通过智能判别VIP、普通用户的方法,自动执行启动或不启动概率采集接口,成功实现了VIP用户全量数据的采集。
2. 通过Bonree SDK中【客服检索】模块,帮助B站运维、开发能迅速定位任意用户在使用期间发生的崩溃、请求错误、js错误等核心问题。结合崩溃堆栈、崩溃轨迹、用户上下文、网络分析能够直击问题本质,缩短投诉处理周期。
在半年内故障投诉率下降了0.5个百分点,客服处理投诉效率提高40%。


版本迭代众包测试   
主要问题:服务进入移动互联网时代 ,对移动客户端产品没有监测机制。
通过众测平台使得原来用户非常头痛的上线真机测试,变成一件快捷、可靠、稳定的工作,解决了用户的大问题。
目前众测已经成为用户上线前的“必须”步骤,并且通过测试减少可能用户流失,节约运维成本。
截止2018年第一季度,累计发现致命级7例,严重级38例,其中兼容性问题设计数十种机型。

合作价值


在下载量保持大致相同的情况下,B站的播放页加载耗时缩短了了50%,较明显领先于同行业均值;
截止2018年5月,最近三月平均传输速度环比上一周期提升13.16%,成功率提升至99.72%,错误数量减少了一倍以上;
有效抽样采集和流量分配,降低了监控成本;
在半年内故障投诉率下降了0.5个百分点,客服处理投诉效率提高40%;
通过测试减少可能用户流失,节约运维成本。
博睿数据-企业应用性能管理服务商,赋能IT运营智能化