新闻中心
从斗鱼服务器的崩溃,来看香港服务器如何高效使用
2019-04-25
阅读()
来源:互联数据

4月23日,在斗鱼直播吹响赴美上市号角之前,斗鱼服务器并不太平。一个月前,骚猪PDD的复播,让大批的网友挤爆了斗鱼,斗鱼平台人气破4亿,当斗鱼服务器承载着目前最高人气纪录的时候,斗玩网成功把斗鱼的服务器搞崩了。


所以很多斗鱼用户嚷嚷到“别弄什么嘉年华浪费钱,把你服务器好好弄弄斗鱼网体验那么差,不是卡就是弹幕炸的,狗牙服务器真比你斗鱼的好”。其实,不管是视频直播服务器还是我们自己使用的香港服务器多需要高效地使用!影响服务器效率的原因虽然很多,但我们可以集中几点进行分析。


斗鱼服务器崩溃的原因


斗鱼服务器崩溃的原因:


1、斗鱼服务器崩溃不是运维技术不行,也不是没办法解决,单单一线城市和二线城市的程序员待遇都差一倍。


2、随着斗鱼直播的规模越来越大,管理的服务器越来越多。如何高效管理几百台服务器的性能也越来越难。


3、现有的监控工具能监控服务器资源使用情况,也能出局报表图形查看,但是欠缺的是一种高效的查看对比服务器资源使用是否有波动,波动范围是否正常的方法。


其实管理斗鱼服务器不像我们管香港服务器那么简单:只要做到正确配置香港服务器硬件,避免资源浪费瓶颈这几类;利用冗余功能为企业提供存储方面有利的保障。为香港服务器增加冗余的CPU或硬盘,以保证企业数据在故障下不会轻易丢失。再做好对香港服务器上传的流量、处理器和主板等重要部件的温度进行控制,可以有效避免香港服务器应超标而宕机带来的不必要损失。做好这些实时监控就OK了。


斗鱼每台服务器要建立自己的运行基线,实时数据与基线对比,如果在基线范围内视作正常,反之异常。减少人工对比性能图表的步骤。经过讨论发现大家集中在性能管理工具,实际这些工具多少都用到了。但是当斗鱼面临维护一千台、一万台服务器时,每天查看那么多当日CPU性能图与前一日同比是否有波动也不太现实,人力忙不过来的。


香港服务器管理策略


我们租用的香港服务器也是如此,如何让香港服务器更高效的运行,在使用中不出现意外故障,是企业需要深思的。如果是我们的香港服务器,可以根据历史收集的性能数据,每个时间片建立一个CPU基准值(简单的取历史数据中同一台服务器同一时刻的均值),当日性能分析就看当日CPU使用率与基准值的差异,并将这个差异量化出来。上面只是单纯从运维上面考虑,我们其实还可以增加带宽、购买更理想的cdn服务,租用香港等海外服务器优选CN2线路等等,才是斗鱼服务器这些高并发网站最有效的管理方式。


这样做之后,虽然不用像管理斗鱼服务器一样,每天再查看这一千台服务器CPU性能的时候就不用对比一千个图,我们只需要关注量化的差异比较高的个别服务器。高效使用香港服务器的难点只是,定义好数据差异(标准差?)量化好差异,量化之后设定差异值的关注值。做好高效利用香港服务器CPU和硬件,确保服务器各组件的性能合理搭配。才能使香港服务器更高效地运转!

相关阅读