12月20日上班早高峰,西安“一码通”却无法打开,导致很多市民出门乘车、上班扫码等都遇到了困难,甚至核酸检测也无法进行,“西安一码通崩溃”一时成为网上热搜。究竟该如何看到这个问题?华商报记者采访了西安电子科技大学网络与信息安全学院的杨超教授。
官方:近期“一码通”使用频率加大,用户访问量激增
据12月20日下午西安市新冠肺炎疫情防控工作新闻发布会上发布的消息,近日根据西安市疫情防控形势,各公共场所加大了扫码查验,同时开展多轮全员核酸检测,“一码通”使用频率加大,对网络与平台造成较大压力。12月20日早7:40分左右,西安“一码通”用户访问量激增,每秒访问量达到以往峰值的10倍以上,造成网络拥塞,致使包括“一码通”在内的部分应用系统无法正常使用。
“一码通”后台监控第一时间报警,各24小时驻场通信、网络、政务云、安全和运维团队立即开展排查,平台应用系统和数据库运行正常,判断问题出现在网络接口侧。经紧急协调资源并采取扩容、限流等应急措施,平台已逐步恢复使用,但因访问量仍很大,尚可能有部分卡顿现象。将持续加强对平台的监控,“一码通”平台技术团队将24小时不间断驻场运维,加强网络及系统资源保障,确保“一码通”平台良好运行。
发布会上建议:在全员核酸检测的特殊时期,为减轻系统压力,建议广大市民非必要不展码、亮码,在出现系统卡顿时,请耐心等待,尽量避免反复刷新。
观察:“一码通”恢复后,核酸结果查询有了专门入口
12月21日早上,很多市民发现,西安一码通恢复后的页面出现了一些变化:
首先是有了专门的核酸结果查询入口,二维码页面和核酸检测结果页面分离。
其次是二维码的外框没有了,疫苗注射信息在二维码页面相应也没了显示,但在核酸结果查询入口下的“西安一码通”主按钮点击进入后,可以看到页面上有“疫苗接种查询”按钮,点击即可查询。“通信大数据行程卡”在此页面也可进入查询。
从页面情况来看,把二维码之外的其他信息与二维码分离,显然更有助于分流。
另外目前核酸查询结果只显示48小时核酸检测信息,其他日期核酸检测信息只显示最近结果甚至没有显示。
一码通是否还会进一步进行恢复?另有市民提问:12月18日做的核酸,为什么已经显示过期了?
就这些问题,12月21日上午,华商报记者联系了西安市大数据资源管理局。工作人员介绍,目前正在全力保障核酸检测,网络有限流,正常后会逐步放开,数据都在。配合市上要求,现在只显示48小时的核酸检测结果。
另据市民反映,21日下午在做核酸检测时,一度再次遭遇了系统崩溃因而无法做核酸检测的事。
专家:“一码通”要注意系统健壮性、带宽及网络安全问题
对于西安“一码通”出现的突发情况,专家怎么看?12月21日,华商报记者采访了西安电子科技大学网络与信息安全学院教授杨超。
杨超教授说,去年“一码通”也曾出过一次状况,好几个小时无法使用。但这次是长时间、大范围不能扫码,情况还是比较严重的。
目前西安处于疫情防控的关键时期,必须要用的西安“一码通”就和粮食一样重要。即便从普通大众的角度来看,也能看出可能有这么几个原因:
第一,可能是系统不够健壮。什么意思呢?比如说西安平常可能有1000多万人,同时扫码的可能有1/5,但现在因为疫情严重和疫情防控要求升级,同时扫的人可能增加到了1/3甚至1/2,系统的压力就变大了。这就相当于过去超市没人去,现在超市里人满为患,以前的库存和服务当然就撑不了这种情况。所以在作系统设计时就应该充分考虑系统的弹性或者叫可扩展性,以及时将其提升到位。但从另外一个角度上来说,所有的系统都不可能设计为100%的满负荷运行,因为不考虑平常实际使用情况的话,造成的浪费就会很多。所以如何找到一个平衡点,怎么在突发状况的时候能迅速扩展?这是必须要考虑的问题。
第二,软硬件系统负荷大了以后,会出现各种意想不到的问题。不一定是系统本身计算能力不行,它可能能算过去,但网络带宽不够了,因为数据要做一个排队,但排队的缓冲区可能不够了。也就是说,问题可能不仅仅和系统本身相关,还可能会和别的因素相关。这就好比咱们去银行取钱,可能银行有钱,但银行的门窄,10个人进不去,有人就得排到外面去,外面却下着大雨,所以体验很差。
第三,可能和网络安全相关。网络安全有几个常见的属性,比如机密性、完整性、认证性及其可用性。其中可用性是几大属性里边比较重要的一个,就是要保证这个系统可用。有很多种攻击方法会导致可用性降低。比如有一种常见攻击叫做“拒绝服务攻击”。它的原理好比一家面馆有10个座位,我找10个人到你面馆坐在那儿,从早8点到晚8点就喝面汤不吃面。你这10个座位被占满了,就不能给别人卖面,但是你又总不能把顾客撵走。另外还有一种定向的黑客攻击,叫做APT攻击,是一种高级持续威胁。这种攻击有巨大的组织背景,他渗透到系统里来,对系统来进行攻击,可能会对系统很多关键部件进行破坏。这种破坏的程度就要看拿到的权限高低了,如果拿到的权限高,把数据胡搞,导致数据丢了或者乱了,那么机密性、完整性就遭到破坏了,这就很严重了。
杨超教授说,所以防御有几个层次:第一个是在系统的运行维护方面应该有备份,应该有降级预案。就是说万一出意外状况了,今天不开那么快,但也还能保持,慢速的还可以刷得出来,这就是降级服务、降级运行。另外要和网安厂商结合做纵深防御,要从边界防,从内网防,从数据层面防,从软件系统方面防。
12月20日“一码通”的恢复情况是电信用户和联通用户先恢复了,移动用户恢复的最晚,如何看到这个问题?杨超教授表示,运营商是主干道,所有的主干流量都是从运营商那里过的。但打电话、上网没问题,扫一码通却有问题,说明它可能是一个定向发生的流量拥塞问题。当然也有可能是系统压力大,被迫让运营商断掉之后找问题,然后再开开,这种情况也是有可能的。但从目前的形势和表现来看,也有必要从网络安全方面加强防护。
华商报记者 马虎振