西安“一码通”故障频发 主管局长刘军被停职
1月4日,西安“封城”第十二天,雾霾不请自来。
目前,确诊病例虽有所下降,但防疫形势并不乐观。关键时刻,风口上的“一码通”再现故障,两次相距仅15天。
1月5日,西安“古都先锋”发布任免信息,西安市大数据资源管理党组书记、局长刘军,因履职不力被停职检查。
此前,对于“一码通”故障,在新闻发布会上刘军解释,由于用户访问量激增,造成网络拥塞。这样的解释,并没能说服民众,反而引来诸多质疑。
那么,西安“一码通”两次故障,真相到底是什么?。
2020年春节前,武汉疫情发生之后,各地提升信息化防疫。彼时,西安市政府委托西安电信,开发疫情防控信息化平台。
据了解,西安电信取得该项目时,亦遭到业内人士质疑。有人认为,西安电信做不好疫情技防产品,不和谐声音此起彼伏。
面对质疑,西安电信智慧城市负责人表态,疫情防控信息化手段必须上,西安电信有能力做到。后来,西安大数据管理局刘局长回忆说,这句斩钉截铁的话打动了他,双方携手合作。
其实,政企双方合作具体内容,外界知者甚少。但从公开招标信息可见,西安“一码通”日常运营,是由西安电信负责,西安市大数据管理局全面主导。
据媒体报道,西安电信技术员72小时不眠不休,完成了“一码通”研发上线试运行。并协调启明、安恒、思安、东软、阿里等多家公司,从网络、应用、数据多个层面为“一码通”提供安全防护。
2020年2月16日,西安“一码通”在曲江上线试运行,并与西安市公安局“一场五站”二维码入口完成统一工作。西安电信说,全凭一颗赤诚之心,摸着石头过河。
2月25日,西安“一码通”正式运行。此后,市民通过注册获取电子码,成为进出西安各社区、商超、写字楼等公共场所的通行凭证。
此后,在西安城区范围内,无论交通、住宿、景区、办公区,还是进杂面小馆,扫“一码通”方可入内。尤其外地人,若不注册西安“一码通”,可以说是寸步难行。
在这次疫情爆发前,西安“一码通”大数据平台上,累计注册人数超过4300万,日均扫码1000余万人次。该大数据平台上,储存了西安市民个人信息,每天被攻击高达数万次。
值得注意的是,在“一码通”的基础上,西安电信与西安市政府联手,打造了社会治理综合指挥信息平台。该平台具有五大功能,指挥调度、联动处置、社会治理、研判分析以及统一治理。
据了解,西安“一码通”大数据平台,汇集了海量信息,包括政府提供的各类数据。尤其防疫指挥,也是依据大数据平台,研判红码与黄码,并进行精准打标。
由此可见,西安市政府防疫数据,也储存在大数据平台上。那么,西安“一码通”接二连三出现故障,究竟是访问量剧增所致,还是另有隐情?
2021年12月20日,西安市“一码通”瘫痪,市民无法正常使用,导致出行受阻。此次故障,对于防疫吃紧的西安来说,无异是雪上加霜。
事发不久,有位专业人士撰文,刊发在《通信最前沿》公号上。分析导致“一码通”故障原因,有可能是架构设计以及容灾备份程序存在问题。
文章称,从技术角度分析,西安“一码通”故障,并不是网络拥堵所导致。应该是“一码通”系统容灾和备份机制存在缺陷,而“一码通”核酸查询和核酸检测系统之间,强关联设计方面存在失误。
同时指出,如果是网络拥堵导致系统崩溃,解决流程并不复杂。网络拥堵,大体上有两种解决办法,一是限流,二是扩容。
所谓限流,是把一部分网络请求阻挡住,让部分网络请求通过,这样系统负荷就会减小。扩容是增加服务器的硬件,如果服务器有集群,则可在集群中增加更多服务器,后通过负载均衡,将大流量分布到更多服务器,进而降低单个服务器负荷。
需要说明,现在的计算机系统,基本上都部署在云上。而云计算平台上,“限流”和“扩容”都很容易实现。而西安“一码通”系统,是部署在阿里云上,无论是限流还是扩容,应该都不难。
综合分析,西安“一码通”是程序问题。佐证是“一码通”的版式,在事发当天进行了回滚,在系统恢复后,最新二维码版本消失,变成了以前的版本,以此判断系统进行了回滚。
另外,12月19日进行核酸检测的人,发现检测结果不显示。很有可能是,数据库也进行了回滚,回滚到了之前某个时间点。
其实,如果仅是流量过大,直接优化网络、优化硬件即可,为何要把程序回滚到以前?可能是程序结构出现了问题,一时半会修改不好,情急之下把程序回滚,网络拥堵只是一个借口而已。
目前,运营企业不告诉真实原因,只能从表象进行分析。所存在的问题,若不能及时处理,后续还会发生类似故障。
另据《云著》文章显示,对于“西安一码通”故障问题,来自腾讯、华为、中兴、ICT数据分析10余位专业人士,从前端、后端、测试分析问题原因。
经论证,认为造成“一码通”故障原因,可能是限流、服务器、架构、性能过载、场景、设计漏洞、压力测试方面存在问题。也可能是nginx后台应用服务器高并发下挂掉,可能是缓存击穿,导致后台数据库响应时间变长,前台长时间无法响应……!
同时,前述专业人士从产品、系统,测试三个方面,提出了问题解决建议。并希望通过技术建议,能使西安“一码通”稳定运行和持续优化,继续守护着古城市民平安。
近日,工信部官员也指出,西安“一码通”要加强技术改进和网络扩容,确保平台安全稳定运行。同时要求系统再优化,细节再完善,确保不出现拥塞宕机现象。
截至目前,对于“一码通”两次故障原因,运营方并未详尽公布。至于真相,随着相关人士被问责,到时谜底自揭。
责任编辑:王健