可靠性文章

Vibe Coding时代软件可靠性基石的重构

宋荆汉 / 网安加学院2026-04-27~10 分钟
# Vibe Coding# AI可靠性# 软件质量# 前验约束# 研讨会# 宋荆汉# 人机协同

演讲背景

2026可靠性应用&液冷技术研讨会上,深圳国防科工协会产业发展联盟专家、网安加学院院长宋荆汉带来了重磅演讲《Vibe Coding时代软件可靠性基石的重构》。

宋荆汉院长拥有20年研发及管理经验,曾在中兴通讯、任子行网络、全志科技、汇金科技担任研发管理高管,曾参与国家测试与安全类职业认证标准、国家软件安全开发相关标准的制定,对软件安全开发有深入研究。


核心观点:AI将复杂性从编码环节转移了,而非消除

> AI并未消除软件固有的复杂性,而是将其转移至提示工程、上下文管理与AI协同审计等新维度。

软件可靠性的本质是确定性逻辑问题,其四大支柱(数据/空间/时间/路径可控)需在AI生成代码前通过精准约束实现,传统质量保障手段正向"前验式"人机协同模式演进。


一、软件可靠性的历史根源与本质特征

历史教训

重大软件事故常由最基础的编码层面问题引发,推动高可靠性领域形成强制性编码规范。近期微软事件同样说明问题根源在单机系统机制设计层面,而非高深架构。

标准定义四子特性

软件可靠性由以下四个子特性构成:

特性含义
可用性 (Availability)系统正常运行的能力
成熟性 (Maturity)缺陷率控制水平
容错性 (Fault Tolerance)故障发生时系统维持运行的能力
可恢复性 (Recoverability)故障后恢复运行的能力

确定性本质

软件故障具有必然性与可复现性——只要触发条件满足,逻辑错误必然发生。区别于硬件随机性故障,不可用传统MTBF模型描述。

安全性强耦合

外部入侵等安全威胁直接损害软件可用性,"安全可靠"已成为统一要求,二者必须同步保障。


二、软件复杂性的三大根源与软硬件耦合问题

1. 规模膨胀导致认知超载

软件本质是人类思维过程的逻辑映射,问题复杂度超越认知边界时,错误必然产生。软件全为抽象符号,不可直观分解内部结构,加剧理解与维护难度。

2. 复用性引发风险级联传播

开源组件广泛复用使单个模块缺陷可像病毒般快速扩散,一处漏洞可影响数千万行代码规模的系统。

3. 软硬件耦合下的偶发性本质

实际观测到的"偶发"失效,多因硬件随机故障(如内存位翻转)触发软件中本就存在的确定性逻辑缺陷。嵌入式系统须进行软硬件联合集成验证,暴露并消除二者交互产生的失效模式。


三、AI时代对传统质量保障体系的冲击

AI生成代码颠覆管理假设

传统依赖人工审查、单元测试、文档注释等手段失效——AI生成速度远超人工审核能力(1小时生成代码量无法人工审完),确定性、可审计性、可验证性三大基石受到根本冲击。

AI固有四大风险

风险描述
幻觉 (Hallucination)虚构不存在的API/逻辑
长程衰减多轮交互后上下文遗忘导致错误累积
依赖风险过度信任AI导致人工判断力退化
训练数据缺陷继承开源集中的漏洞被AI习得并复现

质量实证下降

AI生成代码整体质量水平下降,隐含更多安全漏洞与逻辑缺陷,因其本质是统计拟合而非逻辑推导


四、新范式:前验约束与人机协同保障

范式转变——前验约束

关键控制点前移至代码生成前,通过精准提示词施加可靠性约束,而非事后修复。

可靠性四可控原则

这是生成高可靠性AI代码的核心约束:

  • 数据可控:输入范围/类型/边界明确
  • 空间可控:内存分配固定、无动态堆分配
  • 时间可控:执行时间可预测、无不可控循环
  • 路径可控:控制流分支明确、无隐藏异常跳转

> 无约束AI生成代码在嵌入式环境不可靠,加入四可控约束后可生成符合高可靠性要求的代码。

新三大支柱

支柱说明
上下文工程为AI提供充分精准的领域知识与约束条件
AI辅助代码审计用小模型对大模型生成代码实时对齐校验
可观测性驱动的架构设计接受"代码必有缺陷"前提,聚焦故障快速发现、隔离与修复

未来人才画像

需精通垂直领域知识并具备与AI平等协作能力——AI是队友而非工具,人的专业深度决定AI产出质量上限。质量标准未降低,基石从"人-流程-技术"升级为"上下文工程-AI审计-可观测架构"。


总结

Vibe Coding时代,软件可靠性的本质没有改变,但保障模式必须重构。传统的事后质检已无法应对AI生成代码的规模与速度,唯有将质量控制前移至代码生成之前,通过"数据可控、空间可控、时间可控、路径可控"四大原则对AI施加精准约束,才能真正构建起AI时代可信赖的软件可靠性基石。

相关文章

可靠性文章

第一性原理在可靠性工程中的应用

工业和信息化部电子第五研究所解江主任在2026可靠性研讨会上的精彩演讲。从折叠屏手机FPC断裂、新能源汽车MOS管热烧毁等真实案例出发,探讨如何用"察微溯源、破相立本"的第一性原理思维解决可靠性工程难题。

可靠性文章

为什么你的产品通过了所有测试,却还是在客户那里坏了?

深入剖析"测试通过"与"真正可靠"之间的差距,揭示型式试验的三大局限:温度范围受限、时间尺度受限、工况简化受限。通过工业阀门真实案例(售后失效率15%→0.5%)展示FMEA如何成为测试方案的导航仪。

可靠性文章

【连载04】可靠性如何嵌入产品开发流程

串行开发 vs 并行开发哪个更好?本文详解可靠性在产品规划、设计开发、验证确认三个关键节点的嵌入方式。

想了解更多或申请软件试用?

专业团队提供一对一解答,定制适合您的解决方案