2023年9月,CSA大中华区成立AI安全工作组,旨在共同解决AI技术快速发展所带来的安全难题。《AI安全白皮书》是CSA大中华区AI安全工作组的首个研究成果,由来自中国电信、蚂蚁集团、电子科技大学、百度安全、华为、京东安全、启明星辰、安恒信息、联通(广东)产业互联网有限公司、Ucloud、物盾科技、世平信息、魔方安全、孚临科技、安几科技等单位共同编制而成。
点击图片,查看《AI白皮书》完整版
AI赋能安全
报告指出AI赋能安全的同时,在其应用的前提下依然会带来新的安全问题,一是AI技术自身的脆弱性可能导致不稳定或者不安全的情况;再就是其自身应用特点可能给其他领域带来风险,即AI技术的产生的衍生安全问题。
AI安全生态
AI环境生态的安全是整个AI安全的实施基础,报告从AI环境切入,提出AI安全应从AI数据安全、AI算法安全、AI应用安全和AI安全运营4个层面综合考虑。
报告指出数据安全是AI数据安全的关键,数据的安全和质量影响着AI算法/模型的准确性,在机器学习的每个步骤中,都存在着隐私泄露的风险。
基于AI技术安全问题,报告针对当前的热点技术AI技术话题,进行了展开,包括:大模型安全、对抗样本攻击、数据投毒攻击、供应链攻击、数据泄露攻击、模型窃取攻击,以及AI辅助应用场景(例如:辅助医疗、辅助驾驶、辅助客服,以及金融、军事、基础设施、社交媒体应用场景等)的安全问题。
大模型安全问题重点分析了个人信息和敏感数据的保护问题,并指出大模型在交互场景的运营过程中也存在诸多威胁和风险;
对抗样本攻击则聚焦于攻击者对输入样本进行微小、有针对性的修改带来的AI大模型误判或误分类,强调了对抗过程中模型的鲁棒性和样本检测等技术的重要性;
数据投毒攻击研究了通过污染训练数据来欺骗计算模型的风险和应对技术;
供应链攻击则注意到AI技术所依赖的供应链的脆弱性,并提出针对AI供应链攻击的检测和防御思路;
数据泄露攻击在分析了大模型安全的一个重要场景,分析了已出现的数据泄露攻击方法,并提出了普适性应对方案;
AI安全的行业发展
人工智能安全是一个快速发展的行业,需要不断创新和投入研发。随着人工智能技术的进一步发展和普及,人工智能安全将成为一个重要的领域,为保护人工智能系统和用户提供更安全的环境。
在监管发展方面,报告指出,最少应从法律法规、政策指引、行业标准、国际共识等多个方面进行考虑,应对人工智能安全的多重挑战。
在政策指引上,人工智能的设计必须确保公平和透明,避免偏见和歧视。我国自2017年陆续发布《新一代人工智能发展规划》、《个人信息安全规范》、《新一代人工智能治理原则》、《新一代人工智能伦理规范》、《关于规范和加强人工智能司法应用的意见》、《算法推荐管理规定》、《互联网信息服务深度合成管理规定》等大量的政策法规文件均提出了“安全可控”的人工智能治理目标。
在国际共识上,CSA于2023年5月发布《ChatGPT的安全影响》白皮书,强调了GPT技术在提升生产力和改变软件开发实践上的潜力,同时也指出区分其人工智能安全的合法和非法使用的挑战。
《ChatGPT的安全影响》的发布也让人工智能安全即AI安全进入到了人工智能第四个发展阶段,即国际共识的产生阶段。《ChatGPT的安全影响》提供了一些关于人工智能安全的一致意见与重要参考。
点击跳转详情
展望
人工智能安全是一个不断发展的技术领域。我们需要不断研究和创新,以应对新的安全威胁和挑战。只有确保AI系统的安全性和可靠性,才能更好地发挥其潜力,为人类社会带来更多的福祉。
致谢
《AI安全白皮书》由CSA大中华区AI安全工作组专家撰写,感谢以下专家的贡献:
工作组联席组长:
黄磊、王维强
主要贡献者:
黄磊、王维强、何伊圣、卞超轶、李岩、陶瑞岩、刘广坤、郑国祥、张淼、陈洋、郭建领、唐科伟、崔崟、段阳阳、冯明、邹旭、郝伟、黄国忠、林兵、邢海韬、杨浩淼、杨喜龙、张亮、孟昌华
审校组:
黄连金、黄磊、王维强、刘广坤、何伊圣、张亮、李岩
研究协调员:
黄家栋
贡献单位:
中国电信、蚂蚁集团、百度安全、安恒信息、启明星辰、华为、联通(广东)产业互联网有限公司、京东安全、安几科技、优刻得、物盾科技、世平信息、魔方安全、电子科技大学、孚临科技