当前最新:干货 | AI算法透明性实现与评估
以下内容整理自清华大学《数智安全与标准化》课程大作业期末报告同学的汇报内容。
我们主要从分析问题、解决问题、效果评估和实际验证四方面,推动这一课题的研究,并形成相应的研究成果。
(资料图片仅供参考)
第一部分:AI算法透明概述
第一部分,AI算法透明概述,主要凝练了当前AI算法透明性存在的挑战。
近年来,人工智能技术的发展使得其透明性问题日益凸显,为保障用户对算法知情,实现监管机构对算法进行有效规范治理与问责,算法透明性必不可少。
然而,算法透明性更类似于原则性的提议,具体如何落实透明性要求,并对其进行有效评估,尚未形成共识。
因此,我们对AI算法透明当前存在的诸多挑战进行了总结,主要涉及三个维度:技术、评估和制度。
技术上,很难处理AI算法的黑箱问题;
评估上,对透明程度的要求很难把握尺度;
制度上,算法问责机制仍然模糊。
为有效应对这些挑战,我们首先给出算法透明性实现路径,解决技术和制度问题,之后提出算法透明评估清单应对评估问题,最终在推荐系统下进行实践与应用。
第二部分:实现AI算法透明
宏观上,我们首先需要AI算法透明性治理范式,针对当前在算法监管立法等多个层面的挑战。我们希望打破透明性中耦合的机制主义和管理主义,形成一种以法律规制为主导,技术适配为基础的多元一体、多方协作的AI算法透明性治理范式。
微观上,这一范式的实施措施落实到学术、法律、技术和场景四方面。
学术上,国内外学者研究主要从多方视角相关主体出发,提出了若干在法律规制和技术适配方面的思考。
法律上,鉴于算法透明,是实现算法问责的重要机制。主要可以总结为两种实现AI算法透明的模式:赋权模式和行为规范模式。赋权模式属于事后救济,而行为规范模式属于事前预防和事中约束。
这里我们具体对比了不同国家地区的法律,发现各国都采取健全算法问责机制等措施。此外,我们也注意到欧盟还强调对算法参数的公开。
技术上,我们聚焦于实现从不透明模型向可诠释模型、可理解模型转变的可解释技术,该技术具体分为事前解释、事后解释和可诠释模型。针对不同的应用实例,又会有更为细致的方法。
不同的应用场景,对AI算法透明体现出不同的场景需求。我们也分别在自动驾驶、材料化学、智能教育和建筑设计,四个细分领域内进行了需求分析和方法探索。
第三部分:评估AI算法透明
鉴于现有法律规制大多在宏观层面强调算法透明监管原则,却鲜小有具体措施。因此,我们提出一套相对详细、可实施的评估标准,以细化并落实算法透明度合规要求。
首先,面向算法使用者的AI透明度评估清单的设计目标,在于保障知情权。内容主要分为算法概述与技术信息,要求算法开发方对这些内容进行说明。
算法使用者的AI透明度评估清单相较于面向用户的清单,由于监管方需要根据算法评估内容进行等级评估,所以该技能较为严格,需要说明的内容也更为复杂。
为配合透明度评估清单的使用,我们还提出了透明度评估等级表。面向不同使用场景的算法分为五个等级进行评估,不同等级对于算法开发者应当达到的透明度有不同要求,且逐步加强。
具体这个清单是如何工作的呢?如左图所示,评估流程有助于监管方对算法开发者在事前、事中和事后阶段做出责任分配。
在开发方与使用者方面,开发方遵照透明度用户指南向算法使用者提供算法的透明度指南。之后,使用者需要阅读指南,以此确立两方权责分配并获得知情。
第四部分:AI算法透明实践
我们选择推荐系统作为典型实例,也是因为推荐系统最能体现AI算法透明的要求。如果能让外界理解为什么信息被推荐给乙方,其实就达到了这个场景下的透明度要求。
通过实现推荐系统的透明性,也能提升用户对系统的信任程度,使系统推荐结果得到检验,同时受到有关方面的监管。
考虑到推荐系统目前采用的AI推荐算法众多,所以我们设计了一个推荐系统外的解释系统或算法,用于对推荐系统进行解释或直接作为一个整体对外提供具有解释性质的推荐。
其核心算法是采用知识图谱与强化学习的技术,充分挖掘推荐系统中的可解释模型,以此进行相关的路径挖掘,并利用解释路径对推荐系统行为加以解释。
这里我们采用一九年一个公开的购物网站公布数据进行结果演示,在利用上述算法完成解释系统后,对数据集进行路径挖掘,得到左图所示的结论。
基于上述深层的推理路径,对推荐系统的多个推荐实例进行解释。结果表明,方法不仅能够帮助推荐系统获得有希望的推荐结果,而且能够有效为推荐系统找到不同的用于推荐解释的推理路径。
之后,我们分别将未加入和加入这一解释算法的推荐系统,按照前一章节设计的流程进行算法评估。结果表明,融入解释算法后的推荐系统,在透明度上有明显提升,但监管方也注意到,新的具有解释性质的推荐系统,在技术和社会风险上处理方法上有缺,要求对当前算法做进一步改进,并对提交的材料进行补充。
感谢各位的聆听!以上就是我们小组要汇报的全部内容。
编辑整理:陈龙-
当前最新:干货 | AI算法透明性实现与评估
2023-01-17 -
全球新消息丨2022年金融关键词:转折
2023-01-17 -
观热点:怎么去起诉欠钱不还的人呢?
2023-01-17 -
世界即时看!技源集团IPO:周京石、龙玲夫妇控制84.47%表决权,前者为美国籍
2023-01-16 -
大宗交易:芯源微成交5944万元,折价15.09%(01-16)
2023-01-16 -
老豆腐做成大产业|聚看点
2023-01-16 -
北京各大博物馆密集推出迎新文创
2023-01-16 -
(新春走基层)吉林“兵支书”带领村民种出致富果 新年目标收入翻倍 天天消息
2023-01-15 -
俄称在多个方向发动攻势并打击乌军目标
2023-01-15 -
【独家焦点】清风头条丨安乡:织密“护廉网” 过好廉洁年、平安年
2023-01-14 -
全球百事通!恒指夜期收盘(1.14)︱恒生指数夜期(1月)收报21860点 高水121点
2023-01-14 -
稳健医疗预计2022年净利润暴增近50%,市场并不买账
2023-01-13 -
天天精选!澳超首发:斯蒂尔、霍尔曼先发出战 达维拉pk卡明斯
2023-01-13 -
世界速读:太逗科技张雁:三年磨一剑成国内领先整合营销服务商 投身公益创业成功不忘乡里
2023-01-13 -
德邦证券给予华正新材买入评级,覆铜板龙头企业,铝塑膜接力成长
2023-01-13 -
川发龙蟒2022年度净利润预增26%-51%-天天视点
2023-01-12 -
多主力现身龙虎榜,宝胜股份涨停(01-12) 世界新动态
2023-01-12 -
全球消息!冬季风暴侵袭 美国无家可归者处境愈发艰难
2023-01-12 -
当前观点:方正富邦基金:溯源历史 农业板块有望2023表现优异
2023-01-12 -
截止1月11日PTA相关行业开工率汇总|全球微速讯
2023-01-12 -
天天关注:河南省周口市交通违章能在网上查到吗?
2023-01-12 -
2:0关键时刻掉链子,克雷桑主动红牌,揪出球队失冠炒掉教练?|当前关注
2023-01-11 -
“新东方在线”改名,俞敏洪不给自己留退路了?
2023-01-11 -
快报:黎智英法律團隊求晤英相 妄商「潛在獲釋」對策
2023-01-11 -
比亚迪“易四方”带火轮边电机!龙头强势四连板,受益上市公司有这些
2023-01-11 -
世界第一虚拟乐队举办了一场 AR 音乐会 #Gorillaz
2023-01-10 -
南通市国有A级旅游景区免门票向全市医务人员开放
2023-01-10 -
竹叶贷逾期还不起怎么办会不会被起诉
2023-01-10 -
独家资金:主力进散户逃前10股
2023-01-10 -
发生建设工程内部承包合同纠纷,怎样办?-讯息
2023-01-10
-
守住网络直播的伦理底线
2021-12-16 -
石窟寺文化需要基于保护的“新开发”
2021-12-16 -
电影工作者不能远离生活
2021-12-16 -
提升隧道安全管控能力 智慧高速让司乘安心
2021-12-16 -
人民财评:提升消费体验,服务同样重要
2021-12-16 -
卫冕?突破?旗手?——武大靖留给北京冬奥会三大悬念
2021-12-16 -
新能源车险专属条款出台“三电”系统、起火燃烧等都可保
2021-12-16 -
美术作品中的党史 | 第97集《窗外》
2021-12-16 -
基金销售业务违规!浦发银行厦门分行等被厦门证监局责令改正
2021-12-16 -
保持稳定发展有支撑——从11月“成绩单”看中国经济走势
2021-12-16