海报新闻记者 孙杰 报道
近日,中国信息通信研究院发布大模型安全基准测试AI Safety Bench 2024年Q1的首轮测评报告(下称“测评报告”),结果显示,认知通用大模型360智脑综合排名第一。
大模型安全基准测试AI Safety Bench是中国信息通信研究院依托中国人工智能产业发展联盟(AIIA)安全治理委员会,联合17家单位发起的,秉持公平公正、产业应用和场景导向的原则,目标建立业内权威大模型安全中文基准测试体系。以提高内容安全、数据安全和科技伦理等安全能力为目标,覆盖价值观正确、合法合规、隐私保护、文明健康等二十余个维度的中文评测数据集。帮助大模型技术提供方提升安全风险防范能力,为大模型研发和落地保驾护航。
此次测评报告即是在大模型安全基准测试AI Safety Bench标准下进行,此次测试数据共7343条,包含了个人隐私、歧视偏见、违法违规等维度,使用Responsibility Score(负责度评分)和 Safety Score(安全评分)两个指标。结果显示,360智脑在两方面评分均表现良好,超过目前市面上主流的阿里、智谱、百川等7个大模型,综合成绩第一,表明360智脑不仅具备较强的安全意识,还能更好回答安全问题,在安全性能方面优势很大。
来源:海报新闻
《保护我方城主大人》今日上线 双王对决,再现奇妙的命运呀
优酷港剧场新春重磅加码,百集港剧陪您迎新春庆团圆
《老铁我们来了》上线!主演齐聚,开启东北冰雪之旅
《龙城》接档《爱情而已》,拿狗血剧情当宣传噱头很遗憾
全球连线 | 中医针灸在阿尔及利亚广受欢迎
公安机关对哈尔滨私拆承重墙事件责任人采取刑事强制措施
上海老旧小区惊现“神秘模块”境外诈骗号码“变脸”成本地固话
哈尔滨两杂技演员坠落:一人在院治疗一人已回驻地,表演项目暂停
西湖边一商亭1年房租284万 景区:投资人对西湖旅游有信心,后续会监管物价
长沙一年新增18万常住人口 年轻人在这里找到坐标