摘要:部分人工智能系统已经学会如何欺骗人类,其中包括部分号称已被训练成乐于助人和诚实的系统。
英国人工智能(AI)安全研究所本周五发布了发布了一个新的测试平台,旨在加强监测先进AI模型的安全风险。
据介绍,该工具箱名为Inspect,可以用来评估一系列领域的AI模型,包括它们的核心知识、推理能力和自主能力。通过开源许可证发布,这意味着Inspect可以免费供全球AI社区使用。
英国去年10月份宣布成立人工智能安全研究所,将研究和测试新型AI模型;今年2月,英国还表示将斥资1亿多英镑启动9个新的研究中心,并对AI监管机构进行技术培训。
在新闻发布会上,英国人工智能安全研究所表示,Inspect是一个软件库,它使测试人员能够评估单个AI模型的具体能力,然后根据结果给出一个分数。
部分人工智能系统已擅长“说谎”
近期美国麻省理工学院一个研究团队称,部分人工智能系统已经学会如何欺骗人类,其中包括部分号称已被训练成乐于助人和诚实的系统。
研究人员发现的最引人注目的人工智能系统欺骗例子是元宇宙平台公司的“西塞罗”人工智能系统。
帕克说:“我们需要尽可能多的时间,为未来人工智能产品和开源模型可能出现的更高级欺骗做好准备。我们建议将欺骗性人工智能系统归类为高风险系统。”
文章内容仅供参考 ,不构成投资建议!(22)
未经允许不得转载:德讯证券顾问 » 英国抢先发布AI模型安检测工具;部分AI系统已擅长“说谎”
评论前必须登录!
登陆 注册