给AI做“体检”有多火？这家机构挂牌月余，已出具57份“体检陈诉”

2024-06-29 20:37:21 來源: 147小编作者:147小编

原标题：给AI做“体检”有多火？这家机构挂牌月余，已出具57份“体检陈诉”vT7微商品牌网

怎样判定生成式语言大模型会否“一本正经地胡说八道”？如何知道自动驾驶系统能够抵抗得住外界的恶意攻击？功能强大的AI大模型也需要“健康检测”，以确保其准确性、抗攻击性及宁静性。vT7微商品牌网

今年6月8日，上海首家生成式人工智能（AI）质量检验检测中心挂牌筹建，为AI大模型等智能软件提供专业化“体检”。挂牌一个多月，这家AI质检中心已出具57份“体检陈诉”。vT7微商品牌网

vT7微商品牌网

给ChatGPT做“体检”vT7微商品牌网

上海市北高新区区块链谷，走进上海生成式AI质检中心，一台台电脑中正奔驰着AI“体检”软件。vT7微商品牌网

“中心建立后不久，我们就给ChatGPT做了一次测评。”上海计算机软件技术开发中心软件工程研究所副所长陈敏刚博士透露，测评简直可以对生成式语言大模型的推理、抗幻觉、理解用户意图等能力，进行客观的评价。vT7微商品牌网

上海计算机软件技术开发中心主任蔡立志介绍，软件中心是上海科学院的直属单元，作为一家恒久以为网络宁静保驾护航为使命的研究机构，中心早在2016年就开始关注人工智能的宁静问题，至今已开展了2000多项AI检测业务。vT7微商品牌网

ChatGPT动员了生成式AI的快速发展。截至7月8日，国内已推出近百个大模型，如何客观地评价、比力大模型，以及其他AIGC模型的性能，成为大模型应用的关键一环。vT7微商品牌网

在多年技术与行业经验积累的基础上，经过近两年的准备，上海生成式AI质检中心最近正式挂牌批筹。蔡立志告诉记者，中心主要面向生成式AI所涉及的计算机视觉、自然语言处置惩罚、内容生成等领域，聚焦人工智能生成内容语义表达能力、逻辑推理能力、合成内容鉴别，以及功能、性能、宁静性评估等，“通过提供全方位的测评服务，保障人工智能系统或应用的质量”。vT7微商品牌网

“体检”为提质指路vT7微商品牌网

随着大模型技术的快速进步，在人工智能应用不停深入的同时，利用AI换脸、合成语音流传虚假信息、行骗等危害社会的现象也不停发生。vT7微商品牌网

7月10日，国家网信办等国家七部委联合发文《生成式人工智能服务管理暂行措施》，明确了AIGC服务提供者的责任，包罗信息源可信责任、生成内容合法合规责任、申报宁静评估及算法存案责任。vT7微商品牌网

“管理措施的落地，需要专业的第三方机构提供AI质量检验检测服务。”蔡立志透露，去年中心筹建期间，就已完成300多个AI质检项目，正式挂牌仅一个多月，已出具57份相关检测陈诉。由此也可窥见为AI做“体检”的需求旺盛。vT7微商品牌网

事实上，这项工作自己就是一项含金量极高的技术活儿。上海计算机软件技术开发中心副主任宋俊典告诉记者，对于一些大型复杂AI系统的检测，甚至需要根据应用场景专门搭建检测检验系统，耗时可能长达半年，同时还需要研发大量相关技术与尺度。vT7微商品牌网

“对于AI的质量检测，只有好与差之分，没有对与错的判断。”宋俊典解释，通过质检，厂商能更清晰地了解AI软件的性能，有针对性地对产物进行迭代与优化。vT7微商品牌网

vT7微商品牌网

从“守底线”到引领财产vT7微商品牌网

检测检验是行业话语权的重要标记，检测尺度往往是一个行业的发展风向标。然而，对于人工智能这个飞速发展的领域，蔡立志认为，不能简单套用传统财产“先立尺度后检测”的“守底线”模式，而应接纳检测与尺度同步发展的新模式，以起到规范、引领财产的作用。vT7微商品牌网

近三年来，上海软件中心为上海乃至长三角地区人工智能企业与应用方提供专业的第三方测评服务数年均凌驾500项。据悉，上海计算机软件技术开发中心已累计发布了AI检测相关尺度30余项。vT7微商品牌网

蔡立志说，目前AI检测属于企业自主行为，未来对于大模型的宁静性、可解释性、伦理风险的检测检验，可能会形成国家强制尺度。vT7微商品牌网

作者：许琦敏vT7微商品牌网

摄影：许琦敏vT7微商品牌网

*文汇独家稿件，转载请注明出处。返回搜狐，检察更多vT7微商品牌网

责任编辑：vT7微商品牌网

上一篇: 健康体检选哪好，体检中心与医院体检的差别

给AI做“体检”有多火？这家机构挂牌月余，已出具57份“体检陈诉”

發佈評論:

四十岁女性护肤品推荐：碧欧泉成为首选，细纹松弛问题

Repu微商代表分享独特产品魅力，深化人际交流与信赖

数款性能卓越的纯补水面膜，改善肤质效果明显，嫩滑光

柯成兴：尽管短期内存在挑战但从长远来看中国经济具

TSM面膜细腻质地，持久滋润，长期细腻光滑效果显著