近日,国家互联网信息办公室起草了《生成式人工智能服务管理办法(征求意见稿)》(下称《意见稿》),《意见稿》的出台时间距离chatgpt的爆火不过两月左右,速度不可谓不快,这也体现了监管层对于生成式AI的重视程度。
细数过去两月“:chatgpt火遍全球,微软、谷歌、百度、腾讯等国内外科技巨头“光速”入局,一场聚焦于生成式AI的“军备竞赛”刚拉开序幕就进入白热化阶段。
当前的一个共识是:国内的同类产品与chatgpt存在一定差距,这个差距有多大?百度当家人李彦宏说是2个月,搜狗创始人王小川说是3年......至今还没有国内企业宣称自己达到或是超过chatgpt的水平。
短暂的落后并不致命,中国互联网的发展历程就是一部活生生的弯道超车史,当然这离不开政策的支持。
从行业的长期发展来看,《意见稿》于此时出台将对行业发展起到了规范作用,在国家安全、消费者权益、数据安全、商业竞争等诸多维度给出了明确的要求与指引。
但于当前来看,《意见稿》或将在一定程度上束缚了国内生成式AI的发展的“手脚”。
比如《意见稿》第七条指出:用于生成式人工智能产品的预训练、优化训练数据,应满足“能够保证数据的真实性、准确性、客观性、多样性”要求。
这对于严肃性内容的生成自然是绝对正确的,但对于一些文学作品而言就显得有些不适配,如果用户进行文学创作,里面提及“一剑破天”、“御空飞行”、“王子变青蛙”、“我命由我不由天”......这明显是不具备任何真实性、准确性的,但这些也是生成式AI必不可少的一部分,如果要满足第七条要求,势必需要国内企业在功能上自我阉割。
再比如《意见稿》第十五条指出:“对于运行中发现、用户举报的不符合本办法要求的生成内容,除采取内容过滤等措施外,应在3个月内通过模型优化训练等方式防止再次生成。”这对于生成式AI的内容监管十分必要,但落地难度极大。
与常规的内容平台不同,生成式AI可以让每个用户的“生产力”指数级提升,这意味着内容形式和数量的爆炸式增加,无论是当前内容平台的审核机制还是媒体行业的人工审核机制都无法完全适配生成式AI,只能是通过技术手段和全民参与的方式来“师夷长技以制夷”,这必然会形成一个“矛与盾”相互间不断进化的结果,但“防止再次生成”的描述往往会被自动对应到“100%”的概率,也就是要求生成式AI企业制造出一个坚不可摧的盾,这几乎是不可能完成的任务,即使完成了行业也难免要出现“自我阉割”的代价。
《意见稿》之所以有“征求意见稿”的后缀,也就意味着这不是最终的监管文件,相信在征求意见期间业内和全社会能够与监管层充分沟通,给到一个能在“强规范”与“促发展”之间相互平衡的监管环境。
如果说数据作为新型生产要素,那么生成式AI就是这个生产要素的重要产品,这个产品要行的稳、也要跑得快,毕竟我们当前还需要追赶。
AGI,大厂都绑一起都没戏