财经新闻网消息:
马斯克的社交平台X(前身为)最近更新了隐私条款,X将使用收集到的数据来训练AI模型。
X最新的隐私政策明确指出,“我们可能会使用收集到的信息和公开信息来训练我们的机器学习算法、AI模型等”。
对于此事,马斯克也直接承认,并补充说“只会使用公共数据,不会使用用户的私人消息或任何私人数据。”
值得一提的是,4月份马斯克指控微软非法使用数据训练AI,并威胁要提起诉讼。 同月,马斯克提高了 数据访问的价格,起价为每月 4.2 万美元,可访问 5000 万条推文。
X并不是第一家为了收集数据来训练人工智能而改变隐私政策的公司。
谷歌还在7月份更新了隐私政策,明确谷歌有权收集任何公开数据并将其用于其AI模型训练。
也就是说,只要谷歌能够从公共渠道获取内容,就可以用来训练自己的Bard模型或者未来所有的AI模型。 在这种情况下,只要用户继续使用服务,就可以使用默认的相关信息来训练 AI模型。
本周,百度、商汤科技、百川智能等多家企业/机构的大型模型产品上市并向公众开放。
人工智能的三大核心要素包括算力、算法、数据。 数据是AI算法模型的“饲料”。 人工智能技术的训练需要大规模的数据集,需要大量的数据来喂养。 如今,我国生成式AI监管尤其是数据使用规则正在逐渐清晰。
国家政策层面,国家网信办等七部委发布了《生成式人工智能服务管理暂行办法》,将于8月15日起施行。该文件提出了制定、实施的规范。 ,以及生成人工智能训练语料库的使用。 券商认为,前期研发积累的AI应用有望从Q3开始进入上线周期,训练语料的价值或将重新估值。 同时,将训练数据的来源纳入监管,有望加速AI模型领域数据版权的实现。
地方政策层面,北京市《北京市公共数据区授权运营管理办法(征求意见稿)》“鼓励公共数据区探索市场自主定价模式,探索产业发展及产业发展相关应用场景并有条件付费按需使用”; 《广州市数据条例(征求意见稿)》“推动数据要素纳入国民经济和社会发展统计核算体系”“鼓励企业将数据资源纳入企业财务报表”。
兴业证券指出,AI大模型有望成为数据要素变现的第一场景。 受算力成本、商业模式等原因限制,国内市场瞄准2B垂直领域,基于大模型微调的小模型有望率先商用。 只有掌握核心行业数据,才能训练出适合该行业的垂直行业大模型。 AI投资除了算力和算法,更应该关注数据。
免责声明 ① 本网所刊登文章均来自网络转载;文章观点不代表本网立场,其真实性由作者或稿源方负责 ② 如果您对稿件和图片等有版权及其他争议,请及时与我们联系,我们将核实情况后进行相关删除 ③ 联系邮箱:215858170@qq.com