以为例,其抓取公开数据训练AI模型的行为早就备受争议。目前还不清楚的爬虫机器人在网上潜伏了多久,有些人怀疑已经秘密收集每个人的在线数据长达数月或数年。爬虫技术作为一种数据搜集的手段,本身并没有合法与非法之分。但主动为其爬虫工具设限的举动,似乎并不能挽回公众对这家大模型头号公司的信任。正如克拉克所说,既然愿意为(美联社)等大公司的数据付费,为什么它不为其他人的信息付费呢?