欢迎来到财经新闻网

人工智能聊天机器人的背后需要海量高质量数据作为支撑

编辑:佚名      来源:财经新闻网      人工智能   聊天机器人

2024-05-12 17:08:11 

财经新闻网消息:ZO4财经新闻网

K图 GOOGL_0ZO4财经新闻网

K图 GOOG_0ZO4财经新闻网

人工智能聊天机器人需要海量的高质量数据作为支撑。 传统上,人工智能系统依赖从文章、书籍和在线评论等各种网络来源提取的大量数据来理解用户查询并生成响应。ZO4财经新闻网

_AI“数据荒”怎么办?微软、谷歌等公司正使用“合成数据”训练AI_AI“数据荒”怎么办?微软、谷歌等公司正使用“合成数据”训练AIZO4财经新闻网

长期以来,如何获取更多优质数据成为人工智能企业面临的一大挑战。 由于互联网上数据的可用性有限,人工智能公司正在寻找替代解决方案——合成数据。ZO4财经新闻网

合成数据是人工智能系统生成的人工数据。 科技公司利用自己的人工智能模型生成合成数据(也被视为虚假数据),然后使用这些数据来训练其系统的未来迭代。ZO4财经新闻网

当谈到如何生成合成数据时,该过程涉及设置特定参数并提示AI模型创建内容,从而可以更精确地控制用于训练AI系统的数据。ZO4财经新闻网

例如,微软研究人员为人工智能模型提供了 4 岁儿童可以理解的 3000 个单词列表。 然后,他们要求模型使用词汇表中的名词、动词和形容词创建一个儿童故事。 通过在几天内重复提示数百万次,该模型最终产生了数百万个短篇故事。ZO4财经新闻网

虽然计算中的合成数据并不是一个新概念,但生成人工智能的兴起促进了大规模创建更高质量的合成数据。ZO4财经新闻网

这家人工智能初创公司的首席执行官达里奥(Dario)将这种方法称为“无限数据生成引擎”,旨在避免与传统数据收集方法相关的一些版权、隐私和其他问题。ZO4财经新闻网

AI“数据荒”怎么办?微软、谷歌等公司正使用“合成数据”训练AI__AI“数据荒”怎么办?微软、谷歌等公司正使用“合成数据”训练AIZO4财经新闻网

现有用例和不同观点ZO4财经新闻网

目前,Meta、谷歌和微软等主要人工智能公司已经开始使用合成数据来开发高级模型,包括聊天机器人和语言处理器。ZO4财经新闻网

例如,它使用合成数据为其聊天机器人提供动力; 谷歌使用这种方法来训练可以解决复杂几何问题的模型; 而微软则公开了一种使用合成数据开发的小型语言模型。ZO4财经新闻网

AI“数据荒”怎么办?微软、谷歌等公司正使用“合成数据”训练AI__AI“数据荒”怎么办?微软、谷歌等公司正使用“合成数据”训练AIZO4财经新闻网

支持者认为,如果实施得当,合成数据可以产生准确可靠的模型。ZO4财经新闻网

然而,一些人工智能专家对合成数据相关的风险表示担忧。 著名大学的研究人员观察到了“模型崩溃”的情况,即根据合成数据训练的人工智能模型会出现不可逆转的缺陷并产生荒谬的输出。 此外,人们担心合成数据可能会加剧数据集中的偏差和错误。ZO4财经新闻网

“如果处理得当,综合数据会很有用,”剑桥大学博士说。 在一封电子邮件中写道。 “然而,对于如何正确地做到这一点,还没有明确的答案;一些偏见可能很难被人类发现。”ZO4财经新闻网

AI“数据荒”怎么办?微软、谷歌等公司正使用“合成数据”训练AI__AI“数据荒”怎么办?微软、谷歌等公司正使用“合成数据”训练AIZO4财经新闻网

此外,围绕对合成数据的依赖存在着一场哲学辩论,引发了关于人工智能本质的疑问——如果它使用机器合成的数据,它仍然是模仿人类智能的机器吗?ZO4财经新闻网

斯坦福大学教授珀西·梁强调了将真正的人类智能融入数据生成过程的重要性,并强调了大规模创建合成数据的复杂性。 他认为“合成数据不是真实数据,就像你攀登珠穆朗玛峰的梦想实际上并没有到达顶峰一样。”ZO4财经新闻网

目前,对于生成合成数据的最佳实践尚未达成共识,这凸显了该领域进一步研究和开发的必要性。 随着该领域的不断发展,人工智能研究人员和领域专家之间的合作对于充分利用人工智能的潜力来开发合成数据至关重要。ZO4财经新闻网

免责声明 ① 本网所刊登文章均来自网络转载;文章观点不代表本网立场,其真实性由作者或稿源方负责 ② 如果您对稿件和图片等有版权及其他争议,请及时与我们联系,我们将核实情况后进行相关删除 ③ 联系邮箱:215858170@qq.comZO4财经新闻网

发表我的评论 共有条评论
    名字:
全部评论
'); })(); /* 360自动推送代码 */