2021年12月30日最新消息:OpenAI推出API 将其研究商业化
作者:访客发布时间:2023-05-21分类:科技网络浏览:95评论:0
OpenAI今天宣布推出新的API,以访问研究人员开发的新自然语言处理模型,包括最近发布的GPT-3。该公司声称,与大多数为用例设计的人工智能系统不同,该应用编程接口提供了一个通用的“文本输入、文本输出”界面,使用户能够尝试几乎所有的英语任务。
根据OpenAI的说法,API在前两个月免费提供Beta版本,只有合格的客户才能获得访问权限——这是一个注册过程。(例如,Algolia、Koko、MessageBird、树苗、Replica、Casetext、Quizlet和Reddit等公司,以及米德尔伯里研究所和其他机构的研究人员在发布前进行了一个试点项目。)该公司表示,API将与其合作伙伴密切合作,看看在现实世界中使用AI系统时会遇到什么挑战。
“这一领域的进展速度意味着总是有令人惊讶的新AI应用,无论是积极的还是消极的。对于明显有害的用例,如骚扰、垃圾邮件、激进化或干扰,我们将终止API访问。”OpenAI在他的博客中写道。“[这种]模式让我们更容易应对技术滥用。因为很难预测我们模型的下游用例,所以通过API发布它们,并随着时间的推移扩大访问范围,而不是发布一个开源模型,在开源模型中,如果访问结果是有害的,就不可能对其进行调整,这本来就比较安全。”
给定任何文本提示,OpenAI的应用编程接口返回文本完成,以尝试大致匹配提供给它的模式。开发人员可以通过只显示一些例子来“编程”他们想要做的事情。它的成功取决于任务的复杂性。该应用编程接口还可以通过训练提供的样本数据集或从用户或标签提供商的手动反馈中学习来提高其在特定任务上的性能。
例如,API可以在不使用关键字的情况下识别自然语言查询的相关内容。它还可以进行复杂的讨论——简短的提示,即生成涵盖从太空旅行到历史等一系列主题的对话,并将文本转换为简化的摘要。它甚至可以根据函数名和注释来完成代码。生成包含建议类别的电子表格;并使用一些有代表性的例子将自然语言转换成Unix命令。
“我们设计的API不仅对任何人来说都很容易使用,而且足够灵活,可以让机器学习团队更高效地工作。事实上,我们的许多团队现在都在使用API,这样他们就可以专注于机器学习研究,而不是分布式系统问题。”OpenAI继续说道。“我们希望API将使强大的AI系统更容易被小型企业和组织访问。”
OpenAI发布了从计算机视觉到自然语言处理(NLP)的AI子领域研究,其既定任务是安全创建超智能软件。这家初创公司始于2015年,是一家非营利组织,但后来被重组为一家盈利公司,在投资工具OpenAI LP下有上限。
OpenAI可能会遭到AI社区的强烈反对,称API将为其正在进行的研究、安全和政策工作提供财政支持。当然,OpenAI的进步并不便宜——光是GPT-3的内存需求估计就超过了350GB,训练成本超过了1200万美元。为了给他们提供资金,OpenAI此前从创始成员和投资者那里获得了10亿美元的捐款,从微软那里获得了10亿美元的投资,其中一部分用于开发运行在Azure上的AI超级计算机。到目前为止,OpenAI LP已经吸引了雷德霍夫曼慈善基金会和科斯拉风险投资公司的资金。
根据OpenAI的说法,随着API通过其学术访问计划继续研究包括第三方研究人员在内的潜在滥用,API还将为基于它的大规模模型的开发提供信息。OpenAI表示,随着时间的推移,我们的目标是对API的潜在危害形成“透彻的了解”,不断完善工具和流程,将这些危害降到最低。
减少有害偏见等负面影响是整个行业的一个艰巨问题,非常重要。最终,我们的API模型确实会产生偏差,有时会出现在生成的文本中。“OpenAI写道。”(这就是为什么)我们正在与用户合作开发用户指南,帮助他们相互学习,并在实践中缓解这些问题。[我们还]与用户密切合作,深入了解他们的用例,并开发工具来标记和干预有害偏见,[并且]我们将对有害偏见、公平性和代表性进行自己的研究,这将有助于我们与用户沟通。"
过去,OpenAI采取了谨慎且有争议的缓解方法。由于担心恶意演员滥用和锻造Deepfake的潜在自动化,GPT-2在去年2月首次亮相时,选择不共享该模型的所有四个版本,从而在一系列任务中取得领先成果。批评这一决定的人说,未能发布源代码对缺乏资源复制模型或其结果的社会和科学家构成了潜在威胁。其他人称之为宣传账号头。
随后,OpenAI发布了GPT-2的几个更小、更简单的版本,并研究了它们的接收情况和它们训练的数据集。在判断“没有强有力的证据”被滥用后,它在12月发布了一个完整的模型——它接受了从互联网上抓取的800万个文本文档的训练。
- 科技网络排行
- 最近发表
- 标签列表
-