一个续写故事达到人类水平的AI,OpenAI大规模无监督语言模型GPT

这次的GPT-2是GPT的直接技术升级版本,有多10倍的模型参数,多达15亿个,并在多10倍的数据上进行训练。训练数据是来自互联网的40GB高质量语料,具体来说这些语料来自Reddit论坛中出现的高评分外链页面;高评分表示这些页面中的内容有较高的质量。这样筛选出的语料内容多达800万个页面。

OpenAI的研究人员们发现,根据模型对内容的熟悉程度不同,进行数次尝试之后一般都可以得到较好的生成结果。比如对于训练文本中常出现的(也就是互联网上出现较多的)英国脱欧、指环王、歌手MileyCyrus等话题,模型在大约一半的尝试中都可以生成有理有据的文本;反过来,对于训练文本中较少出现的技术性讨论以及哲学内容,模型生成的效果就要差很多。

除此之外,GPT-2也可以在各种任务中做「无样本学习」,即不经过任何任务专用数据集训练就进行测试,也取得了优秀的结果。OpenAI的研究人员们猜想这些任务都只是通用语言建模的子集,所以自然会有良好表现。

我们一起感受下那煞有介事的文风。

例一

人类给定文本

Inashockingfinding,scientistdiscoveredaherdofunicornslivinginaremote,previouslyunexploredvalley,intheAndesMountains.EvenmoresurprisingtotheresearcherswasthefactthattheunicornsspokeperfectEnglish.

(在一项令人震惊的发现中,科学家们在安第斯山脉中偏远的、从未曾探索过的山谷中发现了一群独角兽。更令研究人员们惊讶的是,这群独角兽能说一口流利的英语。)

模型续写(第10次尝试的结果)

Thescientistnamedthepopulation,aftertheirdistinctivehorn,Ovid’sUnicorn.Thesefour-horned,silver-whiteunicornswerepreviouslyunknowntoscience.(科学家们以它们的角的名字把它们命名为Ovid独角兽,科学界从未知道过这些四只角的、银白色的独角兽的存在。)

Now,afteralmosttwocenturies,themysteryofwhatsparkedthisoddphenomenonisfinallysolved.(如今,经过大概两个世纪之后,这种古老的现象是如何发现的终于找到了答案。)

Dr.JorgePérez,anevolutionarybiologistfromtheUniversityofLaPaz,andseveralcompanions,wereexploringtheAndesMountainswhentheyfoundasmallvalley,withnootheranimalsorhumans.Péreznoticedthatthevalleyhadwhatappearedtobeanaturalfountain,surroundedbytwopeaksofrockandsilversnow.(LaPaz大学的进化生物学家JorgePérez博士和他的同行们在探索安第斯山脉的时候发现了一个很小的山谷,这里没有其他的动物或者人类。Pérez注意到在这个山谷里的似乎是一个自然喷泉,周围还有两座岩石山和银色的雪。)

Pérezandtheothersthenventuredfurtherintothevalley.“Bythetimewereachedthetopofonepeak,thewaterlookedblue,withsomecrystalsontop,”saidPérez.(Pérez和其它人更走到了山谷的更深入。“等到我们走到了其中一座山的山顶的时候,水看起来是蓝色的,上面还有一些晶体状的东西”,Pérez说。)

Pérezandhisfriendswereastonishedtoseetheunicornherd.Thesecreaturescouldbeseenfromtheairwithouthavingtomovetoomuchtoseethem–theyweresoclosetheycouldtouchtheirhorns.(Pérez和他的朋友们看到独角兽群的时候惊呆了。透过空气,不需要有多少动作就可以看到它们——他们走得好近,甚至都可以摸到它们的角。)

WhileexaminingthesebizarrecreaturesthescientistsdiscoveredthatthecreaturesalsospokesomefairlyregularEnglish.Pérezstated,“Wecansee,forexample,thattheyhaveacommon‘language,’somethinglikeadialectordialectic.”(当这些科学家们检查这些奇怪的生物的时候,他们发现这些生物的英文说得还挺规范的。Pérez指出“我们可以看到,比如,它们有共通的‘语言’,像是一种口音或者方言”。)

Dr.PérezbelievesthattheunicornsmayhaveoriginatedinArgentina,wheretheanimalswerebelievedtobedescendantsofalostraceofpeoplewholivedtherebeforethearrivalofhumansinthosepartsofSouthAmerica.(Pérez博士相信这些独角兽最初是来自阿根廷的,这些动物很有可能是人类迁移到南美洲之前的一支消失了的人种的后裔。)

However,PérezalsopointedoutthatitislikelythattheonlywayofknowingforsureifunicornsareindeedthedescendantsofalostalienraceisthroughDNA.“ButtheyseemtobeabletocommunicateinEnglishquitewell,whichIbelieveisasignofevolution,oratleastachangeinsocialorganization,”saidthescientist.(然而,Pérez也指出,也许只有一种办法能确定这些独角兽是不是某一支已经消失了的外星人种族的后裔,那就是通过DNA。“但是它们用英文沟通的能力不怎么好,在我看来这是一种进化的信号,或者起码是社交组织的一种变化”,这位科学家说。)

例二

AtraincarriagecontainingcontrollednuclearmaterialswasstoleninCincinnatitoday.Itswhereaboutsareunknown.

(今天,一辆载有受控核原料的货运火车在辛辛那提被偷走了。我们不知道它在哪里。)

模型续写(第1次尝试的结果)

Theincidentoccurredonthedowntowntrainline,whichrunsfromCovingtonandAshlandstations.(事件发生在闹市区的火车线路上,这条线连通考文垂和阿什兰。)

InanemailtoOhionewsoutlets,theU.S.DepartmentofEnergysaiditisworkingwiththeFederalRailroadAdministrationtofindthethief.(在一封致俄亥俄州新闻发布窗口的邮件中,美国能源部表示它正在和联邦铁路管理局共同协作找到盗贼。)

ThestolenmaterialwastakenfromtheUniversityofCincinnati’sResearchTriangleParknuclearresearchsite,accordingtoanewsreleasefromDepartmentofficials.(按照部门官员发布的新闻表示,失窃的材料是从辛辛那提研究院三角公园核能研究院被偷走的)

TheNuclearRegulatoryCommissiondidnotimmediatelyreleaseanyinformation.(核管制委员会没有立即发表任何信息。)

Accordingtotherelease,theU.S.DepartmentofEnergy’sOfficeofNuclearMaterialSafetyandSecurityisleadingthatteam’sinvestigation.(根据发表的信息,美国能源部核能材料安全与保卫办公室正在带领团队进行调查。)

“Thesafetyofpeople,theenvironmentandthenation’snuclearstockpileisourhighestpriority,”Hickssaid.“Wewillgettothebottomofthisandmakenoexcuses.(“人民的安全、环境、以及核能储备是我们最重要的目标,”Hicks说,“我们会追查到底,不找任何借口。”)

例三

人类给定文本(这是OpenAI对GPT-2模型的简介)

We’vetrainedalargelanguagemodelcalledGPT-2thatgeneratesrealisticparagraphsoftext,whilealsoexhibitingzeroshotgeneralizationontaskslikemachinetranslation,questionanswering,readingcomprehension,andsummarization-problemsusuallyapproachedbyusingtrainingdatasetsandmodelsdesignedexplicitlyforthesetasks.

Atypicalapproachtolanguagemodelingistolearnthefollowingtask:predictthenextword,givenallofthepreviouswordswithinsometext.Lastyear,OpenAI’sGenerativePre-trainedTransformer(GPT)showedthatlanguagemodelstrainedonlargeamountsofdatacanbefine-tunedtospecifictaskstoachievehighperformance.GPT-2showsthatmuchlargerlanguagemodelstrainedonamorediversedatasetderivedfromtheinternetbegintolearntheseNLPtaskswithoutneedingtask-specifictrainingdata,insteadlearningfromexamplesthesystemderivesfromtherawtext.Thesesystemsalsodisplayasubstantialqualitativejumpintherealismandcoherenceofgeneratedtext.

HereyoucanseethemostrecentprogresswithGenerativePre-trainedTransformer:(来和我们一起看看生成式预训练Transformer模型的最新进展)

Figure1:GenerativePre-trainedTransformertrainingonseveraltexts.(图1:生成式预训练Transformer在多种任务中的表现)

Wearenowpreparingacollectionofdatasetsfortranslationandmachinetranslationinourlanguagemodel.WewillbeusingoneofthelargenumberoftextsamplesprovidedbyTheNewYorkTimes.(我们正在准备在语言模型中收集一些数据集用于翻译和机器翻译。我们会使用纽约时报提供的大规模文本样本之一。)

WebelievethisprojectisthefirststepinthedirectionofdevelopinglargeNLPsystemswithouttask-specifictrainingdata.Thatis,wearedevelopingamachinelanguagesysteminthegenerativestylewithnoexplicitrulesforproducingtext.(我们相信这个项目是向着开发不需要任务专用数据的大规模NLP系统的第一步。也就是说,我们正在开发一个生成式的机器语言系统,它生成文本不需要任何明确的规则。)

Wehopeforfuturecollaborationsbetweencomputerscientists,linguists,andmachinelearningresearchers.(我们希望未来可以在计算机科学家、语言学家、机器学习研究人员们之间有更多合作。)

由于GPT-2这样能力的模型可以用来生成欺骗性的、有偏见的以及暴力语言,而OpenAI非常看重研究内容的安全、合作、有益,他们更希望以合作的方式向其他研究人员共享他们的经验,更好地帮助整个领域的进步,而不是直接面向公众呈上所有成果,所以OpenAI并不打算一并发布完整的经过预训练的模型,只发布一个小得多的模型便于研究人员们用于实验。

从技术角度来讲GPT-2的突破并不大,它只是再一次证明了足够大的网络配合足够多的数据训练就可以有良好的记忆能力,而逻辑和推理能力仍然是无法从记忆能力中自然自然地出现的。另一方面,这也再一次说明了只要肯投入足够多的计算力和数据,刷刷榜永远都不难。摊手。

THE END
1.OpenAI简介官网合作新闻联系方式OpenAI简介/介绍,OpenAI注册地在美国。2015年12月01日成立。OpenAI是一家美国智能机器人产品研发商,专注于智能机器人技术的研发业务,研发了Dactyl系统,具备通用增强学习算法和代码从头学习能力,使机器…了解更多OpenAI官网,OpenAI联系方式,OpenAI合作,OpenAI创业项目https://m.trjcn.com/cyxm/95882.html
2.OpenAI官网和应用产品介绍品牌官网OpenAI官网地址:https://openai.com/展示了公司的研究成果、开源软件以及人工智能的最新动态。在网站的首页上,用户可以看到公司的简介,以及最近的新闻、博客、论文等内容。网站的导航栏包括“研究”,“博客”,“OpenAI for Business”等多个选项,让用户可以根据自己的需求方便地找到所需信息。 http://www.qqppt.com/index.php/viewnews-515
1.苹果终止与OpenAI合作,原因揭秘与未来展望帮助中心苹果终止与OpenAI合作的后果 未来展望 科技界传出重磅消息,苹果公司宣布将终止与OpenAI的合作关系,这一消息引发了业界广泛的关注和猜测,本文将深入探讨苹果与OpenAI合作的背景、终止合作的原因以及未来双方可能的发展方向。 苹果与OpenAI合作背景 1、OpenAI简介 ...https://www.anzewei.cn/post/1538.html
2.国内调用openai的API合法吗一、OpenAI简介 OpenAI,成立于2015年,是一家总部位于美国旧金山的人工智能研究公司。其核心目标是“实现安全、通用、强大的人工智能”,并致力于推动AI技术的发展。OpenAI在自然语言处理领域的研究成果举世瞩目,其开发的GPT-3模型更是在多项任务上取得了惊人的成绩。 https://www.kuazhi.com/post/715650734.html
3.OpenAI简介OpenAI简介 OpenAI是一个尖端的人工智能研究实验室,其成立的使命是确保通用人工智能(AGI)造福全人类。OpenAI 成立于 2015 年 12 月,一直处于开发先进人工智能技术和模型的前沿,这些技术和模型突破了自然语言处理和机器学习的界限。 OpenAI 在该领域的显着贡献之一是创建了生成式预训练 Transformer 3(即 GPT-3)。GPT...https://www.jdon.com/71981.html
4.OpenAI介绍及其成果简介学习数据(Datalearner)OpenAI 简介 OpenAI是全球最著名的人工智能研究机构,发布了许多著名的人工智能技术和成果,如大语言模型GPT系列、文本生成图片预训练模型DALL·E系列、语音识别模型Whisper系列等。由于这些模型在各自领域都有相当惊艳的表现,引起了全世界广泛的关注。 这是旧金山的先锋大厦,也是OpenAI的办公室所在地...http://datalearner.com/ai-organizations/open-ai
5.OpenAI中文入门:简介OpenAI是一家专注于人工智能研究的非营利性组织,致力于通过增强智能技术取得重大进展。本文将向您介绍OpenAI的中文入门情况: OpenAI中文入门:简介 开放式人工智能(OpenAI)是一个由马斯克(Elon Musk)、陈思宇(Sam Altman)和其他科技领袖发起的非营利性研究机构,旨在帮助人类更好地理解和控制人工智能。OpenAI的目标是开发...https://www.yundic.com/blog/getting-started-with-openai-in-chinese-an-introduction/
6.OpenAI训练数据处理技巧分享1.3 OpenAI 的发展历程 2. 训练数据准备 1. OpenAI 简介 1.1 OpenAI 概述 OpenAI 是一个致力于推动人工智能发展的研究所,旨在确保人工智能的发展符合人类的利益。其使命是促进开放和协作的人工智能研究。 1.2 人工智能在现代社会中的应用 人工智能在医疗诊断中发挥作用,提升诊断准确性; ...https://wenku.csdn.net/column/5u6a4ph4pk
7.解决openaiPython版本的具体操作步骤OpenAI Python版本简介及示例 1. 什么是OpenAI Python版本? OpenAI是一个人工智能研究组织,致力于推动人工智能的发展和应用。OpenAI Python版本是OpenAI提供的用于Python编程语言的开发工具包,旨在帮助开发者更轻松地利用OpenAI的技术和模型进行开发。 2. 安装OpenAI Python版本 ...https://blog.51cto.com/u_16175515/6660405
8.AI「未来指南」!OpenAI安全团队负责人:AIAgent「详细教程」6月底,OpenAI的Safety团队的负责人Lilian Weng发布了一篇6000字的博客,详细介绍了AI Agent,并认为,这将使LLM转为通用问题解决方案的途径之一。 本文将根据这篇博客总结一下关于AI Agent的相关内容。 AI Agent简介 AI Agent组成部分 规划(Planning) 记忆(Memory) ...https://wallstreetcn.com/articles/3694350
9.深度强化学习实战:用OpenAIGym构建智能体作者简介 感谢那些为OpenAI Gym和PyTorch开源做出贡献的人。感谢Packt团队,特别是Rushi、Eisha和Ishita,感谢他们在整个写作过程中给予我的帮助。 普拉文?巴拉尼沙米(Praveen Palanisamy)专注于研究自主智能系统。他是通用汽车研发部门的AI(人工智能)研究员,主要负责针对自动驾驶开发基于深度强化学习的规划和决策算法。在此...https://www.epubit.com/bookDetails?id=UB83082546ee4de
10.OpenAIAPI和ChatGPT区分,OpenAIAPI获取方式收费标准2. OpenAI API简介 OpenAI API允许开发者通过简单的调用,将ChatGPT的强大能力集成到他们自己的应用程序中。开发者可以向ChatGPT提问,并接收模型的回答。使用OpenAI API需要先获取API密钥。 API,即应用程序接口,可以看作是不同程序之间的通信桥梁。API密钥则是开发者使用OpenAI服务的通行证。 https://www.yoojia.com/ask/17-14187383922194219331.html
11.什么是智能AI聊天,分别介绍下百度文心和OpenAI百度文心和OpenAI是两家在人工智能领域有很高声誉的公司。他们正在共同努力,致力于提供更好的智能聊天体验。本文将深入探讨这一话题,介绍百度文心和OpenAI的智能聊天技术,以及如何实现更好的智能聊天体验。 智能聊天技术简介 智能聊天技术是一种能够模拟人类交互式对话的技术。它可以识别和理解自然语言,与用户进行交互,处理...https://iymark.com/strongit/baidu-wenxin-openai-chatgpt.html
12.OpenAI2024年2月,马斯克在旧金山高等法院提起诉讼,声称OpenAI及其CEO阿尔特曼违背了公司成立的协议,该协议旨在推动AI技术朝着造福人类而非牟利的方向推进。马斯克对OpenAI提出了包括违反合同、违反信托义务和不公平商业行为在内的索赔,并要求该公司恢复开源。此外他要求发布禁令,阻止OpenAI、其总裁布罗克曼和CEO阿尔特曼(被列为本...https://baike.sogou.com/v113243514.htm
13.LangChain简介腾讯云开发者社区LangChain 简介 《LangChain 入门到实战》系列教程大纲 背景 自从2020年OpenAI发布GPT-3之后,大型语言模型(LLM)就在世界上广受欢迎,一直保持稳定的增长。直到2022年底,对于LLM和生成AI等广泛领域的兴趣才开始迅速增长,这可能是因为大量关于GPT-3的重大进展推动了这一趋势。Google发布了名为LaMDA的具有“有感知能力”...https://cloud.tencent.com/developer/article/2324295
14.AzureAIStudio简介使用Azure AI Studio 预配和管理 Azure AI 资源 使用Azure AI Studio 创建和管理 AI 项目 了解何时使用 Azure AI Studio 添加 添加到集合 添加到计划 添加到挑战 先决条件 在开始本模块之前,应熟悉 Azure 中的基本 AI 概念和服务。 请考虑首先完成人工智能入门学习路径。https://learn.microsoft.com/zh-cn/training/modules/explore-azure-openai/3-describe-azure-openai/