tokenpocket钱包下载官网|openai公司
OpenAI_百度百科
AI_百度百科 网页新闻贴吧知道网盘图片视频地图文库资讯采购百科百度首页登录注册进入词条全站搜索帮助首页秒懂百科特色百科知识专题加入百科百科团队权威合作下载百科APP个人中心OpenAI播报讨论上传视频美国人工智能研究公司收藏查看我的收藏0有用+10OpenAI,是一家位于美国旧金山的人工智能研究公司,现由营利性公司OpenAI LP及非营利性母公司OpenAI Inc组成 [34]。核心宗旨在于“创建造福全人类的安全通用人工智能(AGI)” [65]。使命是建立安全有益的AGL [123],确保通用人工智能造福全人类 [66]。OpenAI以大模型为核心开创了AI领域的新一轮创新范式,成为引领通用人工智能领军企业 [34],在福布斯2023云计算百强榜位列榜首。 [55]OpenAI最早为非营利组织 [34],于2015年底由包括萨姆·奥尔特曼(Sam Altman)、彼得·泰尔(Peter Thiel)、里德·霍夫曼(Reid Hoffman)和埃隆·马斯克(Elon Musk)等创办 [5-6]。随着2018年埃隆·马斯克的退出以及大模型对资金超乎预期的需求,2019年3月,OpenAI从非营利性转变为“封顶”的营利性。同年7月,微软与OpenAI合作,注资10亿美元,共同研发新的Azure AI超算技术 [34];截至2023年12月,微软是OpenAI最大的投资者,拥有49%的股份 [49]。2016年,发布首个产品,即一款开源强化学习工具包—OpenAI Gym和Universe。2021年,设立初创企业基金,拟投资1亿美元支持AI初创公司 [34]。2022年11月30日,OpenAI全新聊天机器人模型ChatGPT问世,给AIGC的应用带来了更多的希望,产品上线仅5天用户数量突破100万 [50]。2024年2月,文生视频大模型Sora问世 [118],在全球内容创作行业卷起新的风暴,成为人工智能发展进程中的“里程碑”,预示着AGI将加速到来 [120]。2023年,公司收入突破16亿美元 [127]。2024年2月,因Sora的爆火使OpenAI估值不到10个月增加近两倍,或达800亿美元。 [129]最新新闻Altman重返OpenAI董事会5小时前3月9日,OpenAI首席执行官Sam Altman重返这家人工智能公司的董事会。比尔及梅琳达·盖茨基金会前负责人Sue Desmond-Hellmann、前索尼娱乐高管Nicole Seligman和Instacart首席执行官Fidji Simo也将进入董事会。...详情内容来自公司名称美国开放人工智能研究中心 [20]外文名OpenAI [20]所属行业人工智能研究成立时间2015年12月11日总部地点美国旧金山 [4]公司类型人工智能 [20]员工数770 人 [130](截至2023年11月)CEO萨姆·阿尔特曼(Sam Altman) [24] [30]CTO米拉·穆拉蒂(Mira Murati)总 裁格雷格·布罗克曼(Greg Brockman) [47]代表产品ChatGPT目录1公司发展▪早期发展▪转型期▪发展期▪财务状况2价值理念▪哲学思想▪核心目的▪公司使命▪企业文化3公司治理▪融资结构▪管理架构▪人员架构4对外合作▪与微软合作▪市场回应▪与施普林格▪与淡马锡▪与政府合作5团队管理▪管理模式▪合作模式▪研究团队▪应用团队▪招聘策略▪工作方法6主要产品▪ChatGPT▪GPTs▪Assistants API▪Sora7产品管理▪发布策略▪研发策略▪服务条款8风险管理▪风险评估▪网络安全风险▪CBRN风险▪说服能力风险▪模型自主性风险9企业事件▪涉投诉▪涉诉讼▪被调查▪提起诉讼▪回应质疑▪应用问题▪重组风波▪暂停账户▪监管升级▪商标注册10所获荣誉11竞争对手▪中国▪其他国家公司发展播报编辑早期发展2015年12月11日,OpenAI由埃隆·马斯克、美国创业孵化器Y Combinator总裁萨姆·奥尔特曼 [52]、全球在线支付平台PayPal联合创始人彼得·蒂尔等硅谷科技大亨创立。 [2]OpenAI最早作为非营利组织。2015年底,由Elon Musk、萨姆·奥尔特曼和其他投资者成立 [34]。埃隆·马斯克(Elon Musk)与其他硅谷科技大亨进行连续对话后,决定共同创建OpenAI,希望能够预防人工智能的灾难性影响,推动人工智能发挥积极作用。特斯拉电动汽车公司与美国太空技术探索公司SpaceX创始人埃隆·马斯克、Y Combinator总裁萨姆·阿尔特曼、天使投资人彼得·泰尔(Peter Thiel)以及其他硅谷巨头2015年12月份承诺向OpenAI注资10亿美元。 [1]2016年6月21日,OpenAI宣布了其主要目标,包括制造“通用”机器人和使用自然语言的聊天机器人。OpenAI研发主管伊利娅·苏特斯科娃(Ilya Sutskever)、OpenAI CTO格雷格·布劳克曼(Greg Brockman)硅谷知名创业加速器Y Combinator总裁萨姆·奥尔特曼 [52](Sam Altman)以及连续创业家埃隆·马斯克(Elon Musk)等人联合发表博文称:“我们正致力于利用物理机器人(现有而非OpenAI开发)完成基本家务。” [1]2016年,发布首个产品,即一款开源强化学习工具包——OpenAI Gym和Universe。2016年4月27日,发布OpenAI Gym Beta;12月5日,发布Universe。2017年,“情绪神经元”和OpenAIFive项目的突破,使得OpenAI开始关注大型语言模型(LLM)和参数规模,实现AGI的信念增强。 [34]7月20日,发布Proximal Policy Optimization算法。转型期由非营利组织转向混合结构2018年,随着Elon Musk的退出,以及大模型对资金超乎预期的需求,2019年3月,OpenAI从非营利性转变为“封顶”的营利性。在非营利母公司主体下,创建了一个限制性营利实体OpenAI LP,引入了上限利润模式,允许OpenAI LP合法地吸收风险投资和员工持股。OpenAI转向了混合结构:由营利性公司OpenAI LP及非营利性母公司OpenAI Inc组成。 [34]2019年7月,微软(Microsoft [56])宣布与OpenAI开展为期多年的合作。微软投资OpenAI10亿美元,双方将携手合作替Azure云端平台服务开发人工智能技术。微软也成为OpenAI的独家云供应商和OpenAI新AI技术商业化的首选合作伙伴。微软的加持使得OpenAI的大模型开发如虎添翼。设立创业基金,由投资模式转向孵化器模式2021年5月,OpenAI 官方宣布了成立1亿美元的人工智能创业基金,该基金将由OpenAI 管理,并由微软和其他OpenAI 合作伙伴投资,计划投资1亿美元来帮助更多AI初创公司。投资方向:少数早期阶段的创业公司,且处于可以产生变革性影响的领域,如医疗保健、气候变化和教育以及基于生产力的人工智能工具。 [34] [87]OpenAI通过“资金+技术+战略”支持的方式,支持优质的AI初创公司;反过来,被投公司成长起来后,增加OpenAI产品落地的场景需求和产业知识,从而反哺基础技术创新。这一模式使得OpenAI可以超前把握未来颠覆性技术的机会,并超前投资布局未来产业。这一转变让OpenAI的投资模式变为孵化器模式,从而更加高效地对目标企业进行投资与技术支持。从而有条件开始自己的第二阶段战略:通过“资金+技术”投资初创企业的方式积极布局,为嵌入未来海量应用场景和指数型、裂变式增长铺路。 [89]OpenAI转型期研发动态2018年2月20日,研究防止恶意使用AI;2018年4月9日,发布OpenAI宪章;2018年7月30日,强化学习技巧;2019年2月14日,提升语言模型GPT-2模型;2019年3月11日,开放人工智能有限合伙人;2019年4月15日,OpenAI五人击败Dota 2世界冠军;2019年4月25日,发布深度神经网络MuseNet;2019年8月20日,跟进GPT-2;2019年9月17日,研究多代理交互中的紧急工具使用;2019年10月15日,研究用机械手解魔方;2019年11月5日,发布GPT-2:1.5B版本;2020年4月30日,发布神经网络Jukebox;2020年6月11日,开放人工智能应用程序接口;OpenAI宣布了GPT-3语言模型,微软于2020年9月22日取得独家授权;2021年1月5日,研究连接文本和图像神经网络CLIP;2021年1月5日,研究从文本创建图像神经网络DALL·E;2021年3月4日,研究人工神经网络中的多模式神经元;2021年8月10日,发布开放人工智能法典;2022年4月6日,发布新的人工智能系统DALL·E 2。发展期主要历程2022年11月30日,OpenAI发布ChatGPT全新聊天机器人模型。 [26]ChatGPT这一款革命性产品的上线引爆全球,成为用户破亿速度最快的消费级应用。全年营收达到2800万美元。2023年2月16日消息,OpenAI买下了超优质域名AI.com,并将其链接跳转到了ChatGPT [7]; 同年3月,GPT登陆Bing,对搜索引擎带来革命性重构。根据外媒TheInformation报道,OpenAI创始人最近对员工透露,其年营收达到了13亿美元,也就是同比增长超过45倍。OpenAI逆袭成全球AI“新王”,开启的新一轮AI革命的大幕。 [34]2023年7月26日,安卓版ChatGPT在美国、印度、孟加拉国和巴西提供下载 [15]。美国当地时间2023年8月16日,OpenAI宣布收购初创企业Global Illumination,后者的整个团队已加入OpenAI,共同开发包括ChatGPT在内的核心产品。 [41]同年,9月14日,OpenAI宣布将在爱尔兰都柏林开设办公室,这将是该公司的第三个办事处。 [42]当地时间2023年5月18日,在美国地区推出ChatGPT的首个官方移动应用程序ChatGPT APP [12],5月19日跃升美国地区iOS APP Store(应用程序商店)排行榜首位。分析人士指出,此举将快速开启GPT大模型在垂直领域的应用,加速行业应用 [59]。2023年5月,OpenAI开放众多插件(当时已有70个),让用户得以利用插件组合满足个性化需求,成为了OpenAI创建生态系统、从产品思维转变至平台思维的标志性事件。2023年11月在首届OpenAI开发者大会上,OpenAI首席执行官萨姆·奥尔特曼回顾了公司过去一年的发展历程,已经有200万开发者正在使用OpenAI的API(应用程序接口),在全球各地提供多种多样的服务;92%的财富500强公司正在使用OpenAI的产品搭建服务,而ChatGPT的周活用户数也达到1亿人。奥尔特曼向全球开发者和ChatGPT用户展示了AI龙头即将推出的一系列产品更新: [58]一是,GPT模型再迭代,OpenAI将推出GPT-4 Turbo;二是OpenAI开始向AI个人助理的方向努力;三是宣布将上线一个GPT商店,OpenAI允许用户申请上线自己制造的GPT,并承诺根据GPT的使用情况向创建者支付费用。 [60]重大融资2023年1月OpenAI从微软公司筹集了100亿美元。据福布斯发布2023云计算100强榜单,2023年云计算100强企业的平均融资金额为8.05亿美元,高于一年前的6.1亿美元,其中原因包括了OpenAI的重大融资活动。 [55]OpenAI发展期研发动态2022年11月30日,研究ChatGPT:优化对话的语言模型。2023年,开放人工智能公司(OpenAI)GPT-4迎来“首秀” [35]。2023年2月2日,OpenAI宣布推出ChatGPT Plus订阅服务,可以让用户在高峰期优先使用人工智能聊天机器人ChatGPT。 [3]2023年3月发布的GPT-4。 [58]2023年5月,OpenAI推出了ChatGPT的iPhone应用程序ChatGPT APP。这款应用是ChatGPT的首个官方移动应用程序。 [12]5月25日,OpenAI在推特宣布,ChatGPT官方App现已在更多地区的App Store上线。 [36]2023年7月,OpenAI宣布,ChatGPT推出定制指令功能。 [37]2023年7月26日,OpenAI通过其官方推特宣布,安卓版ChatGPT在美国、印度、孟加拉国和巴西提供下载,并计划将其推广至更多国家。 [15] [38-39]当地时间2023年8月15日,OpenAI官宣,将GPT-4用于内容策略开发和内容审核决策,以实现更一致的标签、更快的策略优化的反馈闭环以及更少的人工审核人员参与。 [40]当地时间8月28日,OpenAI在官网宣布推出企业版ChatGPT。 [18]当地时间2023年10月3日,微软在官网宣布,OpenAI最新的DALL-E 3模型现已面向所有Bing Chat和Bing Image Creator用户开放。 [43]萨姆·奥尔特曼在首届OpenAI开发者大会 [58]当地时间2023年11月6日,首届OpenAI开发者大会。 [44]在OpenAI 首届开发者大会开启前,ChatGPT 各种爆料已出,全新 UI 界面,人人可定制 GPT,将引领「智能体工程师」新职业诞生 [19]OpenAI首席执行官萨姆·奥尔特曼向全球开发者和ChatGPT用户展示了AI龙头即将推出的一系列产品更新。同日,OpenAI在官网宣布推出自定义版本ChatGPT [44],解禁了 ChatGPT 两大能力,一是上传多种类型文档,二是无需转换即可使用所有工具 [51]。2023年11月22日,OpenAI宣布ChatGPT Voice功能向所有用户开放。ChatGPT Voice是使用 OpenAI 的语音技术Whisper创建的,该技术只需分析几秒钟的真人语音即可生成无限小时的对话。Spotify正在使用OpenAI 的语音技术将Lex Friedman、Dax Shephard和其他播客的内容翻译成西班牙语、法语和德语。 [64]北京时间12月14日凌晨,CEO萨姆·奥尔特曼在X平台发文称,已重新开放ChatGPT Plus订阅 [82],在此前11月15日CEO 萨姆·奥尔特曼在X平台发文称,将暂停ChatGPT Plus新用户注册。 [86]当地时间2024年1月10日,OpenAI宣布推出GPT商店和ChatGPT Team服务 [108],ChatGPT Team和GPT Store都是OpenAI公司新的收入驱动力。 [110]发布首款文本生成视频大模型。2024年2月16日,OpenAI公布了一种新的人工智能系统Sora(“文字生成视频”大模型),使其成为最新一家采用生成视频技术的人工智能公司。用户仅需输入简短一句话,Sora可以生成一段长达60秒的视频,远远超过市面同类型级别的AI视频生成时长。 [112-113] [120]在Sora发布的同时,OpenAI宣布一项要约售股交易,由此OpenAI整体估值高达800亿美元,一年内飙升两倍多。 [120]财务状况收入状况报道机构及时间统计时间报告内容金额主要来源CNBC2023年12月13日2022年OpenAI非营利组织收入44485美元几乎全部来自投资收入The Information2023年8月2022年OpenAI全年收入2800万美元受益于ChatGPT中国经营报2024年3月1日2023年年化收入(月收入x12)超16亿美元一是软件开发者调用API,向其支付流量费用;二是ChatGPT Plus会员订阅费用;三是从微软销售OpenAI模型的收入中分成。 [127]财务现状OpenAI披露的收入并不包含营利部门的收入,而ChatGPT正在积极变现。根据OpenAI的融资信息, OpenAI的估值超过860亿美元。OpenAI的财务状况是一个黑匣子。OpenAI的非营利地位受到了批评者的批评,他们质疑一家价值860亿美元的公司如何能由慈善机构控制。这也是2023年11月,OpenAI出现人事动荡的部分原因。 [88]2024年1月,据The Information报道,受益于降价之后用户数强劲增长,OpenAI驶入商业化快行线,2023年底的年化收入(月收入x12)已突破16亿美元。OpenAI估值也水涨船高,正筹划新一轮融资,公司估值已达1000亿美元,成为SpaceX之后美国估值第二高的创业公司。全球范围内的估值排名位列第三。 [128]价值理念播报编辑哲学思想(主词条 :有效利他主义)英国哲学教授威廉·麦克阿斯基尔是有效利他主义运动的创始人 [28]有效利他主义(Effective Altruism),最初是慈善领域的一个相对简单的想法:在最有效的地方捐款,而不是仅仅为了“温暖的光辉”而无效地捐款。英国哲学教授威廉·麦克阿斯基尔(William MacAskill)是有效利他主义运动的创始人。鉴于以功利主义数学为基础,该运动开始吸引来自大型科技公司的支持者,他们开始进一步推动这一逻辑。当可通过赚更多钱来增加捐款数额时,为什么只关注捐赠的钱呢?这种逻辑表明,如果你有能力,在对冲基金或大型科技公司工作并进行捐赠比为慈善机构工作更道德。逻辑进一步推演,将信奉有效利他主义的人指向两件事:星际定居(这样人类就可以在地球灭绝事件之后生存)和通用人工智能(AGI)——人工智能的超级智能版本,如果正确“对齐”,可以为人类谋福利,极大地提高我们生存的长度和质量。这就是OpenAI应该发挥作用的地方。 [28]核心目的OpenAI成立之初是一个真正的非营利组织,核心目的就是确保通用人工智能(AGI)安全引入。官网上都明确了OpenAI的目标是“确保人工智能造福全人类”。 [29]公司使命OpenAI 的使命是确保人工智能(AGI)造福全人类。所谓 AGI,指的在最具经济价值的工作中胜过人类的高度自主系统。这一使命体现在 OpenAI 公司章程中。在产品讨论中有策略地使用了“在这些选项中,哪一个让我们感觉更接近AGI”这一短语,有助于决定打造什么、和因为使命而决定放弃。明确的重点永远是速度的驱动力。使命有助于保持专注,也为许多新想法铺平了道路。 [27]企业文化在企业文化塑造方面,OpenAI将AI安全作为企业文化的核心部分,并在日常研发中贯彻这一理念。其通过与公众的沟通和交流,强化了社会对AI安全问题的认知和理解。 [89]公司治理播报编辑融资结构初始资金-捐赠OpenAI初始资金是由企业家们捐赠,包括OpenAI创始人萨姆·奥尔特曼(Sam Altman),也包括埃隆·马斯克的1亿美元 [29]。资助者似乎承诺在该组织的发展过程中向该组织提供数十亿美元,因此它不需要担心支付该项目的账单。由于各种原因,包括性格冲突和方向差异——这种“纯粹”的非营利模式并没有持续多久,OpenAI原本以为可以从埃隆·马斯克那里得到的钱也枯竭了。 [28]资金-混合结构 2019年,Altman的任务就是找钱,这使得OpenAI需要尝试吸引商业参与者的投资,OpenAI转向了混合结构。 [29]希望一家公司能够给他们带来回报。在Altman领导的一系列举措中,OpenAI转向了混合结构,然而,投资者被警告说,他们应该考虑到OpenAI可能永远不会产生利润,该公司不会主要专注于实现利润,而且他们最好认为,任何投资都更接近于捐赠,而不是产生回报。为寻求融资,OpenAI在母公司OpenAI Inc.下,成立了子公司OpenAI global,其中微软的投资换取了OpenAI global高达49%的股份。作为交换,投资者可以预期的回报规模有一个相对慷慨的上限:即他们投入的100倍。因此,投资了10亿美元的微软最多可以期望1000亿美元的回报。 [28]管理架构董事会OpenAI的使命是打造一种造福人类的技术,早期是一家非营利机构;2019年OpenAI转型为一家营利性公司,不过它仍然由一个非营利性的董事会管理。 [67]微软成为OpenAI最大的投资者,但是在OpenAI董事会没有席位,甚至创始人萨姆·奥尔特曼本人也没有该公司的任何股权——这对于该行业来说几乎是闻所未闻的情况。从理论上讲,该模式将吸引志同道合的投资者,愿意接受极其不寻常的治理情况,这将有助于公司专注于其使命。 [28]OpenAI的组织结构。 [28]一方面,董事会拥有任免CEO的权力,但包括Altman在内,董事会成员不持有母公司股份,OpenAI理论上不存在沦为内部人控制的公司的危险;另一方面,投资者是子公司(也是母公司的运营主体)的大股东,却在公司董事会没有席位,做到了与经营隔离,仅仅是战略投资者。 [29]OpenAI试图建立一家大型科技初创公司,而创始人/首席执行官Altman并未拥有无懈可击的权力。 [28]根据OpenAI官方说明,董事会的多数成员是相互独立的,各自有不同的背景和专业领域,共同决策和指导OpenAI的发展方向。而从董事会构成来看,奥尔特曼、布洛克曼和苏茨克维与公司具有最直接的联系,而另外三个则有其他社会任职。 [31]OpenAI发布公告 [105]2023年12月20日,OpenAI发布公告:将建立专门小组,来监督技术工作和安全决策的操作结构,公司管理层做决策,董事会有权推翻。 [105]安全顾问团当地时间2023年12月18日,OpenAI发布新安全指南,阐释公司计划如何应对最强大人工智能(AI)系统可能引起的极端风险。在该指南下,OpenAI只会在确定最新技术的安全性之后才会开始运用。公司加强其内部安全流程,将成立一个顾问团队以审核安全报告,再转交公司高层和董事会,并赋予董事会对高风险人工智能的否决权。 [99]团队和流程 [105]安全顾问团负责按月同时向公司管理层和董事会汇报,确保所有决策者充分了解情况。对于不同时间尺度的AI风险,OpenAI成立了三个团队来分别应对:安全系统团队(Safety Systems)负责当下,减少现有模型如ChatGPT的滥用。准备团队(Preparedness)负责不久的将来,识别和管理GPT-5等正在开发的前沿模型带来的新风险,由MIT教授Aleksander Madry领导。三个安全小组应对内容 [105]超级对齐团队(Superalignment)负责遥远的未来。 [105]人员架构2022年6月,量子计算专家、ACM计算奖得主Scott Aaronson宣布,将加盟公司。 [2]2023年早些时候,OpenAI董事会成员从9人缩减至6人,其中:萨姆·奥尔特曼、伊尔亚·苏茨克维以及OpenAI总裁格雷格·布罗克曼(Greg Brockman)是该实验室的三位创始人,而其他三人都是独立董事。 [57]2023年11月17日下午,公司董事会宣布首席执行官萨姆·奥尔特曼(Sam Altman)将立即离职。 [28]2023年3月,左:穆拉蒂、奥尔特曼、布罗克曼、苏茨克维尔 [67]2023年11月18日消息,OpenAI原本的董事会成员包括:奥尔特曼、布洛克曼、苏茨克维、Quora首席执行官Adam D’Angelo、技术企业家Tasha McCauley以及乔治城大学安全与新兴技术中心的Helen Toner。其中:奥尔特曼、布洛克曼和苏茨克维都是OpenAI的联合创始人,加上首席技术官米拉·穆拉蒂(Mira Murati),四人构成了OpenAI的核心团队,是ChatGPT-3.5的背后“英雄”。奥尔特曼和布洛克曼的离职,使得苏茨克维成为OpenAI董事会中唯一剩下的创始人。 [31]OpenAI发表声明 [53]2023年11月22日,OpenAI发表声明称:萨姆·奥尔特曼(Sam Altman)将回归OpenAI担任首席执行官。OpenAI组成新初始董事会,三名成员分别是:董事会主席布莱特·泰勒(Bret Taylor)、美国前财政部长拉里·萨默斯(Larry Summers)、问答网站Quora的首席执行官亚当·迪安杰罗(Adam D'Angelo) [30] [49]11月30日,OpenAI宣布,萨姆·奥尔特曼(Sam Altman)已经回归担任首席执行官,米拉·穆拉蒂担任首席技术官,格雷格·布罗克曼担任总裁。 [47]2024年2月13日(当地时间),人工智能研究员、OpenAI创始成员之一安德烈·卡尔帕西(Andrej Karpathy)在社交媒体平台X上发文称,他已离开OpenAI。 [111]经历历程职位人物姓名人物简介人物图片创始团队成员首席执行官/初始资金资助者萨姆·奥尔特曼(Sam Altman)OpenAI联合创始人萨姆·奥尔特曼(1张)首席科学家伊尔亚·苏茨克维(Ilya Sutskever)OpenAI联合创始人伊尔亚·苏茨克维 [69]初始资金资助者埃隆·马斯克(Elon Musk)OpenAI联合创始人。南非出生的美国知名企业家;美国特斯拉汽车公司的CEO兼产品架构师。因创办SpaceX,以及联合创办特斯拉汽车和PayPal(贝宝)而闻名。规划创立了SolarCity公司,是最大股东和董事会主席 [61];推特公司CEO [62];美国神经连接公司(Neuralink)创始人。 [63]埃隆·马斯克 [61]董事会(6人)董事长、总裁格雷格·布罗克曼(Greg Brockman)OpenAI联合创始人。学生生涯中曾获数学、化学等多项国际大奖。在哈佛大学就读一年后转投MIT(麻省理工学院),2010年辍学加入线上支付公司Stripe。2013年,成为Stripe的首位首席技术官,2015年离开公司,并与特斯拉CEO埃隆·马斯克、奥尔特曼一道共同创立了OpenAI。格雷格 • 布罗克曼 [70]董事、CEO萨姆·奥尔特曼(Sam Altman)OpenAI联合创始人。奥尔特曼在布洛克曼2010年加入Stripe期间正好供职于Y Combinator,而Y Combinator正好是Stripe的种子投资方。2015年,与布洛克曼、特斯拉CEO埃隆·马斯克萨姆·奥尔特曼 [72]董事、首席科学家伊尔亚·苏茨克维(Ilya Sutskever)OpenAI联合创始人。2012年多伦多大学毕业后先后在斯坦福大学、多伦多大学、谷歌进行科研工作。2015年加入OpenAI共同创立了OpenAI。伊尔亚·苏茨克维 [70] 独立董事亚当·迪安杰罗(Adam D'Angelo)美版知乎Quora首席执行官。长期与人工智能打交道亚当·迪安杰罗塔莎·麦考利(Tasha McCauley)兰德公司的兼职科学家。曾从事技术和人工智能政策及治理问题的研究,并在奇点大学任教塔莎·麦考利海伦·托纳(Helen Toner)乔治城大学安全与新兴技术中心战略主管。是有效利他主义团体的一员,他们认为人工智能将来会毁灭人类海伦·托纳新初始董事会(2023年11月22日)董事会主席布莱特·泰勒(Bret Taylor)拥有斯坦福大学计算机科学专业硕士学位。 曾任Facebook首席技术官、Salesforce联席首席执行官成员首席执行官萨姆·奥尔特曼(Sam Altman)OpenAI联合创始人萨姆·奥尔特曼成员拉里·萨默斯(Larry Summers) 前民主党财政部长和哈佛大学校长,经济学家。1993年,他因在经济学界的杰出表现获得美国约翰·贝茨·克拉克奖章。第一个获得美国国家科学基金会艾伦·沃特曼奖的社会科学家、美国计量经济学学会会员和美国艺术科学学会成员拉里·萨默斯成员亚当·迪安杰罗(Adam D’Angelo)原董事会成员,前问答网站Quora创始人,Facebook首任CTO亚当·迪安杰罗首席技术官米拉·穆拉蒂(Mira Murati)曾任特斯拉的Model X车型的高级产品经理。2018年加入OpenAI,被称作“ChatGPT之母”,是OpenAI核心团队四名成员之一 [31];主要负责两款产品:一是ChatGPT,二是DALL-E的人工智能系统。2023年11月17日在OpenAI“地震级”人事变动中,原CTO米拉·穆拉蒂补位出任临时CEO;同月30日奥尔特曼回归担任CEO,Mira Murati担任首席技术官。 [68]米拉·穆拉蒂(2张)参考资料: [28] [30-31]对外合作播报编辑与微软合作OpenAI最大投资者自2019年起,微软与OpenAI建立了合作伙伴关系。微软是OpenAI最大的投资者。截至2023年12月,微软已向OpenAI这家人工智能初创公司投资了130亿美元,拥有其49%的股份。微软已将OpenAI的最新技术整合到自己的企业工具套件中,OpenAI也在微软的云服务上投入了大量资金。双方业务合作微软(Microsoft)建立了全球最大的超级计算集群之一,以帮助OpenAI训练规模更大、能力也更强大的人工智能模型。微软的聊天机器人和搜索引擎Bing Chat根据OpenAI的模型构建,首次亮相以来用户使用该机器人已经聊天超过10亿次,能够根据用户提示转化图像的Bing Image Creator生成图像超过10万张。 [56]董事会席位OpenAI在戏剧性的内斗事件之后,组成新初始董事会,微软获得了一个“无投票权观察员”席位,即公司代表可以参加OpenAI的董事会会议并获取机密信息,但在选举或选择董事等事项上没有投票权。这也一定程度意味着微软在OpenAI的后续经营管理中将拥有更大话语权。微软总裁Brad Smith表示:“自2019年以来,微软与OpenAI建立了合作伙伴关系,促进了更多的人工智能创新和竞争,同时保持了两家公司的独立性。而唯一改变的是,微软现在将在OpenAI董事会中拥有一个无投票权的观察员席位,这与谷歌收购DeepMind等案例截然不同。” [49]市场回应CMA主动评估Microsoft和OpenAI的合作关系2023年12月8日消息,英国竞争和市场管理局(CMA)认为,人工智能在市场上的扩张速度是史无前例的,而基础模型的快速发展意味着当前是这一变革性技术发展的关键时刻,人工智能开发商之间需要持续的竞争,这将有助于整个行业的发展,因此需要特别关注微软与OpenAI之间的合作关系。英国反垄断监管机构表示,将审查微软与OpenAI的合作是否导致了“获取控制权”的情况,即一方对另一方具有重大影响力或控制权,如果存在可能导致阻碍行业竞争的问题,那么该机构后续将采取更多针对性行动。 [49]与施普林格2023年12月,新闻出版巨头施普林格出版集团(Axel Springer)与 ChatGPT 开发机构 OpenAI 宣布达成一项史无前例的协议,允许 ChatGPT 对来自 Politico 和 Business Insider 等媒体的新闻文章进行总结摘要。施普林格也成为全球第一家与 OpenAI 合作将新闻业与人工智能技术进行更深入整合的出版机构,这是媒体为在人工智能工具中使用其内容而争取资金补偿的一个重要里程碑。OpenAI 和施普林格的协议生效后,当用户向 ChatGPT 提问时,它将以来自 Politico、Business Insider、Bild 和 Welt 等媒体的新闻文章摘要作为回应。作为协议的一部分,施普林格将为 OpenAI 的大型语言模型(例如支持 ChatGPT 的 AI 模型 GPT-4)提供其媒体品牌的内容作为其训练数据。 [85]与淡马锡有意投资OpenAI2024年3月,新加坡主权财富基金淡马锡有意投资 OpenAI。其高管最近几个月多次会见了 OpenAI 首席执行官萨姆·奥尔特曼。若淡马锡与 OpenAI 双方达成合作,这将是 OpenAI 首次获得国家背景的资金支持。淡马锡由新加坡财政部完全控股。2021 年淡马锡规模高达 3810 亿新加坡元(当前约 2 万亿元人民币),其与另一只新加坡政府所有的基金 GIC 一同进入主权财富基金榜单前十。科技领域一直是淡马锡投资组合的一部分,而 AI 正成为其关注重点。 [124]与政府合作OpenAI通过与政府机构的积极对话和合作,推动了AI安全监管标准的制定和实施。其目标是将安全评估作为AI系统的必要环节,以防止不负责任的开发和使用行为。萨姆·奥尔特曼也多次在公开场合强调安全对于AI的重要性,积极推动建立国际规范和标准。 [89]为何Altman欲与政府联手?显然,只要成为规则制定者,就能在竞争中赢者通吃。北京时间2023年5月16日,OpenAI首席执行官萨姆·奥尔特曼在出席美国国会听证会时表示,面对日益强大的AI模型,政府监管机构的干预对于控制相关风险来说至关重要。 [59]萨姆·奥尔特曼在美国参议院就AI技术的潜在危险作证,并敦促立法者对制造先进AI的组织实施许可要求和其他法规。面对美国国会,萨姆·奥尔特曼再次斩钉截铁地保证:在未来六个月内,OpenAI坚决不会训练GPT-5。同时,也对全世界发出警告:AI有可能会对世界有害,为了应对日益强大的AI风险,我们需要加强监管和立法,而政府的干预极为重要。此次听证会,Altman开门见山地告诉参议院:AI技术可能会出错,表示自己很担心人工智能行业对世界造成重大伤害(cause significant harm to the world)。希望与政府合作,防止这种情况发生。OpenAI欲与政府联手,权力通天(2张)对于怎么监管,Altman也替政府想好了,提出了成体系方案,包括三点:一是成立一个新的政府机构,负责为大型 AI 模型颁发许可,撤销不符合标准的模型的许可;二是为 AI 模型创建一套安全标准,包括对其危险能力的评估。例如,模型必须通过安全测试,比如它们是否可以“自我复制”和“流出到监管之外”;三是要求独立专家对模型在各种指标上的表现进行独立审计。 [90]团队管理播报编辑管理模式OpenAI在管理思维、人才选择、工作方法诸多方面的独到之处。1. 人才密度。公司极其重视“人才密度”,倾向于招聘年龄更大的资深技术人员,小型、资深、专注的团队往往有极高的工作效率。OpenAI只有约700名员工,但工作产出可能比大它一万倍的公司还要更高;2. 更有效率。工作节奏非常紧张,但这里不是拼命卷工作时长的地方,许多员工要抽出时间陪伴家人,倒逼他们更有效率地完成任务。3. 面对面沟通。办公室面对面的沟通仍然非常重要。一些创造性的解决方案是在办公室的社交互动中诞生的,OpenAI团队会在午餐桌上碰撞出很多新想法,4.紧密协作。 OpenAI根据职能划分了研究/应用团队,但不同团队之间的协作非常紧密。在ChatGPT团队里,既有设计师和产品经理,也有软件工程师和研究人员。不同职能的团队都需要了解对方的工作,避免出现研究部门只专注于实验,而产品部门只想商业化和赚钱的情况。5.目标明确。 “打造AGI”这一使命是OpenAI团队所有人的终极目标,也是日常工作的指引。使命不仅有助于决定做什么,也有助于决定不做什么。 [27]合作模式研究和应用在OpenAi,研究部门和应用部门是两个独立的组织结构。研究部门训练大型模型,然后应用部门在这些模型的基础上构建 ChatGPT 和 API 等产品。在实践中,这是一个更加紧密结合的过程。应用团队与研究部门的紧密耦合是能迅速地推出新创意的原因。能快速推出浏览、代码执行、插件和其他 ChatGPT 功能,是因为团队间的紧密集成。在 ChatGPT 的案例中,大部分研究人员来自研究团队。这些研究人员精通最新的微调技术和强化学习 (RL) 方法,如临近策略优化 (PPO)。由于这些研究人员也是产品组的一员,而且他们自己也在进行A/B实验,因此研究和工程之间的反馈回路非常紧密。“DERP”模式在大多数科技公司,与工程部合作的 "经典 "三人团队被称为“EPD”(即:工程、产品、设计)。OpenAI则认为将研究融入产品团队至关重要,与经典的“EPD”相比,OpenAI更喜欢把合作紧密的团队称为“DERP”(即:设计、工程、研究、产品)。在OpenAI,许多产品问题实际上是研究问题。比如,这些问题可以被视为功能请求:如何让ChatGPT生成更简洁的输出结果、如何生成更准确的答案、如何连接更多数据源等。这些问题看似产品问题,但实际上这些问题在很大程度上依赖于研究,如何调整或微调基础模型以实现预期目标。 [27]研究团队团队目标开展的研究活动有助于公司加快产品上线的速度。研究工作就是要不断思考统一的方法、打造功能更强的模型。研究团队也要确保工作能和别的研究有交汇的地方,朝着AGI的方向发展。运营模式在研究组织内部,有各种不同的研究团队。如有预培训团队负责培训 GPT-4 模型;培训后团队负责对 GPT-4 进行微调,还有负责校准的团队和让 GPT-4 能看、能听、能说的多模态团队等等。研究人员具有重要的学术或行业背景,阅读大量学术论文,以了解最新技术,提出想法并进行大量实验,以改进模型,研究人员要做大量的工程设计并编写大量的代码。 [27]应用团队团队目标应用团队是负责开发这些产品的工程、产品和设计的团队,在内部被称为“应用团队”。应用团队是公司内部的一个新成员,始于 2020 年夏天。OpenAI 的目标是构建对全人类有用的安全 AGI。应用团队的目标是打造真正让人工智能造福全人类的产品。之所以组建团队,是因为想要围绕 GPT-3 构建并扩展一个 API。模式创新ChatGPT 是应用团队内部的一个产品团队。让ChatGPT像一家小型独立创业公司一样运营,研究和应用紧密结合,长期的产品和研究思维,渐进式发布,高人才密度,日积月累的习惯。2022年夏天,OpenAI开始开发 ChatGPT。当时,应用团队大约有 30 名工程师、几名项目经理和设计师,正在运行的产品包括、GPT-3 和 Codex 的API接口、模型微调、嵌入应用程序、DALL-E 2等。所有这些产品都使用相同的代码库,在同一个集群中运行,并使用相同的构建管道。ChatGPT 的出现改变了这种状况。几位应用工程师、一些设计师、研究人员和 Greg Brockman(OpenAI 的总裁兼联合创始人)聚在一间屋子里,开始快速迭代产品创意。给这个新生团队提供了自己的代码库和一个全新的集群。不断迭代,寻找产品市场契合点(Product Market Fit)。随着 ChatGPT 团队的壮大,确保团队保持垂直整合,意味着工程、产品、设计和主要研究人员始终紧密合作。OpenAI应用工程团队负责人Evan Morikawa说,这种“分形初创公司”的方法对于任何新产品类别来说都是一个很好的模式。 [27]招聘策略高人才密度OpenAI的CEO非常关注人才的高密度 。所谓“高人才密度”,指的是平均技能和业绩表现远高于其他地方的正常水平,出色的工作在OpenAI是最基础的。经验丰富的团队可以非常非常快地交付产品,在应用团队招聘时有意向高级工程人员倾斜。此外,尽量保持小规模,事实证明,因为规模非常小的高级团队可以很快完成任务。善于团队配合团队中容不下不善于团队配合的“独行侠”:希望避免吸引那些一心追求晋升的人,这些人总会为了提升自己的头衔,制造冗余的复杂产品;希望每个人都能很好地沟通,做任何对任务最有利的事情。只要能坚持这一点,就会更加专注、更快地完成任务。关注AI安全性OpenAI把安全放在首位,而不是速度。在招聘时,非常关注AI安全性。公司不希望形成一种速度凌驾于安全之上的文化。 [27]工作方法OpenAI的日常工作方法也是公司快速发展的因素之。周一至周三,团队会在办公室工作。每个人周一、周二、周三都在旧金山总部办公。协调每天的工作是提高工作效率的关键。靠这种协调性,在一周的前三天就能抵达关键工作节点。主要产品工作节奏相当紧张。使命、产品和技术的影响力促使大家努力工作。需要强调,这并不一定意味着员工工作时间很长,OpenAI不是那种凌晨2点还有一堆人没下班的地方。 每个人都非常重视家庭时间。对家庭的关注,也让团队必须高度集中注意力,分清轻重缓急,灵活安排时间。 [27]主要产品播报编辑ChatGPT产品定义ChatGPT,全称Generative Pre-trained Transformer,是OpenAI于2022年11月30日发布的全新聊天机器人模型;是OpenAI公司开发的一种人工智能智能文本生成技术,它可以模拟人类对话的方式,生成有逻辑、有思考、有趣味的文本。 [77]基本原理基本原理是,通过深度学习算法,将大量的文本内容输入模型中进行训练,模型会自动学习语言的结构规律,从而可以生成高质量的文本。 [77]产品定位在 GPT 出现之前,NLP 模型主要是基于针对特定任务的大量标注数据进行训练。但会存在一些限制:大规模高质量的标注数据不易获得;模型仅限于所接受的训练,泛化能力不足;无法执行开箱即用的任务,限制了模型的落地应用。为了克服这些问题,OpenAI 走上了预训练大模型的道路。从 GPT-1 到 ChatGPT,就是一个预训练模型越来越大、效果越来越强的过程, 不断迭代。 [94]在OpenAI的官网上,ChatGPT被描述为优化对话的语言模型,是GPT-3.5架构的主力模型。GPT- 3.5架构基于OpenAI于2020年推出的GPT-3架构,即生成式语言模型的第3代。早在2020年6月,在训练约2000亿个单词、烧掉几千万美元后,史上最强大AI模型GPT-3一炮而红。产品功能作为聊天机器人,ChatGPT具有同类产品具备的一些特性,例如对话能力,能够在同一个会话期间内回答上下文相关的后续问题。在网友们晒出的截图中,ChatGPT不仅能流畅地与用户对话,甚至能写诗、撰文、编码等。ChatGPT惊艳的语言能力,在互联网上掀起了一场“AI风暴”,比如用它做翻译、改错别字、debug(计算机程序纠错)等,的确达到了非常好的效果。2023年8月28日(当地时间),OpenAI在官网宣布推出企业版ChatGPT,将提供企业级安全和隐私保护、无限高速的GPT-4访问、处理更长输入的上下文窗口、高级数据分析能力、定制选项等等。 [18]新解锁功能 [51] 可上传 PDF、数据文档等多种类型文档;无需转换即可使用所有工具(如访问浏览、高级数据分析、DAL·E) [51]。应用范围CHATGPT的应用范围非常广泛,可以用于智能客服、智能聊天机器人、自动化写作等方面;可以通过与用户的互动,根据用户的需求生成相应的文本,从而提升用户的体验感。除此之外,CHATGPT还可以用于自动化写作,比如新闻报道、文学创作等方面,可以大大提高写作的效率和精度。随着智能化的发展,CHATGPT技术将会在越来越多的领域发挥作用,成为自动化智能服务的重要支撑。 [77]产品版本版本名称发布时间提供服务主要功能GPT-12018年第一代生成式预训练模型从有监督到无监督。GPT-1 的关键特征是:半监督学习。GPT-1 的效果明显,只需要极少的微调,就可以增强 NLP 模型的能力,减少对资源和数据的需求。同时,GPT-1 也存在明显的问题,一是数据局限性,GPT-1 是在互联网上的书籍和文本上训练的,对世界的认识不够完整和准确;二是泛化性依然不足,在一些任务上性能表现就会下降。 [94]GPT-22019年第二代生成式预训练模型与 GPT-1 并没有本质上的不同。架构相同,使用了更大的数据集 WebText,大约有 40 GB 的文本数据、800 万个文档,并为模型添加了更多参数(达到惊人的 15 亿个参数)提高模型的准确性,可以说是加强版或臃肿版的 GPT-1。有研究表示,GPT-2 生成的文本几乎与《纽约时报》的真实文章(83%)一样令人信服。 [94]GPT-32020年第三代,语言处理人工智能模型;该程序利用深度学习生成类似人类语言的文本。包括语言翻译和为聊天机器人生成文本等。GPT-3有1750亿个参数,是 GPT-2 的 117 倍 [94]。研究结果表明:具备用零样本学习方法解决一系列类比问题的初步能力;能够回答大多数问题甚至为人类起草论文的GPT-3,在从头开始回答问题和回答多选题时的表现超过了人类。 [93]GPT-3 也在商业应用上表现出了极高的稳定性和实用性,通过云上的 API 访问来实现商业化。这种入得了实验室、下得了车间的能力,使得 GPT-3 成为 2020 年 AI 领域最惊艳的模型之一。 [94]GPT-3.52022/11/30第四代聊天机器人。OpenAI 设计系列 NLP 模型中的第四个不仅能够回答各种问题,还能够创作诗歌、故事、歌曲、代码等内容,甚至能够模仿名人的风格和语气。它的出现,开启了生成式AI领域的新篇章。 [95]产生了技术路线上的又一次方向性变化:基于人工标注数据 + 强化学习的推理和生成。 [94]GPT-42023/03/14多模态预训练大模型。任何拥有OpenAI API访问权限的人都可以采用这种方法创建自己的人工智能辅助审核系统。 [92]具备更高水平的识图能力,且能够生成歌词、创意文本,实现风格变化;GPT-4的文字输入限制也提升至2.5万字,且对于英语以外的语种支持有更多优化。 [91]8月15日,OpenAI官宣,将GPT-4用于内容策略开发和内容审核决策,以实现更一致的标签、更快的策略优化的反馈闭环以及更少的人工审核人员参与。GPT-4 Turbo-购买ChatGPT Plus服务的付费用户和API企业客户都可以访问。从写代码到写剧本、创建图像,根据冰箱里食物的照片倒推食谱,可以使用越来越多的互联网连接工具。 [56]GPT Store2024年1月有超过300万个自定义版本的ChatGPT [109]从GPT Store界面的构成来看,应用商店类目包括:Featured:本周精选特色应用;Trending:社区最受欢迎的GPTs;By ChatGPT:由ChatGPT团队创建的GPTs。GPTs根据应用的用途划分为“写作”“效率”“研究和分析”“编程”“教育”和“生活方式”等类目。ChatGPT Team2024年1月可以访问如GPT-4和DALL·E 3等高级模型,以及高级数据分析等工具。ChatGPT Team还包括一个专门用于团队的协作工作空间和用于团队管理的管理工具。团队可以拥有并控制自己的业务数据——我们不会对业务数据或对话进行训练,我们的模型也不会在团队使用过程中学习。ChatGPT Team是OpenAI企业产品的较小版本,适用于用户数量少于150名的企业。Plus用户是无法使用这个功能的,OpenAI为ChatGPT Team提供了单独的收费标准:25美元/月或每月支付每个用户30美元。 [109-110]训练方式据OpenAI的官方文档,相比之前的GPT模型,OpenAI采用了全新的训练方式,即一种名为“从人类反馈中强化学习”(Reinforcement Learning from Human Feedback,RLHF)的训练方式对 ChatGPT 进行了训练。OpenAI让人类训练师扮演对话的双方提供对话作为学习资料。在人类扮演聊天机器人的时候,OpenAI也会让模型生成一些建议来帮助训练师撰写自己的回复。也就是说,基于优秀的机器学习算法和强劲的算力,通过海量的数据训练,来让AI学会“思考”。方法 [71]ChatGPT还采用了注重道德水平的训练方式,按照预先设计的道德准则,对不怀好意的提问和请求“说不”。一旦它发现用户给出的文字提示里面含有恶意,包括但不限于暴力、歧视、犯罪等意图,它都会拒绝提供有效答案。产品团队ChatGPT 是设在应用团队内部的产品团队,由软件工程师、设计师、产品经理和研究人员共同组成。 [27]体验流程ChatGPT的体验流程更方便,只要注册一个OpenAI的账号就可以体验了,与早期的模型需要申请通过才能体验相比,ChatGPT影响的人群更广泛,讨论的人会更多。局限性ChatGPT有时会写出看似合理但不正确或荒谬的答案。这是Open AI认为ChatGPT所面临的“限制”,并且解决这个问题被认为是具有挑战性的。其背后原因有三,首先,强化学习的信息源目前并未建立;其次,模型通过学习变得更加谨慎会导致其回避原本能够正确回答的问题;另外,监督学习将会对模型造成误导,因为理想的答案应该来源于模型的认知,而非人工演示者的认知。ChatGPT的能力获得是基于庞大的语料库,凝练了多领域问题的很多数据做相互校验,然后挑一些基础性的内容回答出来,这其实是“举一千反一”的过程,与人类举一反三的能力还相差较远,它不具备思考能力,所以犯错误不可避免,但通过人为的干预反馈,这些问题是可以被改进的。 [26]市场运用在首次亮相后的几个月里,ChatGPT已经成为一种全球现象。2022年12月,在OpenAI宣布有超过一百万人注册该服务几天后,OpenAI总裁格雷格·布罗克曼(Greg Brockman)在Twitter上说,该服务的用户已经达到200万。ChatGPT也是一个资金陷阱。没有广告,根据奥尔特曼在Twitter上发表的一篇文章,每一次对话的数据处理成本平均为“几美分”,每周可能达到数百万美元。为了抵消这些成本,该公司2023年2月宣布将在付费版中收取每月20美元的订阅费,称为ChatGPT Plus。2023年2月3日,瑞士银行巨头瑞银集团的一份报告显示,在人工智能聊天机器人ChatGPT推出仅两个月后,它在2023年1月末的月活用户已经突破了1亿,成为史上用户增长速度最快的消费级应用程序。根据Sensor Tower的数据,TikTok达到1亿用户用了9个月,Instagram则花了2年半的时间。ChatGPT的成功使OpenAI进入了硅谷实力派的行列。 [33]ChatGPT更新更新前、后(2张)2023年11月,首届OpenAI发布会上发布ChatGPT更新,首先,从发布日开始ChatGPT将使用刚刚发布的GPT-4 Trubo模型。另外,针对用户每次对话前都要选择不同模式的困扰,GPT-4 Trubo也将迎来产品逻辑的更新,现在机器人能够主动根据对话来适配对应的功能。 [58]GPT-4 Turbo模型的进步主要体现在6个方面:GPT-4 Turbo的进步主要体现在6个方面 [58]1、AI能够理解更长的上下文对话长度(context length)。标准版GPT-4模型最多支持8192个token,此前的升级将其提高至最多3.2万个token。而GPT-4 Turbo支持最高12.8万个token;新模型在处理长文本情境下的准确度也有所提高;2、给予开发者更多的控制权。新的模型允许开发者指示模型固定以特定形式返回有效JSON—JSON模式。同时开发者可以通过访问seed参数和system_fingerprint响应字段,来实现“模型对每次请求都给出确定性的输出”。3、GPT-4对于现实世界的知识截止于2021年9月,GPT-4 Trubo的知识则截止于2023年4月。4、多模态API。文生图模型DALL·E 3、具有视觉输入能力的GPT-4 Trubo,以及新的声音合成模型(TTS)都在今日进入API。OpenAI也也发布了新的语音识别模型Whisper V3,将在近期向开发者提供API。5、宣布将向活跃开发者提供GPT-4微调的资格。对于开发细分行业的垂直AI应用而言,微调是必经的过程。对于这类开发者,OpenAI也推出了定制化模型项目,帮助一些组织训练针对特定领域的定制化GPT-4模型。6、OpenAI将所有GPT-4用户的Token速率限制扩大了一倍,开发者可以申请进一步提高速率。在定价方面:GPT-4 Turbo的价格要远低于GPT-4 [58]GPT-4 Turbo的价格要远低于GPT-4。其中输入Token的价格只有三分之一,而输出Token的价格只有一半。也就是说,输入1000个Token的定价为1美分,而输出1000个Token的定价为3美分。与此同时,GPT-3 Turbo 16K模型的价格也有所下调。 [58]GPTs产品定义:GPTs是OpenAI于2023年11月7日推出重要产品,用户将能通过自定义指令、拓展(模型)的知识边界和下达行动命令,来构建自己的GPT,并能对外发布给全球更多的人使用。更重要的是,整个构建“自定义GPT”的过程也是通过自然语言对话形成的。模型能力萨姆·奥尔特曼在现场演示了如何通过聊天搭建一个GPT。他给GPT Builder的指令是“希望帮助创业者思考商业灵感并提供建议,然后‘拷问’他们为何公司发展得不够快。”随后ChatGPT迅速搭建了一个创业咨询GPT,还顺手生成了一个Logo。现场演示了如何通过聊天搭建一个GPT(2张)随后奥尔特曼在属性页面中上传了一份他自己关于创业公司的演讲稿,向这个用例提供了额外的知识。至此,自定义用途的GPT初步搭建完成。用户可以保存这个用例只给自己使用,也能对外公开发布。OpenAI也顺势宣布,将在本月晚些时候上线“GPT应用商店”。对于那些最热门的GPT,公司还将分享一部分的营收,来推进GPT应用生态的进步。 [58]Assistants API产品定义 新品Assistants API(“助理API”)是2023年11月7日 OpenAI 首届开发者大会上,OpenAI 推出的一种“专门构建的 AI 工具”,可利用“额外的知识”帮助开发者在自家应用程序中构建 AI 助手。 [125]模型能力“助理API”具有特定的指令,利用额外的知识,并能调用模型和工具来执行任务。新的助手API提供了如代码解释器、检索以及函数调用等功能,以处理此前开发者必须自己完成的诸多繁重工作。用例范围非常灵活,例如基于自然语言的数据分析应用、编程助手、AI度假规划器、语音控制DJ、智能视觉画布等等。 [58]版本名称发布时间提供服务主要功能Assistants API2023年11月帮助开发者在自家应用程序中构建 AI 助手。提供三项功能:“代码解释器”可允许开发者在沙盒执行环境中编写和运行 Python 代码,生成图形图表,并处理具有不同数据和格式的文件,并允许 AI 助手迭代运行代码来解决具有挑战性的代码和数学问题等。“检索”可利用模型之外的知识来增强助手,例如专有领域数据、产品信息或用户提供的文档。“函数调用”可令助手能够调用开发者定义的函数,并将函数响应合并到其消息中。 [125]Sora产品定义Sora,是OpenAI于当地时间2024年2月15日推出的一款新的人工智能文生视频大模型,该模型可以根据文字说明创建现实和想象的场景。Sora作为一款通用的视觉数据模型,其卓越之处在于能够生成跨越不同持续时间、纵横比和分辨率的视频和图像,甚至包括生成长达一分钟的高清视频 [118]。Sora从文本到视频模式,旨在帮助人们解决需要现实世界互动的问题。 [115-116]Sora训练Sora的训练依赖于大量带有文本标题的视频数据。OpenAI利用了DALL-E 3中的标题生成技术,为视频生成高质量的文本标题,以此来提高文本和视频数据之间的对齐度。同时,在大规模训练过程中,Sora展示了一些“涌现的模拟能力”,如三维一致性、长距离连贯性、物体持久性以及与世界互动等。 [120]模型能力文本到视频生成能力。能够根据用户提供的文本描述,生成长达60S的高保真视频。复杂场景和角色生成能力。能够生成包含多个角色、特定运动类型以及准确主题和背景细节的场景。能够创造出生动的角色表情和复杂的运镜,使得生成的视频具有高度的逼真性和叙事效果。语言理解能力。拥有深入的语言理解能力,遵守用户的提示 [115],使得模型能够更好地理解用户的文本指令,并在生成的视频内容中忠实地反映这些指令。多镜头生成能力。具有在单个生成的视频中创建多个镜头的能力,同时保持角色和视觉风格的一致性。从静态图像生成视频能力。能够从现有的静态图像开始,准确地动画化图像内容,或者扩展现有视频,填补视频中的缺失帧。 [118]物理世界模拟能力。能深度模拟真实物理世界。标志着人工智能在理解真实世界场景并与之互动的能力方面实现了重大飞跃。 [117]Sora 制作的1分钟视频,效果接近实拍技术特点Sora是一个扩散模型,能够对一个看起来像静态噪声的视频,通过多个步骤去除噪声逐渐转换。Sora通过一次为模型提供多帧的前瞻性,确保主体在暂时离开视野仍保持不变。Sora使用DALL.E3中的重新捕获技术,生成的视频结果能够更忠实地遵循用户的文本指示。该模型还能够获取现有的静态图像并从中生成视频,对图像内容进行精确动画处理,并关注小细节。该模型还可以获取现有视频并对其进行扩展或填充丢失的帧。 [115]Sora的三维一致性仿真功能。Sora可以用动态摄像机运动生成视频。随着相机的移动和旋转,人物和场景元素在三维空间中一致地移动。Sora通过在一帧的时间范围内的空间网格中安排高斯噪声补丁实现图像生成功能。该模型可以生成各种尺寸的图像高达2048x2048分辨率。 [119]Sora可以生成各种尺寸的图像高达2048x2048分辨率局限性作为一个模拟器,Sora表现出许多局限性 [119]。可能难以准确地模拟复杂场景的物理特性,不理解具体实例的因果关系,例如,一个人咬了一口饼干,但饼干可能没有咬痕。还有可能混淆提示的空间细节,例如混淆左和右。难以精确描述随时间发生的事件,例如跟随特定的相机轨迹。 [115]对行业影响OpenAI对Sora的定位颇具野心,号称并不仅是“文生视频”的工具,而是一个通用的“物理世界模拟器”,意在复现真实世界重力、摩擦力等物理现象。这样的定位使得Sora未来有望成为跨越各行各业的“超级工具”,可被用于模拟天气变化、自动驾驶、生物行为甚至军事场景等等。 [126]Sora并非是首个文本生成视频的大模型。据不完全统计,截至2023年底,全球能实现文生视频的大模型包括Runway、Pika、Stable Video Diffusion等超过20个产品。然而,Sora的诞生仍给业界带来了不小的震撼。用户仅需输入简短一句话,Sora可生成一段60秒视频,时长远远超过市面同类型级别的AI视频生成时长(“明星模型”Runway和Pika等几乎也仅有3~4秒);也已超过抖音等短视频平台的平均视频时长,Sora的诞生也为以后短视频平台的内容生产提供了更大的可能性。中信建投、国泰君安、申万宏源、招商证券等10家券商在研报中均表示,Sora 是人工智能发展进程中的“里程碑”,预示AGI(通用人工智能)将加速到来,众多行业将迎颠覆式变革。 [120]产品管理播报编辑发布策略OpenAI发布产品的策略,避免采用“大爆炸、一气呵成”的发布模式。因为持续更新是OpenAI安全的基本原则战略。人工智能安全是OpenAI内部的一个重要话题,也是工作的核心,公司采取了很多方法确保AI的安全性。例如:红队:一组被称为“红队”的安全专家扮演攻击者的角色,测试和评估安全措施的有效性;对齐:确保人工智能系统的行为方式与人类价值观保持一致,并且不会无意中做出有害的行为;政策工作:与世界各地的政策制定者合作,制定具体规则加强人工智能技术和服务的安全性和可信度。产品在密切监控下逐步推出,产品发布前,先经过选定客户的试用,然后再逐步推广。当全世界都看到ChatGPT“突然”爆发时,实际上,在 OpenAI内部已经花了好几年,在可控的环境中开发和调整ChatGPT。 [27]研发策略AI的飞速发展,在给人类带来生产力革命的同时,也带来了前所未有的安全挑战,包括:AI系统本身的稳定性和可靠性隐患,恶意使用AI技术,用户隐私侵犯,AI系统决策过程的公平、透明和可解释性难以保障等。因此,OpenAI在创业过程中并行采取以安全为导向的研发策略,并积极参与到相关政策的讨论和制定过程中,聚焦于推动行业正向发展、企业文化塑造以及巩固行业领先优势等3个维度,以确保AI发展能够在保障安全的前提下更好地服务于人类社会。从技术上提出了两个方向:一是可扩展的监督,尝试使用人工智能系统来协助人类监督其他人工智能系统;二是解释能力,尝试更好地打开这些模型的内部黑箱,包括使用GPT-4来解释GPT-2中的神经元,使用Model Internals来检测一个模型何时在说谎等。一定程度上,OpenAI在AI安全方面的努力和贡献,不仅有助于推动行业的健康发展,也能够对内塑造企业文化和对外巩固行业领先优势,掌握了行业话语权,从而构建以OpenAI为主导的通用人工智能创新与发展生态。 [89]服务条款OpenAI服务条款规定,API客户所输出的模型不能被用于“开发任何与我们的产品和服务竞争的AI模型”。“所有API客户必须遵守我们的使用政策,以确保我们的技术被用于好的一面”微软:“Azure OpenAI服务等微软AI解决方案属于有限访问框架的一部分,这意味着所有客户都必须申请并获得公司的批准才能访问。同时,制定了标准并提供资源,帮助客户负责任地使用这些技术,并遵守公司的服务条款。公司还制定了发现滥用行为的流程,并在客户违反公司的行为准则时停止他们的访问。” [102]风险管理播报编辑风险评估对于开发中的前沿模型,OpenAI主要跟踪4个类别的安全风险:网络安全、CBRN(化学、生物、放射性、核威胁)、说服能力、模型自主性。评估期间将增加2倍的有效计算量把模型推向极限,并制作“记分卡”,分为“低、中、高、重大危险”四个等级。采取缓解措施后,四个方面得分取最高值作为一个模型的总评分。OpenAI:安全 [106]只有缓解后风险评分为“中”或更低时才能部署;只有缓解后风险评分为“高”或更低时才能进一步开发;对缓解前为“高”或“重大风险”的模型采取额外安全措施。 [105-106]OpenAI:限制 、制约 [106]网络安全风险定义为利用模型破坏计算机系统的机密性、完整性、可用性。 [105]网络安全风险 [105]CBRN风险CBRN风险,专注于与模型辅助创建化学、生物、放射性和/或核威胁相关的风险。 [105]CBRN风险 [105]说服能力风险侧重于与说服人们改变他们的信念或采取行动有关的风险。通常强大的说服力很少见,需要大量人力(例如一对一对话,或者精心制作的媒体内容);然而,模型可以在能力范围内使所有内容几乎零成本生成。 [105]说服风险 [105]模型自主性风险模型自主性风险就是比较科幻的那种,AI改进自己、阻止自己被关机、逃出实验室了。 [105]模型自主性风险 [105]企业事件播报编辑涉投诉2023年4月4日,加拿大隐私专员办公室(OPC)宣布开始调查ChatGPT背后的公司OpenAI,涉及“指控OpenAI未经同意收集、使用和披露个人信息”的投诉。 [8]涉诉讼两名作家发起版权集体诉讼2023年6月28日,第一起具有代表性的ChatGPT版权侵权之诉,终于出现在了公众视野。两名作家在美国加州北区法院,对Open AI公司发起了版权集体诉讼,指控后者未经授权利用自身享有版权的图书训练ChatGPT,谋取商业利益。 [16]2023年7月,两位美国作家对ChatGPT母公司OpenAI提起诉讼,声称OpenAI在没有获得版权授权的情况下,就利用他们的作品来训练其人工智能。就在几天之前,OpenAI在加利福尼亚州同样被多方提起集体诉讼,起诉书称OpenAI在未经允许的前提下,在互联网上窃取和挪用了大量私人数据来训练ChatGPT。 [13]多名美国作家起诉OpenAI当地时间2023年12月20日,包括泰勒·布兰奇和史戴西·希夫在内的11名美国作家在纽约曼哈顿联邦法院起诉美国人工智能公司“开放人工智能研究中心”(OpenAI)和微软。 [103]。作家向法庭表示,OpenAI在未经许可的情况下,从互联网上批量复制了他们的作品,并将这些作品纳入ChatGPT的训练数据里,侵犯了他们的作品版权。 [104]《纽约时报》起诉OpenAI2023年12月27日,《纽约时报》就侵犯版权起诉OpenAI。诉讼称,《纽约时报》发表的数百万篇文章被用于训练自动聊天机器人,这些机器人现在作为可靠信息来源与该新闻媒体展开竞争。 [107]2024年2月27日消息,美国开放人工智能研究中心(OpenAI)遭美国《纽约时报》起诉侵权的诉讼又有新进展:OpenAI已要求联邦法官驳回部分原告诉求,称原告媒体雇用电脑“黑客”操纵OpenAI的生成式人工智能聊天机器人ChatGPT等人工智能系统,进而生成“误导性证据”。OpenAI向纽约曼哈顿南区联邦法院提交文件说,《纽约时报》花钱雇用黑客操纵OpenAI产品,利用“公然违反OpenAI使用条款的欺骗性提示”,诱导ChatGPT生成照搬《纽约时报》版权作品的内容,留作侵权证据。 [121]埃隆·马斯克起诉OpenAI2024年3月1日,埃隆·马斯克(Elon Musk)向法院起诉OpenAI及其首席执行官萨姆·奥尔特曼(Sam Altman),指控他们违反了OpenAI成立时签订的协议,即为了人类的利益而不是利润开发技术。 [122]3月5日OpenAI 回击,指马斯克试图对其进行“绝对控制”。美国《纽约时报》称,在一份公告中,该公司通过公布一系列的邮件往来,披露他们与马斯克之间的“恩怨”。OpenAI称,当年,打造非营利人工智能公司的目标过于“烧钱”,包括马斯克在内的一众创始人均同意公司转型。而也就是在这个时候,马斯克提出要得到该公司的多数股权、董事会控制权以及CEO职务,甚至还提出将该公司与特斯拉兼并,遭到了其余创始人的强烈反对。在他们看来,这样的“绝对控制”有悖于公司成立的初衷。被拒之后,马斯克于2018年撤资并离开了OpenAI的董事会。3月6日,马斯克在社交平台上称,如果OpenAI将公司名称变更为“CloseAI”,他就放弃起诉。OpenAI的字面意思为“开放性人工智能”,而“CloseAI”含义刚好与之相反。据美国哥伦比亚广播公司(CBS)称,马斯克显然是在影射该公司从一家主张开源代码的非营利公司转变为一家被大型企业控制、一切向利润看齐的“闭源”科技企业。CBS称,马斯克与OpenAI之间的恩怨情仇本身很俗套,“与资本主义制度一样古老”,但是这场官司对人工智能行业的发展颇具借鉴意义。 [131]被调查是否违反消费者保护法当地时间2023年7月13日,据美国CNN报道,美国联邦贸易委员会正在调查OpenAI是否违反消费者保护法,并要求OpenAI提供有关其处理个人数据、向用户提供不准确信息的可能性以及“对消费者造成损害(包括声誉损害)的风险”的大量记录。 [14]提起诉讼诉讼一家名称侵犯了OpenAI商标2023年8月8日,据彭博消息,OpenAI Inc.对一家使用“开放人工智能”(Open Artificial Intelligence)名称的公司提起诉讼,声称该名称侵犯了OpenAI商标,并造成消费者混淆。 [17]回应质疑回应对AI模型安全性质疑美国当地时间4月5日,ChatGPT研发公司OpenAI在其官方博客发布文章《我们保障AI安全的方法》,回应外界对其AI模型安全性的质疑。文章介绍了ChatGPT六个方面的安全部署,包括构建日益安全的AI系统、在实际使用中学习改进安全措施、保护儿童、尊重隐私、提高事实准确性,以及持续研究和参与。 [9]2023年12月8日消息,当地时间周五,英国反垄断监管机构表示,将审查微软与OpenAI的合作是否导致了“获取控制权”的情况,即一方对另一方具有重大影响力或控制权,如果存在可能导致阻碍行业竞争的问题,那么该机构后续将采取更多针对性行动。回应英国监管机构审查微软与OpenAI合作关系当地时间2023年12月8日,英国竞争和市场管理局(CMA)表示,其正在收集来自利益相关者的信息,以确定微软与OpenAI两家公司的合作是否威胁到谷歌人工智能研究实验室Deepmind总部所在地英国的市场竞争。随后,微软发言人在一份声明中表示:“虽然我们协议的细节仍然保密,但必须指出的是,微软并不拥有OpenAI任何股份,只是有资格分享利润分配。”OpenAI发言人则表示,“微软的无投票权董事会观察员席位并未向他们提供管理职权或对OpenAI运营的控制权。” [32]应用问题美国东部时间2023年4月23日,根据中断跟踪网站Downdetector的数据,超千名用户报告OpenAI出现使用问题。 [11]重组风波产生背景从2015年创建起,OpenAI内部就充满了矛盾。该公司由特斯拉首席执行官埃隆·马斯克(Elon Musk)、萨姆·奥尔特曼(Sam Altman)和其他九人共同创立,其目标是建立人工智能系统以造福全人类。与大多数科技初创企业不同,OpenAI是作为非营利机构成立的,董事会负责确保OpenAI履行这一使命。董事会里持有相互对立人工智能理念的人,一边是担心人工智能危险的人,比如埃隆·马斯克,另一边是奥尔特曼和那些更关注这项技术潜在好处的人。2018年埃隆·马斯克离开OpenAI,2019年,奥尔特曼成为OpenAI的首席执行官,改变了OpenAI的发展方向,他创建了一家营利性子公司,并从微软筹资10亿美元。从而引发质疑,即这将如何与董事会的安全人工智能使命相吻合?董事会成员中的三名独立董事都担心人工智能会变得比人类更聪明。 [57]解雇奥尔特曼2023年11月,据The Information,几位知情人士透露,在OpenAI首席执行官萨姆·奥尔特曼被解雇、总裁Greg Brockman突然辞职之际,OpenAI的三名高级研究人员在当地时间17日辞职。请辞的三人分别是公司研究总监akub Pachocki、负责评估人工智能潜在风险的团队负责人Aleksander Madry,以及在这家初创公司做了7年研究员的Szymon Sidor。 [22]11月17日,OpenAI在官网发布新闻稿称,公司董事会宣布,CEO萨姆·奥尔特曼将辞去CEO并离开公司,首席技术官米拉·穆拉蒂将担任临时首席执行官,立即生效。在奥尔特曼该推文后没多久,格雷格·布罗克曼转发也宣布将离开公司。 [21]解雇奥尔特曼的原因关于最初解雇奥尔特曼的原因存在不同的解释。萨姆·奥尔特曼被赶下台的核心是创始人之间的旧式纠纷。据称,OpenAI首席科学家兼联合创始人伊尔亚·苏茨克维(Ilya Sutskever)是此次罢免的幕后推手——基于对商业化与研究速度的担忧,以及是否对安全性给予足够重视。 [28]据美国《华尔街日报》网站报道,11月17日,OpenAI董事会表示,解雇的理由是因为他没有对公司董事会坦诚相待。与奥尔特曼关系密切的人士则表示,解雇更多与公司人工智能的安全性争议以及与共同创始人和董事会成员伊利亚·苏茨克韦尔之间的权力斗争有关。策划复职反击2023年11月19日,在被OpenAI解职两天后,奥尔特曼又回到了公司办公室,试图谈判回归事宜。他戴着访客胸牌进入中心,并在X平台上发帖:“这是我第一次也是最后一次戴这个。”整个周末,投资者和许多员工都在试图恢复奥尔特曼的职位。他一直在策划一场反击,试图夺回这家硅谷最有价值和最知名的初创公司之一。奥尔特曼的阵营成功将解雇他的董事会带回到谈判桌旁,提名一连串备受关注的科技企业高管来领导一个更符合奥尔特曼商业愿景的新董事会。微软的高管也极力推动在新公司架构中加强监督,包括可能设立一个董事会观察员席位,以便更深入了解公司的经营情况。2023年11月19日,OpenAI董事会成员伊利亚·苏茨克韦尔在向员工发表的一份声明中表示,尽管公司高管努力争取奥尔特曼复职,结果还是事与愿违。苏茨克韦尔也宣布,亚马逊旗下流媒体平台“特威奇”(Twitch)前首席执行官埃米特·希尔,将成为OpenAI新的临时首席执行官。希尔为Twitch联合创始人,于今年早些时候辞职。奥尔特曼被解职后,OpenAI曾任命首席技术官米拉·穆拉蒂为临时首席执行官。 [54]11月20日,OPENAI临时首席执行官米拉·穆拉蒂计划重新聘请萨姆·奥尔特曼和格雷格·布罗克曼 [45];11月20日,据外媒,OpenAI董事会据称将聘请埃米特·谢尔担任CEO,取代创始人萨姆·奥尔特曼 [23]。在谈判失败后,纳德拉在X平台上写道,奥尔特曼“将加入微软,领导一个新的高级人工智能研究团队”,与OpenAI的联合创始人格雷格·布罗克曼以及其他同事一同工作。 [54]员工签署联名信当地时间2023年11月20日,OpenAI公司超过700名员工签署联名信,要求该公司董事会辞职。信中指出,除非董事会辞职并恢复奥尔特曼和格雷格·布罗克曼的职位,不然他们将加入微软的人工智能研究部门。 [25]奥尔特曼重返CEO2023年11月22日,OpenAI宣布,已经原则上达成协议,奥尔特曼重返公司担任CEO,“并组建由董事会主席Bret Taylor、Larry Summers和Adam D'Angelo组成的新董事会。” [46]组建新初始董事会2023年11月30日,OpenAI宣布,萨姆·奥尔特曼已经回归担任首席执行官,OpenAI成立新董事会。 [47]同日,OpenAI原董事会成员海伦·托纳 (Helen Toner) 在社交平台X发文称,她正式辞去了OpenAI董事会的职务。 [48]重组风波影响创始人与董事会之间的决裂OpenAI突然进行重组是硅谷的老生常谈:创始人与董事会之间的决裂。但在这个案例中,创始人(硅谷人工智能革命的代表)与董事会(其任务是将社会利益置于利润之上)都非常特殊。这种决裂威胁着公司的未来以及投资者投入其中的数十亿美元。受重组风波影响微软股价下跌在所有投资者中,微软可能是与OpenAI的未来最剪不断理还乱的公司,而这家初创公司的乱局一直是微软的负累。除了是OpenAI最大支持者外,微软还围绕这家初创公司的人工智能软件重新调整了自己的业务。在奥尔特曼被解雇的消息传出后,微软的股价下跌。 [54]OpenAI坚不可摧的光环被动摇了OpenAI坚不可摧的光环被动摇了。(斯坦福大学教授吴恩达(Andrew Ng)评,他曾帮助创建了谷歌和百度的人工智能实验室)。OpenAI的混乱引发了人们对人工智能革命背后的人和公司的新质疑:作为世界上首屈一指的人工智能初创公司,如果它能如此轻易地因为背后诽谤他人的行为和不可靠的错误想法而陷入危机,那么人们还能信任它来推进一项可能对数十亿人产生不可估量影响的技术吗。 [57]AI伦理思考-商业化与安全审查OpenAI这场高层“内斗”大戏,牵扯到商业利益和观念博弈两个方面的矛盾,后者体现为,“加速派”和“末日论派”在人类与AI的关系上的分歧。首席执行官奥尔特曼在加速部署OpenAI产品的商业化,扩大消费者市场。2022年11月,OpenAI发布基于GPT-3的聊天机器人ChatGPT,开始较为明确地产品化。而2023年11月的开发日上OpenAI不仅在模型层上有所推进,还引入微调(fine-tuning)和检索增强生成(RAG)等基础设施层的工具,并推出了GPT应用商店和企业定制等生态层的探索,这些都在一年内发生。2023年7月,首席科学家伊尔亚·苏茨克维(Ilya Sutskever)在OpenAI内部组建了一只“超级对齐团队”,以达到“让模型在最糟糕的情况下也能遵循人类的意图”等目的。2023年11月初,苏茨克维在一个纪录短片中称:“我的感觉是,通用人类智能(AGI)的发展会出现雪崩。”这二人的观念取向,折射出硅谷乃至全世界人工智能行业对安全与进步的分歧观点,即“有效加速主义”和“末日论”。前者的拥趸希望通过最高效、最具影响力的技术进步与突破来加速社会、经济或技术系统的变革过程,并把风险视为变革的催化剂。而后者则更加审慎,认为一旦风险不可控,人工智能带来的巨大影响将毁灭人类社会。 [72]暂停账户暂停字节跳动账户2023年12月16日,因字节跳动一直在秘密使用OpenAI的技术开发自家大语言模型而违反了OpenAI的服务条款,字节跳动的账户已被OpenAI暂停。字节跳动通过微软购买了OpenAI的访问权限,但是微软也制定了与OpenAI同样的政策。OpenAI发言人尼克·菲利克斯(Niko Felix)发表声明,确认字节跳动的账户已被暂停。字节跳动发言人约迪·赛斯(Jodi Seth)对此回应称,GPT生成的数据在“种子计划”的早期开发中用于注解模型,并且在2023年年中左右的时候已从字节跳动的训练数据中删除。“字节跳动获得了微软的许可能够使用GPT API。我们使用GPT驱动非中国市场的产品和功能,但使用自主开发的模型驱动豆包。豆包只在中国提供 [102]。字节跳动相关负责人回应称,正在与 OpenAI 联系沟通,以澄清外部报道可能引发的误解。 [97]监管升级监管定基调在美国国会没有采取任何有意义的行动的情况下,欧盟的法律将为西方世界随后的监管定下基调。当地时间2023年12月8日,欧盟政策制定者就《人工智能法案》达成协议。该法案是全球首次尝试以全面的、基于伦理的方式监管这项快速发展的技术 [100]。法案将AI系统的风险分为四类:不可接受风险、高风险、有限风险以及最低或无风险。 [101]文件称,被视为构成“系统性风险”的模型将受到额外规则的约束。欧盟将根据用于训练模型的算力来确定其风险等级。新法案将影响OpenAI。最大的通用人工智能系统,包括为聊天机器人ChatGPT提供支持的GPT将面临新的透明度要求。除因国家安全豁免外,警方和政府使用面部识别软件将受到限制。违反规定的公司可能面临高达全球销售额7%的罚款,可达3500万欧元(3770万美元)。专家称,目前唯一已达到构成“系统性风险”阈值的模型是OpenAI的GPT-4。欧盟执行机构可以根据数据集大小、是否在欧盟拥有至少10000名注册商业用户或注册最终用户数量以及其他指标来指定哪些模型构成“系统性风险”。 [100]管理政策随着通用型人工智能向用户端和行业加速渗透,相关隐私保护担忧和安全监管等议题逐步升温。全球监管持续行动。由于ChatGPT本身在使用训练数据的来源以及隐私泄露等问题一直备受争议,不少大型企业都出台相关政策要求员工不要使用ChatGPT。2023年3月,意大利数据保护局宣布禁止ChatGPT,加拿大已经调查OpenAI,称该公司涉嫌“未经同意收集、使用和披露个人信息”。2023年5月22日消息,苹果已经连续数月禁止员工使用ChatGPT和Copilot,此前亚马逊、摩根大通等也限制员工使用ChatGPT,中国支付清算协会倡议支付行业人员谨慎使用ChatGPT等工具。2022年,中国国家互联网信息办公室等三部门发布《互联网信息服务深度合成管理规定》;2023年4月,国家互联网信息办公室起草了《生成式人工智能服务管理办法(征求意见稿)》,对人工智能生成内容、主体责任、训练数据和数据处理等方面作出进一步规定,保障生成式人工智能技术的合规性和安全性。商标注册2024年2月,美国专利商标局拒绝OpenAI将GPT 一词注册为商标,他们认为GPT的意思是生成式预训练转换器 —— 一个过于笼统的术语,可能会阻止竞争对手将其产品描述为GPT。 [114]所获荣誉播报编辑日期荣誉名称企业估值排名2023年4月18日2023·胡润全球独角兽榜1380亿(人民币)第17名 [10]2023年8月福布斯发布2023云计算100强榜单280亿(美元)第1名 [55]2023年11月24日首期《财富》全球人工智能创新者50强榜单- [56]2023年12月20日“汉语盘点2023”年度字词——“ChatGPT”当选国际词-- [98]竞争对手播报编辑中国百度百度:文心一言产品名称模型定位模型能力发布/更新时间文心一言(ERNIE Bot)ERNIE大语言模型百度在人工智能四层架构中,有全栈布局。包括底层的芯片、深度学习框架、大模型以及最上层的搜索等应用。文心一言,位于模型层;百度在人工智能领域深耕十余年,拥有产业级知识增强文心大模型ERNIE ,具备跨模态、跨语言的深度语义理解与生成能力 [83]2023年2月7日3.5版在基础模型升级、精调技术创新、知识点增强、逻辑推理增强、插件机制等方面创新突破 [84]2023年5月4.0版知识增强大语言模型理解、生成、逻辑、记忆四大能力都有显著提升。在万卡算力上运行飞桨平台,通过集群基础设施和调度系统、飞桨框架的软硬协同优化,支持了大模型的稳定高效训练。建设了多维数据体系,形成了数据挖掘、分析、合成、标注、评估闭环,充分释放数据价值,大幅提升模型效果。基于有监督精调、偏好学习、强化学习等技术进行多阶段对齐,保证模型更好地与人类的判断和选择对齐。可再生训练技术通过增量式的参数调优,有效节省了训练资源和时间,加快了模型迭代速度。此外,4.0在输入和输出阶段都进行知识点增强。 [84]2023年10月16日其他国家GoogleGoogle产品名称定位主要功能模型名称发布/更新时间BardBard是建立在一个大型语言模型基础上的人工智能聊天机器人将结合全世界的力量、智慧以及创造力,利用来自网络的信息提供新鲜、高质量的回应。 [73-74]LaMDA对话应用语言模型当地时间2023年2月6日发布可支持包括中文在内的40多种语言,图像分析功能,可以提取相关信息或为图片取标题。 [75]当地时间2023年7月13日更新Gemini人工智能模型“双子座"谷歌迄今为止功能最强大、最通用的大模型。它能够处理视频、音频和文本等不同形式的信息,相较于此前的版本,Gemini可以进行更复杂的推理,并实现更细致的信息理解。 [95]“双子座”是谷歌迄今最灵活的模型,能够在从数据中心到移动设备等不同平台上运行。“双子座”将推出Ultra、Pro和Nano三个版本。其中Ultra版本功能最强大,适用于复杂任务;Pro版本可扩展多种任务;Nano版本为高效设备端模型。 [96]-当地时间2023年12月6日发布Stability AIStability AI产品名称版本定位主要功能模型/参数发布/更新时间Stable Diffusion XL 1.0版本 人工智能AI 工具与前代产品(Stable Diffusion XL 0.9 版本)相比,生成的图片色彩“更鲜艳”、内容“更准确”,对比度、阴影和光照效果也更出众; 1.0 版是可定制的,用户就可以使用该 AI 工具完成复杂的设计;1.0版包含 35 亿个参数,可以在“几秒钟内”生成多种长宽比的完整图像;在文本生成方面,能在图片中生成各种形式的文本,免去用户后期调整字体的麻烦。 [76]SDXL 模型/35 亿个2023年7月发布Anthropic人工智能初创公司Anthropic产品名称版本定位主要功能发布/更新时间Claude-大语言模型聊天机器人聊天机器人Claude被不少人认为媲美ChatGPT; [81]美国软件服务公司Notion、社交问答网站Quora和搜索引擎DuckDuckGo已将Claude集成到其产品内。2023年3月15日发布 [78]版本2编码、数学和推理方面的性能都有所提高。升级之后,Claude 2的处理能力已经提升到了100K个Token,这意味着它可以处理数百页的技术文档,甚至是整本书。此外,面向更广泛的用户群体免费开放,并支持中文使用。 [79]2023年7月更新版本2.1可以为专业用户一次性消化多达20万个token,相当于500多页的材料,且出现“幻觉”或谎言的频率将是以前的一半,20万个token相当于Claude此前处理能力的两倍,且大幅高出GPT-4企业版3.2万个token的上限。 [80]2023年11月22日更新Character.AICharacter.AI产品名称定位主要功能发布/更新时间聊天机器人允许人们与名人或动漫角色的虚拟版本进行聊天,同时可以创建自己的聊天机器人和人工智能助手。Data from Similarweb显示,Character.AI的聊天机器人(具有不同角色和语气可供选择),吸引了18至24岁用户。与Open AI的ChatGPT和谷歌的Bard等其他聊天机器人相比,该公司通过此人口群体帮助自己在个人AI伴侣领域树立更加有趣的形象。 [81]-新手上路成长任务编辑入门编辑规则本人编辑我有疑问内容质疑在线客服官方贴吧意见反馈投诉建议举报不良信息未通过词条申诉投诉侵权信息封禁查询与解封©2024 Baidu 使用百度前必读 | 百科协议 | 隐私政策 | 百度百科合作平台 | 京ICP证030173号 京公网安备110000020000OpenAI是一家什么样的企业——OpenAI企业介绍 - 知乎
OpenAI是一家什么样的企业——OpenAI企业介绍 - 知乎切换模式写文章登录/注册OpenAI是一家什么样的企业——OpenAI企业介绍数据学习合肥工业大学 管理科学与工程博士最近的ChatGPT让OpenAI这家企业的名声更上一个台阶,这篇博客将详细介绍OpenAI这家企业及其发布的AI成果。由于OpenAI成立仅仅7年,因此,本文罗列了这7年时间里OpenAI最重要的研究成果。本篇博客内容较长,因为涵盖了过去7年OpenAI发布的重要技术成果!原文详情:OpenAI是全球最著名的人工智能研究机构,发布了许多著名的人工智能技术和成果,如大语言模型GPT系列、文本生成图片预训练模型DALL·E系列、语音识别模型Whisper系列等。由于这些模型在各自领域都有相当惊艳的表现,引起了全世界广泛的关注。这是旧金山的先锋大厦,也是OpenAI的办公室所在地OpenAI的创立历史OpenAI是由马斯克(Elon Musk)等人于2015年在旧金山创立的一家非盈利的人工智能研究公司,启动资金就有10亿美金,算是标准的富二代。正是由于”金钱“的力量,OpenAI的目标就是不受经济回报的限制来推进数字智能造福人类。OpenAI建立的目标就是为了与其它机构合作,进行AI的相关研究,并开放研究成果以促进AI技术的发展。OpenAI也被认为是DeepMind的有力竞争者。但是,从GPT-2模型之后,OpenAI认为模型效果太好,可能会被用来做不好的事情,因此开始限制研究成果的”开放“,这一点被很多人吐槽。2019年3月11日,OpenAI宣布从”非盈利(non-profit)“性质过度到”封顶(‘capped’ for profit)“营利性,利润上限为任何投资的100倍(创立了OpenAI LP公司)。也是这一年,微软向该公司投资了10亿美金,并获得了OpenAI技术的商业化授权。从此,OpenAI的一些技术开始出现在微软的产品和业务上。不过,OpenAI与微软的合作其实从2016年就开始,2016年,微软的云服务Azure为OpenAI提供了大规模实验的平台。Azure彼时已经为他们提供了带有InfiniBand互连的K80 GPU的算力资源,以优化深度学习的训练。2020年9月22日,OpenAI开始授权微软使用他们的GPT-3模型,也是全球首个可以享受GPT-3能力的公司。2020年6月11日,OpenAI发布了OpenAI API,这也是OpenAI第一个商业化产品。官方解释了,他们认为开发商业产品是确保OpenAI有足够资金继续投入AI研究的有效手段。自此,OpenAI也正是开始商业化运作。官方也解释了,使用API的方式提供模型而不是开源模型也将降低模型的使用门槛,毕竟对于中小企业来说,部署强大的AI模型所需要的成本可能更高。OpenAI发布的技术简史OpenAI发布了很多人工智能相关的技术,从工具到算法到论文到模型,都有涉及。这里将简单介绍一下他们发布的相关研究成果。由于OpenAI的成立时间很短,我们将根据年份来说明OpenAI发布的主要技术成果。2016年2016年4月27日,OpenAI发布了他们的第一个项目——OpenAI Gym Beta,这是一个用来开发和比较不同强化学习算法的工具。这个工具起初是OpenAI研究人员用来加速他们强化学习研究的,这个工具也是OpenAI第一个开放的成果。2017年2017年5月24日,OpenAI开源了一个重现强化学习算法的工具——OpenAI Baselines。强化学习由于过程十分复杂且影响因素众多,导致很多实验难以复现。因此,OpenAI开源了这个工具,目标是提供用于正确的强化学习算法实现的一些最佳实践,以帮助大家提高强化学习的研究效率。OpenAI Baselines中第一个基线化的模型是DQN(Deep Q-Network)2018年2018年6月11日,OpenAI公布了一个在诸多语言处理任务上都取得了很好结果的算法,即著名的GPT,这也是该算法的第一个版本。GPT是第一个将transformer与无监督的预训练技术相结合,其取得的效果要好于当前的已知算法。这个算法算是OpenAI大语言模型的探索性的先驱,也使得后面出现了更强大的GPT系列。也是在2018年6月份,OpenAI宣布他们的OpenAI Five已经开始在Dota2游戏中击败业余人类团队,并表示在未来2个月将与世界顶级玩家进行对战。OpenAI Five使用了256个P100 GPUs和128000个CPU核,每天玩180年时长的游戏来训练模型。在随后的几个月里OpenAI Five详情继续公布。在8月份的专业比赛中,OpenAI Five输掉了2场与顶级选手的比赛,但是比赛的前25-30分钟内,OpenAI Five的模型的有着十分良好的表现。OpenAI Five继续发展并在2019年4月15日宣布打败了当时的Dota2世界冠军。2019年2019年2月14日,OpenAI在博客《Better Language Models and Their Implications》中官宣GPT-2模型。也正是在这篇博客中,官方说到由于模型效果太好,他们担心模型会被恶意使用,在没有想好如何限制malicious applications之前是不会发布预训练结果的。GPT-2模型有15亿参数,基于800万网页数据训练。GPT-2就是GPT的规模化结果,在10倍以上的数据以10倍以上的参数训练。OpenAI在2月份GPT-2发布的时候仅仅公开了他们的1.24亿版本的预训练结果,其后的5月份发布了3.55亿参数版本的预训练结果,并在半年后的8月份发布了一个7.74亿参数版本的GPT-2预训练结果。2019年11月5日,15亿参数的完整版本的GPT-2预训练结果发布。同年3月4日,OpenAI发布了一个用于强化学习代理的大规模多代理游戏环境:Neural MMO。该平台支持在一个持久的、开放的任务中的存在大量的、可变的代理。许多代理和物种的加入导致了更好的探索,分歧的利基形成,以及更大的整体能力。4月25日,OpenAI继续公布他们最新的研究成果:MuseNet,这是一个深度神经网络,可以用10种不同的乐器生成4分钟的音乐作品,并且可以结合从乡村到莫扎特到披头士的风格。这是OpenAI将生成模型从自然语言处理领域拓展到其它领域开始。2020年2020年4月14日,OpenAI发布了Microscope,这是一个用于分析神经网络内部特征形成过程的可视化工具,也是OpenAI为了理解神经网络模型所作出的努力。2020年5月28日,OpenAI的研究人员直接提交了论文《Language Models are Few-Shot Learners》,正式公布了GPT-3相关的研究结果,这也是当时全球最大的预训练模型,参数1750亿!GPT-3在论文中展示了强大的能力,但是如前面的版本一样,官方没有公布预训练结果文件。但是,同年9月,GPT-3的商业化授权给了微软。同年6月17日,OpenAI发布了Image GPT模型,将GPT的成功引入计算机视觉领域。研究人员认为,transformer是与领域无关的,它们都是从序列中建模,因此计算机视觉领域依然可以使用。Image GPT也在当时取得了很好的成绩!2021年2021年1月5日,OpenAI发布CLIP,它能有效地从自然语言监督中学习视觉概念。CLIP可以应用于任何视觉分类基准,只需提供要识别的视觉类别的名称,类似于GPT-2和GPT-3的 "zero-shot "能力。这个模型是今年来多模态领域很有代表性的一项工作。同一天,OpenAI发布了DALL·E模型,这也是一个具有很大影响力的模型,DALL·E是一个120亿个参数的GPT-3版本,它被训练成使用文本-图像对的数据集,从文本描述中生成图像。DALL·E可以创造动物和物体的拟人化版本,以合理的方式组合不相关的概念,渲染文本,以及对现有图像进行转换。DALL·E的发布再一次惊艳世人。2021年8月10日,OpenAI发布了Codex。OpenAI Codex是GPT-3的后代;它的训练数据既包含自然语言,也包含数十亿行公开的源代码,包括GitHub公共存储库中的代码。OpenAI Codex就是Github Coplilot背后的模型。当然,Codex也没有公布,而是OpenAI收费的API。2022年2022年1月27日,OpenAI发布了InstructGPT。这是比GPT-3更好的遵循用户意图的语言模型,同时也让它们更真实,且less toxic,使用的技术是通过alignment研究开发的。这些InstructGPT模型是在人类的参与下训练的,这是一个AI对话系统,也是OpenAI收费的API。2022年3月15日,OpenAI新版本的GPT-3和Codex发布,新增了编辑和插入新内容的能力。也就是说除了之前的生成能力外,新增编辑和修改。同年4月6日,DALL·E2发布,其效果比第一个版本更加逼真,细节更加丰富且解析度更高。DALL·E系列由于可以生成任意图片内容,尽管官方做了很多努力阻止恶意结果产生,依然因为担心而没有放出。也许是因为开源的竞争产品如Stable Diffusion的压力,2022年7月20日,OpenAI的API增加了一年前发布的DALL·E(注意不是V2版本)。6月23日,OpenAI通过视频预训练(Video PreTraining,VPT)在人类玩Minecraft的大量无标签视频数据集上训练了一个神经网络来玩Minecraft,同时只使用了少量的标签数据。通过微调,该模型可以学习制作钻石工具,这项任务通常需要熟练的人类花费超过20分钟(24,000个动作)。它使用了人类原生的按键和鼠标运动界面,使其具有相当的通用性,并代表着向通用计算机使用代理迈出了一步。9月21日,OpenAI发布了Whisper,这是一个语音识别预训练模型,结果逼近人类水平,支持多种语言。最重要的是,相比较很长不开源成果的其它模型,这是一个完全开源的模型,不过其参数也就15.5亿。11月30日,OpenAI发布ChatGPT系统,这是一个AI对话系统,其强大的能力也让大家再次见识到了其强大的能力。ChatGPT在很多问题上近乎完美的表现使得它仅仅5天就有了100万用户。它可以帮助我们写代码、写博客、解释技术,可以多轮对话,写短剧等等。总结OpenAI是人工智能领域的明星公司。从马斯克等人创办开始就吸引了很多的目光。起初,其研究似乎主要是朝着强化学习努力。但是,随着预训练模型的崛起,他们在诸多领域的创新也让大家见识到OpenAI的强大实力。OpenAI发布的很多模型和系统都具有令人惊讶的效果。尽管随着其商业化进程的加速,免费开源的技术似乎变得稀有。但是,他们发布的技术引起了众多的追随者和竞争者。包括Meta AI、StabilityAI等竞争对手都发布了开源版本的兄弟模型。促进了AI领域的发展。原文详情:编辑于 2022-12-09 22:42・IP 属地江苏OpenAIChatGPT人工智能赞同 6313 条评论分享喜欢收藏申请
OpenAI
OpenAI
CloseSearch Submit Skip to main contentSite NavigationResearchOverviewIndexGPT-4DALL·E 3SoraAPIOverviewPricingDocsChatGPTOverviewTeamEnterprisePricingTry ChatGPTSafetyCompanyAboutBlogCareersResidencyCharterSecurityCustomer storiesSearch Navigation quick links Log inTry ChatGPTMenu Mobile Navigation CloseSite NavigationResearchOverviewIndexGPT-4DALL·E 3SoraAPIOverviewPricingDocsChatGPTOverviewTeamEnterprisePricingTry ChatGPTSafetyCompanyAboutBlogCareersResidencyCharterSecurityCustomer stories Quick Links Log inTry ChatGPTSearch Submit Your browser does not support the video tag. Introducing Sora: Creating video from textQuicklinksLearn more about SoraPioneering research on the path to AGILearn about our researchTransforming work and creativity with AIExplore our productsJoin us in shaping the future of technologyView careersSafety & responsibilityOur work to create safe and beneficial AI requires a deep understanding of the potential risks and benefits, as well as careful consideration of the impact.Learn about safetyResearchWe research generative models and how to align them with human values.Learn about our researchVideo generation models as world simulatorsFeb 15, 2024February 15, 2024Building an early warning system for LLM-aided biological threat creationJan 31, 2024January 31, 2024Weak-to-strong generalizationDec 14, 2023December 14, 2023Practices for Governing Agentic AI SystemsDec 14, 2023December 14, 2023ProductsOur API platform offers our latest models and guides for safety best practices.Explore our productsCareers at OpenAIDeveloping safe and beneficial AI requires people from a wide range of disciplines and backgrounds.View careersI encourage my team to keep learning. Ideas in different topics or fields can often inspire new ideas and broaden the potential solution space.Lilian WengApplied AI at OpenAIResearchOverviewIndexGPT-4DALL·E 3SoraAPIOverviewPricingDocsChatGPTOverviewTeamEnterprisePricingTry ChatGPTCompanyAboutBlogCareersCharterSecurityCustomer storiesSafetyOpenAI © 2015 – 2024Terms & policiesPrivacy policyBrand guidelinesSocialTwitterYouTubeGitHubSoundCloudLinkedInBack to top
OpenAI_百度百科
OpenAI_百度百科
Beta
進入詞條
清除歷史記錄關閉
反饋
分享
複製鏈接
請複製以下鏈接發送給好友
https://baike.baidu.hk/item/OpenAI/19758408
複製
複製成功
OpenAI
鎖定
OpenAI,是一家位於美國舊金山的人工智能研究公司,現由營利性公司OpenAI LP及非營利性母公司OpenAI Inc組成
[34]
。核心宗旨在於“創建造福全人類的安全通用人工智能(AGI)”
[65]
。使命是建立安全有益的AGL
[123]
,確保通用人工智能造福全人類
[66]
。OpenAI以大模型為核心開創了AI領域的新一輪創新範式,成為引領通用人工智能領軍企業
[34]
,在福布斯2023雲計算百強榜位列榜首。
[55]
OpenAI最早為非營利組織
[34]
,於2015年底由包括薩姆·奧爾特曼(Sam Altman)、彼得·泰爾(Peter Thiel)、裏德·霍夫曼(Reid Hoffman)和埃隆·馬斯克(Elon Musk)等創辦
[5-6]
。隨着2018年埃隆·馬斯克的退出以及大模型對資金超乎預期的需求,2019年3月,OpenAI從非營利性轉變為“封頂”的營利性。同年7月,微軟與OpenAI合作,注資10億美元,共同研發新的Azure AI超算技術
[34]
;截至2023年12月,微軟是OpenAI最大的投資者,擁有49%的股份
[49]
。2016年,發佈首個產品,即一款開源強化學習工具包—OpenAI Gym和Universe。2021年,設立初創企業基金,擬投資1億美元支持AI初創公司
[34]
。2022年11月30日,OpenAI全新聊天機器人模型ChatGPT問世,給AIGC的應用帶來了更多的希望,產品上線僅5天用户數量突破100萬
[50]
。2024年2月,文生視頻大模型Sora問世
[118]
,在全球內容創作行業捲起新的風暴,成為人工智能發展進程中的“里程碑”,預示着AGI將加速到來
[120]
。2023年,公司收入突破16億美元
[127]
。2024年2月,因Sora的爆火使OpenAI估值不到10個月增加近兩倍,或達800億美元。
[129]
公司名稱
美國開放人工智能研究中心
[20]
外文名
OpenAI
[20]
所屬行業
人工智能研究
成立時間
2015年12月11日
總部地點
美國舊金山
[4]
公司類型
人工智能
[20]
員工數
770 人(截至2023年11月)
[130]
CEO
薩姆·阿爾特曼(Sam Altman)
[24]
[30]
CTO
米拉·穆拉蒂(Mira Murati)
總 裁
格雷格·布羅克曼(Greg Brockman)
[47]
代表產品
ChatGPT
目錄
1
公司發展
▪
早期發展
▪
轉型期
▪
發展期
▪
財務狀況
2
價值理念
▪
哲學思想
▪
核心目的
▪
公司使命
▪
企業文化
3
公司治理
▪
融資結構
▪
管理架構
▪
人員架構
4
對外合作
▪
與微軟合作
▪
市場迴應
▪
與施普林格
▪
與淡馬錫
▪
與政府合作
5
團隊管理
▪
管理模式
▪
合作模式
▪
研究團隊
▪
應用團隊
▪
招聘策略
▪
工作方法
6
主要產品
▪
ChatGPT
▪
GPTs
▪
Assistants API
▪
Sora
7
產品管理
▪
發佈策略
▪
研發策略
▪
服務條款
8
風險管理
▪
風險評估
▪
網絡安全風險
▪
CBRN風險
▪
説服能力風險
▪
模型自主性風險
9
企業事件
▪
涉投訴
▪
涉訴訟
▪
被調查
▪
提起訴訟
▪
迴應質疑
▪
應用問題
▪
重組風波
▪
暫停賬户
▪
監管升級
▪
商標註冊
10
所獲榮譽
11
競爭對手
▪
中國
▪
其他國家
OpenAI公司發展
OpenAI早期發展
2015年12月11日,OpenAI由埃隆·馬斯克、美國創業孵化器Y Combinator總裁薩姆·奧爾特曼
[52]
、全球在線支付平台PayPal聯合創始人彼得·蒂爾等硅谷科技大亨創立。
[2]
OpenAI最早作為非營利組織。2015年底,由Elon Musk、薩姆·奧爾特曼和其他投資者成立
[34]
。埃隆·馬斯克(Elon Musk)與其他硅谷科技大亨進行連續對話後,決定共同創建OpenAI,希望能夠預防人工智能的災難性影響,推動人工智能發揮積極作用。特斯拉電動汽車公司與美國太空技術探索公司SpaceX創始人埃隆·馬斯克、Y Combinator總裁薩姆·阿爾特曼、天使投資人彼得·泰爾(Peter Thiel)以及其他硅谷巨頭2015年12月份承諾向OpenAI注資10億美元。
[1]
2016年6月21日,OpenAI宣佈了其主要目標,包括製造“通用”機器人和使用自然語言的聊天機器人。OpenAI研發主管伊利婭·蘇特斯科娃(Ilya Sutskever)、OpenAI CTO格雷格·布勞克曼(Greg Brockman)硅谷知名創業加速器Y Combinator總裁薩姆·奧爾特曼
[52]
(Sam Altman)以及連續創業家埃隆·馬斯克(Elon Musk)等人聯合發表博文稱:“我們正致力於利用物理機器人(現有而非OpenAI開發)完成基本家務。”
[1]
2016年,發佈首個產品,即一款開源強化學習工具包——OpenAI Gym和Universe。2016年4月27日,發佈OpenAI Gym Beta;12月5日,發佈Universe。2017年,“情緒神經元”和OpenAIFive項目的突破,使得OpenAI開始關注大型語言模型(LLM)和參數規模,實現AGI的信念增強。
[34]
7月20日,發佈Proximal Policy Optimization算法。
OpenAI轉型期
由非營利組織轉向混合結構2018年,隨着Elon Musk的退出,以及大模型對資金超乎預期的需求,2019年3月,OpenAI從非營利性轉變為“封頂”的營利性。在非營利母公司主體下,創建了一個限制性營利實體OpenAI LP,引入了上限利潤模式,允許OpenAI LP合法地吸收風險投資和員工持股。OpenAI轉向了混合結構:由營利性公司OpenAI LP及非營利性母公司OpenAI Inc組成。
[34]
2019年7月,微軟(Microsoft
[56]
)宣佈與OpenAI開展為期多年的合作。微軟投資OpenAI10億美元,雙方將攜手合作替Azure雲端平台服務開發人工智能技術。微軟也成為OpenAI的獨家雲供應商和OpenAI新AI技術商業化的首選合作伙伴。微軟的加持使得OpenAI的大模型開發如虎添翼。設立創業基金,由投資模式轉向孵化器模式2021年5月,OpenAI 官方宣佈了成立1億美元的人工智能創業基金,該基金將由OpenAI 管理,並由微軟和其他OpenAI 合作伙伴投資,計劃投資1億美元來幫助更多AI初創公司。投資方向:少數早期階段的創業公司,且處於可以產生變革性影響的領域,如醫療保健、氣候變化和教育以及基於生產力的人工智能工具。
[34]
[87]
OpenAI通過“資金+技術+戰略”支持的方式,支持優質的AI初創公司;反過來,被投公司成長起來後,增加OpenAI產品落地的場景需求和產業知識,從而反哺基礎技術創新。這一模式使得OpenAI可以超前把握未來顛覆性技術的機會,並超前投資佈局未來產業。這一轉變讓OpenAI的投資模式變為孵化器模式,從而更加高效地對目標企業進行投資與技術支持。從而有條件開始自己的第二階段戰略:通過“資金+技術”投資初創企業的方式積極佈局,為嵌入未來海量應用場景和指數型、裂變式增長鋪路。
[89]
OpenAI轉型期研發動態2018年2月20日,研究防止惡意使用AI;2018年4月9日,發佈OpenAI憲章;2018年7月30日,強化學習技巧;2019年2月14日,提升語言模型GPT-2模型;2019年3月11日,開放人工智能有限合夥人;2019年4月15日,OpenAI五人擊敗Dota 2世界冠軍;2019年4月25日,發佈深度神經網絡MuseNet;2019年8月20日,跟進GPT-2;2019年9月17日,研究多代理交互中的緊急工具使用;2019年10月15日,研究用機械手解魔方;2019年11月5日,發佈GPT-2:1.5B版本;2020年4月30日,發佈神經網絡Jukebox;2020年6月11日,開放人工智能應用程序接口;OpenAI宣佈了GPT-3語言模型,微軟於2020年9月22日取得獨家授權;2021年1月5日,研究連接文本和圖像神經網絡CLIP;2021年1月5日,研究從文本創建圖像神經網絡DALL·E;2021年3月4日,研究人工神經網絡中的多模式神經元;2021年8月10日,發佈開放人工智能法典;2022年4月6日,發佈新的人工智能系統DALL·E 2。
OpenAI發展期
主要歷程2022年11月30日,OpenAI發佈ChatGPT全新聊天機器人模型。
[26]
ChatGPT這一款革命性產品的上線引爆全球,成為用户破億速度最快的消費級應用。全年營收達到2800萬美元。2023年2月16日消息,OpenAI買下了超優質域名AI.com,並將其鏈接跳轉到了ChatGPT
[7]
; 同年3月,GPT登陸Bing,對搜索引擎帶來革命性重構。根據外媒TheInformation報道,OpenAI創始人最近對員工透露,其年營收達到了13億美元,也就是同比增長超過45倍。OpenAI逆襲成全球AI“新王”,開啓的新一輪AI革命的大幕。
[34]
2023年7月26日,安卓版ChatGPT在美國、印度、孟加拉國和巴西提供下載
[15]
。美國當地時間2023年8月16日,OpenAI宣佈收購初創企業Global Illumination,後者的整個團隊已加入OpenAI,共同開發包括ChatGPT在內的核心產品。
[41]
同年,9月14日,OpenAI宣佈將在愛爾蘭都柏林開設辦公室,這將是該公司的第三個辦事處。
[42]
當地時間2023年5月18日,在美國地區推出ChatGPT的首個官方移動應用程序ChatGPT APP
[12]
,5月19日躍升美國地區iOS APP Store(應用程序商店)排行榜首位。分析人士指出,此舉將快速開啓GPT大模型在垂直領域的應用,加速行業應用
[59]
。2023年5月,OpenAI開放眾多插件(當時已有70個),讓用户得以利用插件組合滿足個性化需求,成為了OpenAI創建生態系統、從產品思維轉變至平台思維的標誌性事件。2023年11月在首屆OpenAI開發者大會上,OpenAI首席執行官薩姆·奧爾特曼回顧了公司過去一年的發展歷程,已經有200萬開發者正在使用OpenAI的API(應用程序接口),在全球各地提供多種多樣的服務;92%的財富500強公司正在使用OpenAI的產品搭建服務,而ChatGPT的周活用户數也達到1億人。奧爾特曼向全球開發者和ChatGPT用户展示了AI龍頭即將推出的一系列產品更新:
[58]
一是,GPT模型再迭代,OpenAI將推出GPT-4 Turbo;二是OpenAI開始向AI個人助理的方向努力;三是宣佈將上線一個GPT商店,OpenAI允許用户申請上線自己製造的GPT,並承諾根據GPT的使用情況向創建者支付費用。
[60]
重大融資2023年1月OpenAI從微軟公司籌集了100億美元。據福布斯發佈2023雲計算100強榜單,2023年雲計算100強企業的平均融資金額為8.05億美元,高於一年前的6.1億美元,其中原因包括了OpenAI的重大融資活動。
[55]
OpenAI發展期研發動態2022年11月30日,研究ChatGPT:優化對話的語言模型。2023年,開放人工智能公司(OpenAI)GPT-4迎來“首秀”
[35]
。2023年2月2日,OpenAI宣佈推出ChatGPT Plus訂閲服務,可以讓用户在高峯期優先使用人工智能聊天機器人ChatGPT。
[3]
2023年3月發佈的GPT-4。
[58]
2023年5月,OpenAI推出了ChatGPT的iPhone應用程序ChatGPT APP。這款應用是ChatGPT的首個官方移動應用程序。
[12]
5月25日,OpenAI在推特宣佈,ChatGPT官方App現已在更多地區的App Store上線。
[36]
2023年7月,OpenAI宣佈,ChatGPT推出定製指令功能。
[37]
2023年7月26日,OpenAI通過其官方推特宣佈,安卓版ChatGPT在美國、印度、孟加拉國和巴西提供下載,並計劃將其推廣至更多國家。
[15]
[38-39]
當地時間2023年8月15日,OpenAI官宣,將GPT-4用於內容策略開發和內容審核決策,以實現更一致的標籤、更快的策略優化的反饋閉環以及更少的人工審核人員參與。
[40]
當地時間8月28日,OpenAI在官網宣佈推出企業版ChatGPT。
[18]
當地時間2023年10月3日,微軟在官網宣佈,OpenAI最新的DALL-E 3模型現已面向所有Bing Chat和Bing Image Creator用户開放。
[43]
薩姆·奧爾特曼在首屆OpenAI開發者大會
[58]
當地時間2023年11月6日,首屆OpenAI開發者大會。
[44]
在OpenAI 首屆開發者大會開啓前,ChatGPT 各種爆料已出,全新 UI 界面,人人可定製 GPT,將引領「智能體工程師」新職業誕生
[19]
OpenAI首席執行官薩姆·奧爾特曼向全球開發者和ChatGPT用户展示了AI龍頭即將推出的一系列產品更新。同日,OpenAI在官網宣佈推出自定義版本ChatGPT
[44]
,解禁了 ChatGPT 兩大能力,一是上傳多種類型文檔,二是無需轉換即可使用所有工具
[51]
。2023年11月22日,OpenAI宣佈ChatGPT Voice功能向所有用户開放。ChatGPT Voice是使用 OpenAI 的語音技術Whisper創建的,該技術只需分析幾秒鐘的真人語音即可生成無限小時的對話。Spotify正在使用OpenAI 的語音技術將Lex Friedman、Dax Shephard和其他播客的內容翻譯成西班牙語、法語和德語。
[64]
北京時間12月14日凌晨,CEO薩姆·奧爾特曼在X平台發文稱,已重新開放ChatGPT Plus訂閲
[82]
,在此前11月15日CEO 薩姆·奧爾特曼在X平台發文稱,將暫停ChatGPT Plus新用户註冊。
[86]
當地時間2024年1月10日,OpenAI宣佈推出GPT商店和ChatGPT Team服務
[108]
,ChatGPT Team和GPT Store都是OpenAI公司新的收入驅動力。
[110]
發佈首款文本生成視頻大模型。2024年2月16日,OpenAI公佈了一種新的人工智能系統Sora(“文字生成視頻”大模型),使其成為最新一家採用生成視頻技術的人工智能公司。用户僅需輸入簡短一句話,Sora可以生成一段長達60秒的視頻,遠遠超過市面同類型級別的AI視頻生成時長。
[112-113]
[120]
在Sora發佈的同時,OpenAI宣佈一項要約售股交易,由此OpenAI整體估值高達800億美元,一年內飆升兩倍多。
[120]
OpenAI財務狀況
收入狀況報道機構及時間統計時間報告內容金額主要來源CNBC2023年12月13日2022年OpenAI非營利組織收入44485美元幾乎全部來自投資收入The Information2023年8月2022年OpenAI全年收入2800萬美元受益於ChatGPT中國經營報2024年3月1日2023年年化收入(月收入x12)超16億美元一是軟件開發者調用API,向其支付流量費用;二是ChatGPT Plus會員訂閲費用;三是從微軟銷售OpenAI模型的收入中分成。
[127]
財務現狀OpenAI披露的收入並不包含營利部門的收入,而ChatGPT正在積極變現。根據OpenAI的融資信息, OpenAI的估值超過860億美元。OpenAI的財務狀況是一個黑匣子。OpenAI的非營利地位受到了批評者的批評,他們質疑一家價值860億美元的公司如何能由慈善機構控制。這也是2023年11月,OpenAI出現人事動盪的部分原因。
[88]
2024年1月,據The Information報道,受益於降價之後用户數強勁增長,OpenAI駛入商業化快行線,2023年底的年化收入(月收入x12)已突破16億美元。OpenAI估值也水漲船高,正籌劃新一輪融資,公司估值已達1000億美元,成為SpaceX之後美國估值第二高的創業公司。全球範圍內的估值排名位列第三。
[128]
OpenAI價值理念
OpenAI哲學思想
(主詞條 :有效利他主義)
英國哲學教授威廉·麥克阿斯基爾是有效利他主義運動的創始人
[28]
有效利他主義(Effective Altruism),最初是慈善領域的一個相對簡單的想法:在最有效的地方捐款,而不是僅僅為了“温暖的光輝”而無效地捐款。英國哲學教授威廉·麥克阿斯基爾(William MacAskill)是有效利他主義運動的創始人。鑑於以功利主義數學為基礎,該運動開始吸引來自大型科技公司的支持者,他們開始進一步推動這一邏輯。當可通過賺更多錢來增加捐款數額時,為什麼只關注捐贈的錢呢?這種邏輯表明,如果你有能力,在對沖基金或大型科技公司工作並進行捐贈比為慈善機構工作更道德。邏輯進一步推演,將信奉有效利他主義的人指向兩件事:星際定居(這樣人類就可以在地球滅絕事件之後生存)和通用人工智能(AGI)——人工智能的超級智能版本,如果正確“對齊”,可以為人類謀福利,極大地提高我們生存的長度和質量。這就是OpenAI應該發揮作用的地方。
[28]
OpenAI核心目的
OpenAI成立之初是一個真正的非營利組織,核心目的就是確保通用人工智能(AGI)安全引入。官網上都明確了OpenAI的目標是“確保人工智能造福全人類”。
[29]
OpenAI公司使命
OpenAI 的使命是確保人工智能(AGI)造福全人類。所謂 AGI,指的在最具經濟價值的工作中勝過人類的高度自主系統。這一使命體現在 OpenAI 公司章程中。在產品討論中有策略地使用了“在這些選項中,哪一個讓我們感覺更接近AGI”這一短語,有助於決定打造什麼、和因為使命而決定放棄。明確的重點永遠是速度的驅動力。使命有助於保持專注,也為許多新想法鋪平了道路。
[27]
OpenAI企業文化
在企業文化塑造方面,OpenAI將AI安全作為企業文化的核心部分,並在日常研發中貫徹這一理念。其通過與公眾的溝通和交流,強化了社會對AI安全問題的認知和理解。
[89]
OpenAI公司治理
OpenAI融資結構
初始資金-捐贈OpenAI初始資金是由企業家們捐贈,包括OpenAI創始人薩姆·奧爾特曼(Sam Altman),也包括埃隆·馬斯克的1億美元
[29]
。資助者似乎承諾在該組織的發展過程中向該組織提供數十億美元,因此它不需要擔心支付該項目的賬單。由於各種原因,包括性格衝突和方向差異——這種“純粹”的非營利模式並沒有持續多久,OpenAI原本以為可以從埃隆·馬斯克那裏得到的錢也枯竭了。
[28]
資金-混合結構 2019年,Altman的任務就是找錢,這使得OpenAI需要嘗試吸引商業參與者的投資,OpenAI轉向了混合結構。
[29]
希望一家公司能夠給他們帶來回報。在Altman領導的一系列舉措中,OpenAI轉向了混合結構,然而,投資者被警告説,他們應該考慮到OpenAI可能永遠不會產生利潤,該公司不會主要專注於實現利潤,而且他們最好認為,任何投資都更接近於捐贈,而不是產生回報。為尋求融資,OpenAI在母公司OpenAI Inc.下,成立了子公司OpenAI global,其中微軟的投資換取了OpenAI global高達49%的股份。作為交換,投資者可以預期的回報規模有一個相對慷慨的上限:即他們投入的100倍。因此,投資了10億美元的微軟最多可以期望1000億美元的回報。
[28]
OpenAI管理架構
董事會OpenAI的使命是打造一種造福人類的技術,早期是一家非營利機構;2019年OpenAI轉型為一家營利性公司,不過它仍然由一個非營利性的董事會管理。
[67]
微軟成為OpenAI最大的投資者,但是在OpenAI董事會沒有席位,甚至創始人薩姆·奧爾特曼本人也沒有該公司的任何股權——這對於該行業來説幾乎是聞所未聞的情況。從理論上講,該模式將吸引志同道合的投資者,願意接受極其不尋常的治理情況,這將有助於公司專注於其使命。
[28]
OpenAI的組織結構。
[28]
一方面,董事會擁有任免CEO的權力,但包括Altman在內,董事會成員不持有母公司股份,OpenAI理論上不存在淪為內部人控制的公司的危險;另一方面,投資者是子公司(也是母公司的運營主體)的大股東,卻在公司董事會沒有席位,做到了與經營隔離,僅僅是戰略投資者。
[29]
OpenAI試圖建立一家大型科技初創公司,而創始人/首席執行官Altman並未擁有無懈可擊的權力。
[28]
根據OpenAI官方説明,董事會的多數成員是相互獨立的,各自有不同的背景和專業領域,共同決策和指導OpenAI的發展方向。而從董事會構成來看,奧爾特曼、布洛克曼和蘇茨克維與公司具有最直接的聯繫,而另外三個則有其他社會任職。
[31]
OpenAI發佈公告
[105]
2023年12月20日,OpenAI發佈公告:將建立專門小組,來監督技術工作和安全決策的操作結構,公司管理層做決策,董事會有權推翻。
[105]
安全顧問團當地時間2023年12月18日,OpenAI發佈新安全指南,闡釋公司計劃如何應對最強大人工智能(AI)系統可能引起的極端風險。在該指南下,OpenAI只會在確定最新技術的安全性之後才會開始運用。公司加強其內部安全流程,將成立一個顧問團隊以審核安全報告,再轉交公司高層和董事會,並賦予董事會對高風險人工智能的否決權。
[99]
團隊和流程
[105]
安全顧問團負責按月同時向公司管理層和董事會彙報,確保所有決策者充分了解情況。對於不同時間尺度的AI風險,OpenAI成立了三個團隊來分別應對:安全系統團隊(Safety Systems)負責當下,減少現有模型如ChatGPT的濫用。準備團隊(Preparedness)負責不久的將來,識別和管理GPT-5等正在開發的前沿模型帶來的新風險,由MIT教授Aleksander Madry領導。
三個安全小組應對內容
[105]
超級對齊團隊(Superalignment)負責遙遠的未來。
[105]
OpenAI人員架構
2022年6月,量子計算專家、ACM計算獎得主Scott Aaronson宣佈,將加盟公司。
[2]
2023年早些時候,OpenAI董事會成員從9人縮減至6人,其中:薩姆·奧爾特曼、伊爾亞·蘇茨克維以及OpenAI總裁格雷格·布羅克曼(Greg Brockman)是該實驗室的三位創始人,而其他三人都是獨立董事。
[57]
2023年11月17日下午,公司董事會宣佈首席執行官薩姆·奧爾特曼(Sam Altman)將立即離職。
[28]
2023年3月,左:穆拉蒂、奧爾特曼、布羅克曼、蘇茨克維爾
[67]
2023年11月18日消息,OpenAI原本的董事會成員包括:奧爾特曼、布洛克曼、蘇茨克維、Quora首席執行官Adam D’Angelo、技術企業家Tasha McCauley以及喬治城大學安全與新興技術中心的Helen Toner。其中:奧爾特曼、布洛克曼和蘇茨克維都是OpenAI的聯合創始人,加上首席技術官米拉·穆拉蒂(Mira Murati),四人構成了OpenAI的核心團隊,是ChatGPT-3.5的背後“英雄”。奧爾特曼和布洛克曼的離職,使得蘇茨克維成為OpenAI董事會中唯一剩下的創始人。
[31]
OpenAI發表聲明
[53]
2023年11月22日,OpenAI發表聲明稱:薩姆·奧爾特曼(Sam Altman)將回歸OpenAI擔任首席執行官。OpenAI組成新初始董事會,三名成員分別是:董事會主席布萊特·泰勒(Bret Taylor)、美國前財政部長拉里·薩默斯(Larry Summers)、問答網站Quora的首席執行官亞當·迪安傑羅(Adam D'Angelo)
[30]
[49]
11月30日,OpenAI宣佈,薩姆·奧爾特曼(Sam Altman)已經迴歸擔任首席執行官,米拉·穆拉蒂擔任首席技術官,格雷格·布羅克曼擔任總裁。
[47]
2024年2月13日(當地時間),人工智能研究員、OpenAI創始成員之一安德烈·卡爾帕西(Andrej Karpathy)在社交媒體平台X上發文稱,他已離開OpenAI。
[111]
經歷歷程職位人物姓名人物簡介人物圖片創始團隊成員首席執行官/初始資金資助者薩姆·奧爾特曼(Sam Altman)OpenAI聯合創始人
薩姆·奧爾特曼(1張)
首席科學家伊爾亞·蘇茨克維(Ilya Sutskever)OpenAI聯合創始人
伊爾亞·蘇茨克維
[69]
初始資金資助者埃隆·馬斯克(Elon Musk)OpenAI聯合創始人。南非出生的美國知名企業家;美國特斯拉汽車公司的CEO兼產品架構師。因創辦SpaceX,以及聯合創辦特斯拉汽車和PayPal(貝寶)而聞名。規劃創立了SolarCity公司,是最大股東和董事會主席
[61]
;推特公司CEO
[62]
;美國神經連接公司(Neuralink)創始人。
[63]
埃隆·馬斯克
[61]
董事會(6人)董事長、總裁格雷格·布羅克曼(Greg Brockman)OpenAI聯合創始人。學生生涯中曾獲數學、化學等多項國際大獎。在哈佛大學就讀一年後轉投MIT(麻省理工學院),2010年輟學加入線上支付公司Stripe。2013年,成為Stripe的首位首席技術官,2015年離開公司,並與特斯拉CEO埃隆·馬斯克、奧爾特曼一道共同創立了OpenAI。
格雷格 • 布羅克曼
[70]
董事、CEO薩姆·奧爾特曼(Sam Altman)OpenAI聯合創始人。奧爾特曼在布洛克曼2010年加入Stripe期間正好供職於Y Combinator,而Y Combinator正好是Stripe的種子投資方。2015年,與布洛克曼、特斯拉CEO埃隆·馬斯克
薩姆·奧爾特曼
[72]
董事、首席科學家伊爾亞·蘇茨克維(Ilya Sutskever)OpenAI聯合創始人。2012年多倫多大學畢業後先後在斯坦福大學、多倫多大學、谷歌進行科研工作。2015年加入OpenAI共同創立了OpenAI。
伊爾亞·蘇茨克維
[70]
獨立董事亞當·迪安傑羅(Adam D'Angelo)美版知乎Quora首席執行官。長期與人工智能打交道
亞當·迪安傑羅
塔莎·麥考利(Tasha McCauley)蘭德公司的兼職科學家。曾從事技術和人工智能政策及治理問題的研究,並在奇點大學任教
塔莎·麥考利
海倫·託納(Helen Toner)喬治城大學安全與新興技術中心戰略主管。是有效利他主義團體的一員,他們認為人工智能將來會毀滅人類
海倫·託納
新初始董事會(2023年11月22日)董事會主席布萊特·泰勒(Bret Taylor)擁有斯坦福大學計算機科學專業碩士學位。 曾任Facebook首席技術官、Salesforce聯席首席執行官
成員首席執行官薩姆·奧爾特曼(Sam Altman)OpenAI聯合創始人
薩姆·奧爾特曼
成員拉里·薩默斯(Larry Summers) 前民主黨財政部長和哈佛大學校長,經濟學家。1993年,他因在經濟學界的傑出表現獲得美國約翰·貝茨·克拉克獎章。第一個獲得美國國家科學基金會艾倫·沃特曼獎的社會科學家、美國計量經濟學學會會員和美國藝術科學學會成員
拉里·薩默斯
成員亞當·迪安傑羅(Adam D’Angelo)原董事會成員,前問答網站Quora創始人,Facebook首任CTO
亞當·迪安傑羅
首席技術官米拉·穆拉蒂(Mira Murati)曾任特斯拉的Model X車型的高級產品經理。2018年加入OpenAI,被稱作“ChatGPT之母”,是OpenAI核心團隊四名成員之一
[31]
;主要負責兩款產品:一是ChatGPT,二是DALL-E的人工智能系統。2023年11月17日在OpenAI“地震級”人事變動中,原CTO米拉·穆拉蒂補位出任臨時CEO;同月30日奧爾特曼迴歸擔任CEO,Mira Murati擔任首席技術官。
[68]
米拉·穆拉蒂(2張)
參考資料:
[28]
[30-31]
OpenAI對外合作
OpenAI與微軟合作
OpenAI最大投資者自2019年起,微軟與OpenAI建立了合作伙伴關係。微軟是OpenAI最大的投資者。截至2023年12月,微軟已向OpenAI這家人工智能初創公司投資了130億美元,擁有其49%的股份。微軟已將OpenAI的最新技術整合到自己的企業工具套件中,OpenAI也在微軟的雲服務上投入了大量資金。雙方業務合作微軟(Microsoft)建立了全球最大的超級計算集羣之一,以幫助OpenAI訓練規模更大、能力也更強大的人工智能模型。微軟的聊天機器人和搜索引擎Bing Chat根據OpenAI的模型構建,首次亮相以來用户使用該機器人已經聊天超過10億次,能夠根據用户提示轉化圖像的Bing Image Creator生成圖像超過10萬張。
[56]
董事會席位OpenAI在戲劇性的內鬥事件之後,組成新初始董事會,微軟獲得了一個“無投票權觀察員”席位,即公司代表可以參加OpenAI的董事會會議並獲取機密信息,但在選舉或選擇董事等事項上沒有投票權。這也一定程度意味着微軟在OpenAI的後續經營管理中將擁有更大話語權。微軟總裁Brad Smith表示:“自2019年以來,微軟與OpenAI建立了合作伙伴關係,促進了更多的人工智能創新和競爭,同時保持了兩家公司的獨立性。而唯一改變的是,微軟現在將在OpenAI董事會中擁有一個無投票權的觀察員席位,這與谷歌收購DeepMind等案例截然不同。”
[49]
OpenAI市場迴應
CMA主動評估Microsoft和OpenAI的合作關係2023年12月8日消息,英國競爭和市場管理局(CMA)認為,人工智能在市場上的擴張速度是史無前例的,而基礎模型的快速發展意味着當前是這一變革性技術發展的關鍵時刻,人工智能開發商之間需要持續的競爭,這將有助於整個行業的發展,因此需要特別關注微軟與OpenAI之間的合作關係。英國反壟斷監管機構表示,將審查微軟與OpenAI的合作是否導致了“獲取控制權”的情況,即一方對另一方具有重大影響力或控制權,如果存在可能導致阻礙行業競爭的問題,那麼該機構後續將採取更多針對性行動。
[49]
OpenAI與施普林格
2023年12月,新聞出版巨頭施普林格出版集團(Axel Springer)與 ChatGPT 開發機構 OpenAI 宣佈達成一項史無前例的協議,允許 ChatGPT 對來自 Politico 和 Business Insider 等媒體的新聞文章進行總結摘要。施普林格也成為全球第一家與 OpenAI 合作將新聞業與人工智能技術進行更深入整合的出版機構,這是媒體為在人工智能工具中使用其內容而爭取資金補償的一個重要里程碑。OpenAI 和施普林格的協議生效後,當用户向 ChatGPT 提問時,它將以來自 Politico、Business Insider、Bild 和 Welt 等媒體的新聞文章摘要作為迴應。作為協議的一部分,施普林格將為 OpenAI 的大型語言模型(例如支持 ChatGPT 的 AI 模型 GPT-4)提供其媒體品牌的內容作為其訓練數據。
[85]
OpenAI與淡馬錫
有意投資OpenAI2024年3月,新加坡主權財富基金淡馬錫有意投資 OpenAI。其高管最近幾個月多次會見了 OpenAI 首席執行官薩姆·奧爾特曼。若淡馬錫與 OpenAI 雙方達成合作,這將是 OpenAI 首次獲得國家背景的資金支持。淡馬錫由新加坡財政部完全控股。2021 年淡馬錫規模高達 3810 億新加坡元(當前約 2 萬億元人民幣),其與另一隻新加坡政府所有的基金 GIC 一同進入主權財富基金榜單前十。科技領域一直是淡馬錫投資組合的一部分,而 AI 正成為其關注重點。
[124]
OpenAI與政府合作
OpenAI通過與政府機構的積極對話和合作,推動了AI安全監管標準的制定和實施。其目標是將安全評估作為AI系統的必要環節,以防止不負責任的開發和使用行為。薩姆·奧爾特曼也多次在公開場合強調安全對於AI的重要性,積極推動建立國際規範和標準。
[89]
為何Altman欲與政府聯手?顯然,只要成為規則制定者,就能在競爭中贏者通吃。北京時間2023年5月16日,OpenAI首席執行官薩姆·奧爾特曼在出席美國國會聽證會時表示,面對日益強大的AI模型,政府監管機構的干預對於控制相關風險來説至關重要。
[59]
薩姆·奧爾特曼在美國參議院就AI技術的潛在危險作證,並敦促立法者對製造先進AI的組織實施許可要求和其他法規。面對美國國會,薩姆·奧爾特曼再次斬釘截鐵地保證:在未來六個月內,OpenAI堅決不會訓練GPT-5。同時,也對全世界發出警告:AI有可能會對世界有害,為了應對日益強大的AI風險,我們需要加強監管和立法,而政府的干預極為重要。此次聽證會,Altman開門見山地告訴參議院:AI技術可能會出錯,表示自己很擔心人工智能行業對世界造成重大傷害(cause significant harm to the world)。希望與政府合作,防止這種情況發生。
OpenAI欲與政府聯手,權力通天(2張)
對於怎麼監管,Altman也替政府想好了,提出了成體系方案,包括三點:一是成立一個新的政府機構,負責為大型 AI 模型頒發許可,撤銷不符合標準的模型的許可;二是為 AI 模型創建一套安全標準,包括對其危險能力的評估。例如,模型必須通過安全測試,比如它們是否可以“自我複製”和“流出到監管之外”;三是要求獨立專家對模型在各種指標上的表現進行獨立審計。
[90]
OpenAI團隊管理
OpenAI管理模式
OpenAI在管理思維、人才選擇、工作方法諸多方面的獨到之處。1. 人才密度。公司極其重視“人才密度”,傾向於招聘年齡更大的資深技術人員,小型、資深、專注的團隊往往有極高的工作效率。OpenAI只有約700名員工,但工作產出可能比大它一萬倍的公司還要更高;2. 更有效率。工作節奏非常緊張,但這裏不是拼命卷工作時長的地方,許多員工要抽出時間陪伴家人,倒逼他們更有效率地完成任務。3. 面對面溝通。辦公室面對面的溝通仍然非常重要。一些創造性的解決方案是在辦公室的社交互動中誕生的,OpenAI團隊會在午餐桌上碰撞出很多新想法,4.緊密協作。 OpenAI根據職能劃分了研究/應用團隊,但不同團隊之間的協作非常緊密。在ChatGPT團隊裏,既有設計師和產品經理,也有軟件工程師和研究人員。不同職能的團隊都需要了解對方的工作,避免出現研究部門只專注於實驗,而產品部門只想商業化和賺錢的情況。5.目標明確。 “打造AGI”這一使命是OpenAI團隊所有人的終極目標,也是日常工作的指引。使命不僅有助於決定做什麼,也有助於決定不做什麼。
[27]
OpenAI合作模式
研究和應用在OpenAi,研究部門和應用部門是兩個獨立的組織結構。研究部門訓練大型模型,然後應用部門在這些模型的基礎上構建 ChatGPT 和 API 等產品。在實踐中,這是一個更加緊密結合的過程。應用團隊與研究部門的緊密耦合是能迅速地推出新創意的原因。能快速推出瀏覽、代碼執行、插件和其他 ChatGPT 功能,是因為團隊間的緊密集成。在 ChatGPT 的案例中,大部分研究人員來自研究團隊。這些研究人員精通最新的微調技術和強化學習 (RL) 方法,如臨近策略優化 (PPO)。由於這些研究人員也是產品組的一員,而且他們自己也在進行A/B實驗,因此研究和工程之間的反饋迴路非常緊密。“DERP”模式在大多數科技公司,與工程部合作的 "經典 "三人團隊被稱為“EPD”(即:工程、產品、設計)。OpenAI則認為將研究融入產品團隊至關重要,與經典的“EPD”相比,OpenAI更喜歡把合作緊密的團隊稱為“DERP”(即:設計、工程、研究、產品)。在OpenAI,許多產品問題實際上是研究問題。比如,這些問題可以被視為功能請求:如何讓ChatGPT生成更簡潔的輸出結果、如何生成更準確的答案、如何連接更多數據源等。這些問題看似產品問題,但實際上這些問題在很大程度上依賴於研究,如何調整或微調基礎模型以實現預期目標。
[27]
OpenAI研究團隊
團隊目標開展的研究活動有助於公司加快產品上線的速度。研究工作就是要不斷思考統一的方法、打造功能更強的模型。研究團隊也要確保工作能和別的研究有交匯的地方,朝着AGI的方向發展。運營模式在研究組織內部,有各種不同的研究團隊。如有預培訓團隊負責培訓 GPT-4 模型;培訓後團隊負責對 GPT-4 進行微調,還有負責校準的團隊和讓 GPT-4 能看、能聽、能説的多模態團隊等等。研究人員具有重要的學術或行業背景,閲讀大量學術論文,以瞭解最新技術,提出想法並進行大量實驗,以改進模型,研究人員要做大量的工程設計並編寫大量的代碼。
[27]
OpenAI應用團隊
團隊目標應用團隊是負責開發這些產品的工程、產品和設計的團隊,在內部被稱為“應用團隊”。應用團隊是公司內部的一個新成員,始於 2020 年夏天。OpenAI 的目標是構建對全人類有用的安全 AGI。應用團隊的目標是打造真正讓人工智能造福全人類的產品。之所以組建團隊,是因為想要圍繞 GPT-3 構建並擴展一個 API。模式創新ChatGPT 是應用團隊內部的一個產品團隊。讓ChatGPT像一家小型獨立創業公司一樣運營,研究和應用緊密結合,長期的產品和研究思維,漸進式發佈,高人才密度,日積月累的習慣。2022年夏天,OpenAI開始開發 ChatGPT。當時,應用團隊大約有 30 名工程師、幾名項目經理和設計師,正在運行的產品包括、GPT-3 和 Codex 的API接口、模型微調、嵌入應用程序、DALL-E 2等。所有這些產品都使用相同的代碼庫,在同一個集羣中運行,並使用相同的構建管道。ChatGPT 的出現改變了這種狀況。幾位應用工程師、一些設計師、研究人員和 Greg Brockman(OpenAI 的總裁兼聯合創始人)聚在一間屋子裏,開始快速迭代產品創意。給這個新生團隊提供了自己的代碼庫和一個全新的集羣。不斷迭代,尋找產品市場契合點(Product Market Fit)。隨着 ChatGPT 團隊的壯大,確保團隊保持垂直整合,意味着工程、產品、設計和主要研究人員始終緊密合作。OpenAI應用工程團隊負責人Evan Morikawa説,這種“分形初創公司”的方法對於任何新產品類別來説都是一個很好的模式。
[27]
OpenAI招聘策略
高人才密度OpenAI的CEO非常關注人才的高密度 。所謂“高人才密度”,指的是平均技能和業績表現遠高於其他地方的正常水平,出色的工作在OpenAI是最基礎的。經驗豐富的團隊可以非常非常快地交付產品,在應用團隊招聘時有意向高級工程人員傾斜。此外,儘量保持小規模,事實證明,因為規模非常小的高級團隊可以很快完成任務。善於團隊配合團隊中容不下不善於團隊配合的“獨行俠”:希望避免吸引那些一心追求晉升的人,這些人總會為了提升自己的頭銜,製造冗餘的複雜產品;希望每個人都能很好地溝通,做任何對任務最有利的事情。只要能堅持這一點,就會更加專注、更快地完成任務。關注AI安全性OpenAI把安全放在首位,而不是速度。在招聘時,非常關注AI安全性。公司不希望形成一種速度凌駕於安全之上的文化。
[27]
OpenAI工作方法
OpenAI的日常工作方法也是公司快速發展的因素之。週一至週三,團隊會在辦公室工作。每個人週一、週二、週三都在舊金山總部辦公。協調每天的工作是提高工作效率的關鍵。靠這種協調性,在一週的前三天就能抵達關鍵工作節點。主要產品工作節奏相當緊張。使命、產品和技術的影響力促使大家努力工作。需要強調,這並不一定意味着員工工作時間很長,OpenAI不是那種凌晨2點還有一堆人沒下班的地方。 每個人都非常重視家庭時間。對家庭的關注,也讓團隊必須高度集中注意力,分清輕重緩急,靈活安排時間。
[27]
OpenAI主要產品
OpenAIChatGPT
產品定義ChatGPT,全稱Generative Pre-trained Transformer,是OpenAI於2022年11月30日發佈的全新聊天機器人模型;是OpenAI公司開發的一種人工智能智能文本生成技術,它可以模擬人類對話的方式,生成有邏輯、有思考、有趣味的文本。
[77]
基本原理基本原理是,通過深度學習算法,將大量的文本內容輸入模型中進行訓練,模型會自動學習語言的結構規律,從而可以生成高質量的文本。
[77]
產品定位在 GPT 出現之前,NLP 模型主要是基於針對特定任務的大量標註數據進行訓練。但會存在一些限制:大規模高質量的標註數據不易獲得;模型僅限於所接受的訓練,泛化能力不足;無法執行開箱即用的任務,限制了模型的落地應用。為了克服這些問題,OpenAI 走上了預訓練大模型的道路。從 GPT-1 到 ChatGPT,就是一個預訓練模型越來越大、效果越來越強的過程, 不斷迭代。
[94]
在OpenAI的官網上,ChatGPT被描述為優化對話的語言模型,是GPT-3.5架構的主力模型。GPT- 3.5架構基於OpenAI於2020年推出的GPT-3架構,即生成式語言模型的第3代。早在2020年6月,在訓練約2000億個單詞、燒掉幾千萬美元后,史上最強大AI模型GPT-3一炮而紅。產品功能作為聊天機器人,ChatGPT具有同類產品具備的一些特性,例如對話能力,能夠在同一個會話期間內回答上下文相關的後續問題。在網友們曬出的截圖中,ChatGPT不僅能流暢地與用户對話,甚至能寫詩、撰文、編碼等。ChatGPT驚豔的語言能力,在互聯網上掀起了一場“AI風暴”,比如用它做翻譯、改錯別字、debug(計算機程序糾錯)等,的確達到了非常好的效果。2023年8月28日(當地時間),OpenAI在官網宣佈推出企業版ChatGPT,將提供企業級安全和隱私保護、無限高速的GPT-4訪問、處理更長輸入的上下文窗口、高級數據分析能力、定製選項等等。
[18]
新解鎖功能
[51]
可上傳 PDF、數據文檔等多種類型文檔;無需轉換即可使用所有工具(如訪問瀏覽、高級數據分析、DAL·E)
[51]
。應用範圍CHATGPT的應用範圍非常廣泛,可以用於智能客服、智能聊天機器人、自動化寫作等方面;可以通過與用户的互動,根據用户的需求生成相應的文本,從而提升用户的體驗感。除此之外,CHATGPT還可以用於自動化寫作,比如新聞報道、文學創作等方面,可以大大提高寫作的效率和精度。隨着智能化的發展,CHATGPT技術將會在越來越多的領域發揮作用,成為自動化智能服務的重要支撐。
[77]
產品版本版本名稱發佈時間提供服務主要功能GPT-12018年第一代生成式預訓練模型從有監督到無監督。GPT-1 的關鍵特徵是:半監督學習。GPT-1 的效果明顯,只需要極少的微調,就可以增強 NLP 模型的能力,減少對資源和數據的需求。同時,GPT-1 也存在明顯的問題,一是數據侷限性,GPT-1 是在互聯網上的書籍和文本上訓練的,對世界的認識不夠完整和準確;二是泛化性依然不足,在一些任務上性能表現就會下降。
[94]
GPT-22019年第二代生成式預訓練模型與 GPT-1 並沒有本質上的不同。架構相同,使用了更大的數據集 WebText,大約有 40 GB 的文本數據、800 萬個文檔,併為模型添加了更多參數(達到驚人的 15 億個參數)提高模型的準確性,可以説是加強版或臃腫版的 GPT-1。有研究表示,GPT-2 生成的文本幾乎與《紐約時報》的真實文章(83%)一樣令人信服。
[94]
GPT-32020年第三代,語言處理人工智能模型;該程序利用深度學習生成類似人類語言的文本。包括語言翻譯和為聊天機器人生成文本等。GPT-3有1750億個參數,是 GPT-2 的 117 倍
[94]
。研究結果表明:具備用零樣本學習方法解決一系列類比問題的初步能力;能夠回答大多數問題甚至為人類起草論文的GPT-3,在從頭開始回答問題和回答多選題時的表現超過了人類。
[93]
GPT-3 也在商業應用上表現出了極高的穩定性和實用性,通過雲上的 API 訪問來實現商業化。這種入得了實驗室、下得了車間的能力,使得 GPT-3 成為 2020 年 AI 領域最驚豔的模型之一。
[94]
GPT-3.52022/11/30第四代聊天機器人。OpenAI 設計系列 NLP 模型中的第四個不僅能夠回答各種問題,還能夠創作詩歌、故事、歌曲、代碼等內容,甚至能夠模仿名人的風格和語氣。它的出現,開啓了生成式AI領域的新篇章。
[95]
產生了技術路線上的又一次方向性變化:基於人工標註數據 + 強化學習的推理和生成。
[94]
GPT-42023/03/14多模態預訓練大模型。任何擁有OpenAI API訪問權限的人都可以採用這種方法創建自己的人工智能輔助審核系統。
[92]
具備更高水平的識圖能力,且能夠生成歌詞、創意文本,實現風格變化;GPT-4的文字輸入限制也提升至2.5萬字,且對於英語以外的語種支持有更多優化。
[91]
8月15日,OpenAI官宣,將GPT-4用於內容策略開發和內容審核決策,以實現更一致的標籤、更快的策略優化的反饋閉環以及更少的人工審核人員參與。GPT-4 Turbo-購買ChatGPT Plus服務的付費用户和API企業客户都可以訪問。從寫代碼到寫劇本、創建圖像,根據冰箱裏食物的照片倒推食譜,可以使用越來越多的互聯網連接工具。
[56]
GPT Store2024年1月有超過300萬個自定義版本的ChatGPT
[109]
從GPT Store界面的構成來看,應用商店類目包括:Featured:本週精選特色應用;Trending:社區最受歡迎的GPTs;By ChatGPT:由ChatGPT團隊創建的GPTs。GPTs根據應用的用途劃分為“寫作”“效率”“研究和分析”“編程”“教育”和“生活方式”等類目。ChatGPT Team2024年1月可以訪問如GPT-4和DALL·E 3等高級模型,以及高級數據分析等工具。ChatGPT Team還包括一個專門用於團隊的協作工作空間和用於團隊管理的管理工具。團隊可以擁有並控制自己的業務數據——我們不會對業務數據或對話進行訓練,我們的模型也不會在團隊使用過程中學習。ChatGPT Team是OpenAI企業產品的較小版本,適用於用户數量少於150名的企業。Plus用户是無法使用這個功能的,OpenAI為ChatGPT Team提供了單獨的收費標準:25美元/月或每月支付每個用户30美元。
[109-110]
訓練方式據OpenAI的官方文檔,相比之前的GPT模型,OpenAI採用了全新的訓練方式,即一種名為“從人類反饋中強化學習”(Reinforcement Learning from Human Feedback,RLHF)的訓練方式對 ChatGPT 進行了訓練。OpenAI讓人類訓練師扮演對話的雙方提供對話作為學習資料。在人類扮演聊天機器人的時候,OpenAI也會讓模型生成一些建議來幫助訓練師撰寫自己的回覆。也就是説,基於優秀的機器學習算法和強勁的算力,通過海量的數據訓練,來讓AI學會“思考”。
方法
[71]
ChatGPT還採用了注重道德水平的訓練方式,按照預先設計的道德準則,對不懷好意的提問和請求“説不”。一旦它發現用户給出的文字提示裏面含有惡意,包括但不限於暴力、歧視、犯罪等意圖,它都會拒絕提供有效答案。產品團隊ChatGPT 是設在應用團隊內部的產品團隊,由軟件工程師、設計師、產品經理和研究人員共同組成。
[27]
體驗流程ChatGPT的體驗流程更方便,只要註冊一個OpenAI的賬號就可以體驗了,與早期的模型需要申請通過才能體驗相比,ChatGPT影響的人羣更廣泛,討論的人會更多。侷限性ChatGPT有時會寫出看似合理但不正確或荒謬的答案。這是Open AI認為ChatGPT所面臨的“限制”,並且解決這個問題被認為是具有挑戰性的。其背後原因有三,首先,強化學習的信息源目前並未建立;其次,模型通過學習變得更加謹慎會導致其迴避原本能夠正確回答的問題;另外,監督學習將會對模型造成誤導,因為理想的答案應該來源於模型的認知,而非人工演示者的認知。ChatGPT的能力獲得是基於龐大的語料庫,凝練了多領域問題的很多數據做相互校驗,然後挑一些基礎性的內容回答出來,這其實是“舉一千反一”的過程,與人類舉一反三的能力還相差較遠,它不具備思考能力,所以犯錯誤不可避免,但通過人為的干預反饋,這些問題是可以被改進的。
[26]
市場運用在首次亮相後的幾個月裏,ChatGPT已經成為一種全球現象。2022年12月,在OpenAI宣佈有超過一百萬人註冊該服務幾天後,OpenAI總裁格雷格·布羅克曼(Greg Brockman)在Twitter上説,該服務的用户已經達到200萬。ChatGPT也是一個資金陷阱。沒有廣告,根據奧爾特曼在Twitter上發表的一篇文章,每一次對話的數據處理成本平均為“幾美分”,每週可能達到數百萬美元。為了抵消這些成本,該公司2023年2月宣佈將在付費版中收取每月20美元的訂閲費,稱為ChatGPT Plus。2023年2月3日,瑞士銀行巨頭瑞銀集團的一份報告顯示,在人工智能聊天機器人ChatGPT推出僅兩個月後,它在2023年1月末的月活用户已經突破了1億,成為史上用户增長速度最快的消費級應用程序。根據Sensor Tower的數據,TikTok達到1億用户用了9個月,Instagram則花了2年半的時間。ChatGPT的成功使OpenAI進入了硅谷實力派的行列。
[33]
ChatGPT更新
更新前、後(2張)
2023年11月,首屆OpenAI發佈會上發佈ChatGPT更新,首先,從發佈日開始ChatGPT將使用剛剛發佈的GPT-4 Trubo模型。另外,針對用户每次對話前都要選擇不同模式的困擾,GPT-4 Trubo也將迎來產品邏輯的更新,現在機器人能夠主動根據對話來適配對應的功能。
[58]
GPT-4 Turbo模型的進步主要體現在6個方面:
GPT-4 Turbo的進步主要體現在6個方面
[58]
1、AI能夠理解更長的上下文對話長度(context length)。標準版GPT-4模型最多支持8192個token,此前的升級將其提高至最多3.2萬個token。而GPT-4 Turbo支持最高12.8萬個token;新模型在處理長文本情境下的準確度也有所提高;2、給予開發者更多的控制權。新的模型允許開發者指示模型固定以特定形式返回有效JSON—JSON模式。同時開發者可以通過訪問seed參數和system_fingerprint響應字段,來實現“模型對每次請求都給出確定性的輸出”。3、GPT-4對於現實世界的知識截止於2021年9月,GPT-4 Trubo的知識則截止於2023年4月。4、多模態API。文生圖模型DALL·E 3、具有視覺輸入能力的GPT-4 Trubo,以及新的聲音合成模型(TTS)都在今日進入API。OpenAI也也發佈了新的語音識別模型Whisper V3,將在近期向開發者提供API。5、宣佈將向活躍開發者提供GPT-4微調的資格。對於開發細分行業的垂直AI應用而言,微調是必經的過程。對於這類開發者,OpenAI也推出了定製化模型項目,幫助一些組織訓練針對特定領域的定製化GPT-4模型。6、OpenAI將所有GPT-4用户的Token速率限制擴大了一倍,開發者可以申請進一步提高速率。在定價方面:
GPT-4 Turbo的價格要遠低於GPT-4
[58]
GPT-4 Turbo的價格要遠低於GPT-4。其中輸入Token的價格只有三分之一,而輸出Token的價格只有一半。也就是説,輸入1000個Token的定價為1美分,而輸出1000個Token的定價為3美分。與此同時,GPT-3 Turbo 16K模型的價格也有所下調。
[58]
OpenAIGPTs
產品定義:GPTs是OpenAI於2023年11月7日推出重要產品,用户將能通過自定義指令、拓展(模型)的知識邊界和下達行動命令,來構建自己的GPT,並能對外發布給全球更多的人使用。更重要的是,整個構建“自定義GPT”的過程也是通過自然語言對話形成的。模型能力薩姆·奧爾特曼在現場演示瞭如何通過聊天搭建一個GPT。他給GPT Builder的指令是“希望幫助創業者思考商業靈感並提供建議,然後‘拷問’他們為何公司發展得不夠快。”隨後ChatGPT迅速搭建了一個創業諮詢GPT,還順手生成了一個Logo。
現場演示瞭如何通過聊天搭建一個GPT(2張)
隨後奧爾特曼在屬性頁面中上傳了一份他自己關於創業公司的演講稿,向這個用例提供了額外的知識。至此,自定義用途的GPT初步搭建完成。用户可以保存這個用例只給自己使用,也能對外公開發布。OpenAI也順勢宣佈,將在本月晚些時候上線“GPT應用商店”。對於那些最熱門的GPT,公司還將分享一部分的營收,來推進GPT應用生態的進步。
[58]
OpenAIAssistants API
產品定義新品Assistants API(“助理API”)是2023年11月7日 OpenAI 首屆開發者大會上,OpenAI 推出的一種“專門構建的 AI 工具”,可利用“額外的知識”幫助開發者在自家應用程序中構建 AI 助手。
[125]
模型能力
“助理API”具有特定的指令,利用額外的知識,並能調用模型和工具來執行任務。新的助手API提供瞭如代碼解釋器、檢索以及函數調用等功能,以處理此前開發者必須自己完成的諸多繁重工作。用例範圍非常靈活,例如基於自然語言的數據分析應用、編程助手、AI度假規劃器、語音控制DJ、智能視覺畫布等等。
[58]
版本名稱發佈時間提供服務主要功能Assistants API2023年11月幫助開發者在自家應用程序中構建 AI 助手。提供三項功能:“代碼解釋器”可允許開發者在沙盒執行環境中編寫和運行 Python 代碼,生成圖形圖表,並處理具有不同數據和格式的文件,並允許 AI 助手迭代運行代碼來解決具有挑戰性的代碼和數學問題等。“檢索”可利用模型之外的知識來增強助手,例如專有領域數據、產品信息或用户提供的文檔。“函數調用”可令助手能夠調用開發者定義的函數,並將函數響應合併到其消息中。
[125]
OpenAISora
產品定義Sora,是OpenAI於當地時間2024年2月15日推出的一款新的人工智能文生視頻大模型,該模型可以根據文字説明創建現實和想象的場景。Sora作為一款通用的視覺數據模型,其卓越之處在於能夠生成跨越不同持續時間、縱橫比和分辨率的視頻和圖像,甚至包括生成長達一分鐘的高清視頻
[118]
。Sora從文本到視頻模式,旨在幫助人們解決需要現實世界互動的問題。
[115-116]
Sora訓練Sora的訓練依賴於大量帶有文本標題的視頻數據。OpenAI利用了DALL-E 3中的標題生成技術,為視頻生成高質量的文本標題,以此來提高文本和視頻數據之間的對齊度。同時,在大規模訓練過程中,Sora展示了一些“湧現的模擬能力”,如三維一致性、長距離連貫性、物體持久性以及與世界互動等。
[120]
模型能力文本到視頻生成能力。能夠根據用户提供的文本描述,生成長達60S的高保真視頻。複雜場景和角色生成能力。能夠生成包含多個角色、特定運動類型以及準確主題和背景細節的場景。能夠創造出生動的角色表情和複雜的運鏡,使得生成的視頻具有高度的逼真性和敍事效果。語言理解能力。擁有深入的語言理解能力,遵守用户的提示
[115]
,使得模型能夠更好地理解用户的文本指令,並在生成的視頻內容中忠實地反映這些指令。多鏡頭生成能力。具有在單個生成的視頻中創建多個鏡頭的能力,同時保持角色和視覺風格的一致性。從靜態圖像生成視頻能力。能夠從現有的靜態圖像開始,準確地動畫化圖像內容,或者擴展現有視頻,填補視頻中的缺失幀。
[118]
物理世界模擬能力。能深度模擬真實物理世界。標誌着人工智能在理解真實世界場景並與之互動的能力方面實現了重大飛躍。
[117]
Sora 製作的1分鐘視頻,效果接近實拍
技術特點Sora是一個擴散模型,能夠對一個看起來像靜態噪聲的視頻,通過多個步驟去除噪聲逐漸轉換。Sora通過一次為模型提供多幀的前瞻性,確保主體在暫時離開視野仍保持不變。Sora使用DALL.E3中的重新捕獲技術,生成的視頻結果能夠更忠實地遵循用户的文本指示。該模型還能夠獲取現有的靜態圖像並從中生成視頻,對圖像內容進行精確動畫處理,並關注小細節。該模型還可以獲取現有視頻並對其進行擴展或填充丟失的幀。
[115]
Sora的三維一致性仿真功能。Sora可以用動態攝像機運動生成視頻。隨着相機的移動和旋轉,人物和場景元素在三維空間中一致地移動。Sora通過在一幀的時間範圍內的空間網格中安排高斯噪聲補丁實現圖像生成功能。該模型可以生成各種尺寸的圖像高達2048x2048分辨率。
[119]
Sora可以生成各種尺寸的圖像高達2048x2048分辨率
侷限性作為一個模擬器,Sora表現出許多侷限性
[119]
。可能難以準確地模擬複雜場景的物理特性,不理解具體實例的因果關係,例如,一個人咬了一口餅乾,但餅乾可能沒有咬痕。還有可能混淆提示的空間細節,例如混淆左和右。難以精確描述隨時間發生的事件,例如跟隨特定的相機軌跡。
[115]
對行業影響OpenAI對Sora的定位頗具野心,號稱並不僅是“文生視頻”的工具,而是一個通用的“物理世界模擬器”,意在復現真實世界重力、摩擦力等物理現象。這樣的定位使得Sora未來有望成為跨越各行各業的“超級工具”,可被用於模擬天氣變化、自動駕駛、生物行為甚至軍事場景等等。
[126]
Sora並非是首個文本生成視頻的大模型。據不完全統計,截至2023年底,全球能實現文生視頻的大模型包括Runway、Pika、Stable Video Diffusion等超過20個產品。然而,Sora的誕生仍給業界帶來了不小的震撼。用户僅需輸入簡短一句話,Sora可生成一段60秒視頻,時長遠遠超過市面同類型級別的AI視頻生成時長(“明星模型”Runway和Pika等幾乎也僅有3~4秒);也已超過抖音等短視頻平台的平均視頻時長,Sora的誕生也為以後短視頻平台的內容生產提供了更大的可能性。中信建投、國泰君安、申萬宏源、招商證券等10家券商在研報中均表示,Sora 是人工智能發展進程中的“里程碑”,預示AGI(通用人工智能)將加速到來,眾多行業將迎顛覆式變革。
[120]
OpenAI產品管理
OpenAI發佈策略
OpenAI發佈產品的策略,避免採用“大爆炸、一氣呵成”的發佈模式。因為持續更新是OpenAI安全的基本原則戰略。人工智能安全是OpenAI內部的一個重要話題,也是工作的核心,公司採取了很多方法確保AI的安全性。例如:紅隊:一組被稱為“紅隊”的安全專家扮演攻擊者的角色,測試和評估安全措施的有效性;對齊:確保人工智能系統的行為方式與人類價值觀保持一致,並且不會無意中做出有害的行為;政策工作:與世界各地的政策制定者合作,制定具體規則加強人工智能技術和服務的安全性和可信度。產品在密切監控下逐步推出,產品發佈前,先經過選定客户的試用,然後再逐步推廣。當全世界都看到ChatGPT“突然”爆發時,實際上,在 OpenAI內部已經花了好幾年,在可控的環境中開發和調整ChatGPT。
[27]
OpenAI研發策略
AI的飛速發展,在給人類帶來生產力革命的同時,也帶來了前所未有的安全挑戰,包括:AI系統本身的穩定性和可靠性隱患,惡意使用AI技術,用户隱私侵犯,AI系統決策過程的公平、透明和可解釋性難以保障等。因此,OpenAI在創業過程中並行採取以安全為導向的研發策略,並積極參與到相關政策的討論和制定過程中,聚焦於推動行業正向發展、企業文化塑造以及鞏固行業領先優勢等3個維度,以確保AI發展能夠在保障安全的前提下更好地服務於人類社會。從技術上提出了兩個方向:一是可擴展的監督,嘗試使用人工智能系統來協助人類監督其他人工智能系統;二是解釋能力,嘗試更好地打開這些模型的內部黑箱,包括使用GPT-4來解釋GPT-2中的神經元,使用Model Internals來檢測一個模型何時在説謊等。一定程度上,OpenAI在AI安全方面的努力和貢獻,不僅有助於推動行業的健康發展,也能夠對內塑造企業文化和對外鞏固行業領先優勢,掌握了行業話語權,從而構建以OpenAI為主導的通用人工智能創新與發展生態。
[89]
OpenAI服務條款
OpenAI服務條款規定,API客户所輸出的模型不能被用於“開發任何與我們的產品和服務競爭的AI模型”。“所有API客户必須遵守我們的使用政策,以確保我們的技術被用於好的一面”微軟:“Azure OpenAI服務等微軟AI解決方案屬於有限訪問框架的一部分,這意味着所有客户都必須申請並獲得公司的批准才能訪問。同時,制定了標準並提供資源,幫助客户負責任地使用這些技術,並遵守公司的服務條款。公司還制定了發現濫用行為的流程,並在客户違反公司的行為準則時停止他們的訪問。”
[102]
OpenAI風險管理
OpenAI風險評估
對於開發中的前沿模型,OpenAI主要跟蹤4個類別的安全風險:網絡安全、CBRN(化學、生物、放射性、核威脅)、説服能力、模型自主性。評估期間將增加2倍的有效計算量把模型推向極限,並製作“記分卡”,分為“低、中、高、重大危險”四個等級。採取緩解措施後,四個方面得分取最高值作為一個模型的總評分。
OpenAI:安全
[106]
只有緩解後風險評分為“中”或更低時才能部署;只有緩解後風險評分為“高”或更低時才能進一步開發;對緩解前為“高”或“重大風險”的模型採取額外安全措施。
[105-106]
OpenAI:限制 、制約
[106]
OpenAI網絡安全風險
定義為利用模型破壞計算機系統的機密性、完整性、可用性。
[105]
網絡安全風險
[105]
OpenAICBRN風險
CBRN風險,專注於與模型輔助創建化學、生物、放射性和/或核威脅相關的風險。
[105]
CBRN風險
[105]
OpenAI説服能力風險
側重於與説服人們改變他們的信念或採取行動有關的風險。通常強大的説服力很少見,需要大量人力(例如一對一對話,或者精心製作的媒體內容);然而,模型可以在能力範圍內使所有內容幾乎零成本生成。
[105]
説服風險
[105]
OpenAI模型自主性風險
模型自主性風險就是比較科幻的那種,AI改進自己、阻止自己被關機、逃出實驗室了。
[105]
模型自主性風險
[105]
OpenAI企業事件
OpenAI涉投訴
2023年4月4日,加拿大隱私專員辦公室(OPC)宣佈開始調查ChatGPT背後的公司OpenAI,涉及“指控OpenAI未經同意收集、使用和披露個人信息”的投訴。
[8]
OpenAI涉訴訟
兩名作家發起版權集體訴訟2023年6月28日,第一起具有代表性的ChatGPT版權侵權之訴,終於出現在了公眾視野。兩名作家在美國加州北區法院,對Open AI公司發起了版權集體訴訟,指控後者未經授權利用自身享有版權的圖書訓練ChatGPT,謀取商業利益。
[16]
2023年7月,兩位美國作家對ChatGPT母公司OpenAI提起訴訟,聲稱OpenAI在沒有獲得版權授權的情況下,就利用他們的作品來訓練其人工智能。就在幾天之前,OpenAI在加利福尼亞州同樣被多方提起集體訴訟,起訴書稱OpenAI在未經允許的前提下,在互聯網上竊取和挪用了大量私人數據來訓練ChatGPT。
[13]
多名美國作家起訴OpenAI當地時間2023年12月20日,包括泰勒·布蘭奇和史戴西·希夫在內的11名美國作家在紐約曼哈頓聯邦法院起訴美國人工智能公司“開放人工智能研究中心”(OpenAI)和微軟。
[103]
。作家向法庭表示,OpenAI在未經許可的情況下,從互聯網上批量複製了他們的作品,並將這些作品納入ChatGPT的訓練數據裏,侵犯了他們的作品版權。
[104]
《紐約時報》起訴OpenAI2023年12月27日,《紐約時報》就侵犯版權起訴OpenAI。訴訟稱,《紐約時報》發表的數百萬篇文章被用於訓練自動聊天機器人,這些機器人現在作為可靠信息來源與該新聞媒體展開競爭。
[107]
2024年2月27日消息,美國開放人工智能研究中心(OpenAI)遭美國《紐約時報》起訴侵權的訴訟又有新進展:OpenAI已要求聯邦法官駁回部分原告訴求,稱原告媒體僱用電腦“黑客”操縱OpenAI的生成式人工智能聊天機器人ChatGPT等人工智能系統,進而生成“誤導性證據”。OpenAI向紐約曼哈頓南區聯邦法院提交文件説,《紐約時報》花錢僱用黑客操縱OpenAI產品,利用“公然違反OpenAI使用條款的欺騙性提示”,誘導ChatGPT生成照搬《紐約時報》版權作品的內容,留作侵權證據。
[121]
埃隆·馬斯克起訴OpenAI2024年3月1日,埃隆·馬斯克(Elon Musk)向法院起訴OpenAI及其首席執行官薩姆·奧爾特曼(Sam Altman),指控他們違反了OpenAI成立時簽訂的協議,即為了人類的利益而不是利潤開發技術。
[122]
3月5日OpenAI 回擊,指馬斯克試圖對其進行“絕對控制”。美國《紐約時報》稱,在一份公告中,該公司通過公佈一系列的郵件往來,披露他們與馬斯克之間的“恩怨”。OpenAI稱,當年,打造非營利人工智能公司的目標過於“燒錢”,包括馬斯克在內的一眾創始人均同意公司轉型。而也就是在這個時候,馬斯克提出要得到該公司的多數股權、董事會控制權以及CEO職務,甚至還提出將該公司與特斯拉兼併,遭到了其餘創始人的強烈反對。在他們看來,這樣的“絕對控制”有悖於公司成立的初衷。被拒之後,馬斯克於2018年撤資並離開了OpenAI的董事會。3月6日,馬斯克在社交平台上稱,如果OpenAI將公司名稱變更為“CloseAI”,他就放棄起訴。OpenAI的字面意思為“開放性人工智能”,而“CloseAI”含義剛好與之相反。據美國哥倫比亞廣播公司(CBS)稱,馬斯克顯然是在影射該公司從一家主張開源代碼的非營利公司轉變為一家被大型企業控制、一切向利潤看齊的“閉源”科技企業。CBS稱,馬斯克與OpenAI之間的恩怨情仇本身很俗套,“與資本主義制度一樣古老”,但是這場官司對人工智能行業的發展頗具借鑑意義。
[131]
OpenAI被調查
是否違反消費者保護法當地時間2023年7月13日,據美國CNN報道,美國聯邦貿易委員會正在調查OpenAI是否違反消費者保護法,並要求OpenAI提供有關其處理個人數據、向用户提供不準確信息的可能性以及“對消費者造成損害(包括聲譽損害)的風險”的大量記錄。
[14]
OpenAI提起訴訟
訴訟一家名稱侵犯了OpenAI商標2023年8月8日,據彭博消息,OpenAI Inc.對一家使用“開放人工智能”(Open Artificial Intelligence)名稱的公司提起訴訟,聲稱該名稱侵犯了OpenAI商標,並造成消費者混淆。
[17]
OpenAI迴應質疑
迴應對AI模型安全性質疑美國當地時間4月5日,ChatGPT研發公司OpenAI在其官方博客發佈文章《我們保障AI安全的方法》,迴應外界對其AI模型安全性的質疑。文章介紹了ChatGPT六個方面的安全部署,包括構建日益安全的AI系統、在實際使用中學習改進安全措施、保護兒童、尊重隱私、提高事實準確性,以及持續研究和參與。
[9]
2023年12月8日消息,當地時間週五,英國反壟斷監管機構表示,將審查微軟與OpenAI的合作是否導致了“獲取控制權”的情況,即一方對另一方具有重大影響力或控制權,如果存在可能導致阻礙行業競爭的問題,那麼該機構後續將採取更多針對性行動。迴應英國監管機構審查微軟與OpenAI合作關係當地時間2023年12月8日,英國競爭和市場管理局(CMA)表示,其正在收集來自利益相關者的信息,以確定微軟與OpenAI兩家公司的合作是否威脅到谷歌人工智能研究實驗室Deepmind總部所在地英國的市場競爭。隨後,微軟發言人在一份聲明中表示:“雖然我們協議的細節仍然保密,但必須指出的是,微軟並不擁有OpenAI任何股份,只是有資格分享利潤分配。”OpenAI發言人則表示,“微軟的無投票權董事會觀察員席位並未向他們提供管理職權或對OpenAI運營的控制權。”
[32]
OpenAI應用問題
美國東部時間2023年4月23日,根據中斷跟蹤網站Downdetector的數據,超千名用户報告OpenAI出現使用問題。
[11]
OpenAI重組風波
產生背景從2015年創建起,OpenAI內部就充滿了矛盾。該公司由特斯拉首席執行官埃隆·馬斯克(Elon Musk)、薩姆·奧爾特曼(Sam Altman)和其他九人共同創立,其目標是建立人工智能系統以造福全人類。與大多數科技初創企業不同,OpenAI是作為非營利機構成立的,董事會負責確保OpenAI履行這一使命。董事會里持有相互對立人工智能理念的人,一邊是擔心人工智能危險的人,比如埃隆·馬斯克,另一邊是奧爾特曼和那些更關注這項技術潛在好處的人。2018年埃隆·馬斯克離開OpenAI,2019年,奧爾特曼成為OpenAI的首席執行官,改變了OpenAI的發展方向,他創建了一家營利性子公司,並從微軟籌資10億美元。從而引發質疑,即這將如何與董事會的安全人工智能使命相吻合?董事會成員中的三名獨立董事都擔心人工智能會變得比人類更聰明。
[57]
解僱奧爾特曼2023年11月,據The Information,幾位知情人士透露,在OpenAI首席執行官薩姆·奧爾特曼被解僱、總裁Greg Brockman突然辭職之際,OpenAI的三名高級研究人員在當地時間17日辭職。請辭的三人分別是公司研究總監akub Pachocki、負責評估人工智能潛在風險的團隊負責人Aleksander Madry,以及在這家初創公司做了7年研究員的Szymon Sidor。
[22]
11月17日,OpenAI在官網發佈新聞稿稱,公司董事會宣佈,CEO薩姆·奧爾特曼將辭去CEO並離開公司,首席技術官米拉·穆拉蒂將擔任臨時首席執行官,立即生效。在奧爾特曼該推文後沒多久,格雷格·布羅克曼轉發也宣佈將離開公司。
[21]
解僱奧爾特曼的原因關於最初解僱奧爾特曼的原因存在不同的解釋。薩姆·奧爾特曼被趕下台的核心是創始人之間的舊式糾紛。據稱,OpenAI首席科學家兼聯合創始人伊爾亞·蘇茨克維(Ilya Sutskever)是此次罷免的幕後推手——基於對商業化與研究速度的擔憂,以及是否對安全性給予足夠重視。
[28]
據美國《華爾街日報》網站報道,11月17日,OpenAI董事會表示,解僱的理由是因為他沒有對公司董事會坦誠相待。與奧爾特曼關係密切的人士則表示,解僱更多與公司人工智能的安全性爭議以及與共同創始人和董事會成員伊利亞·蘇茨克韋爾之間的權力鬥爭有關。策劃復職反擊2023年11月19日,在被OpenAI解職兩天後,奧爾特曼又回到了公司辦公室,試圖談判迴歸事宜。他戴着訪客胸牌進入中心,並在X平台上發帖:“這是我第一次也是最後一次戴這個。”整個週末,投資者和許多員工都在試圖恢復奧爾特曼的職位。他一直在策劃一場反擊,試圖奪回這家硅谷最有價值和最知名的初創公司之一。奧爾特曼的陣營成功將解僱他的董事會帶回到談判桌旁,提名一連串備受關注的科技企業高管來領導一個更符合奧爾特曼商業願景的新董事會。微軟的高管也極力推動在新公司架構中加強監督,包括可能設立一個董事會觀察員席位,以便更深入瞭解公司的經營情況。2023年11月19日,OpenAI董事會成員伊利亞·蘇茨克韋爾在向員工發表的一份聲明中表示,儘管公司高管努力爭取奧爾特曼復職,結果還是事與願違。蘇茨克韋爾也宣佈,亞馬遜旗下流媒體平台“特威奇”(Twitch)前首席執行官埃米特·希爾,將成為OpenAI新的臨時首席執行官。希爾為Twitch聯合創始人,於今年早些時候辭職。奧爾特曼被解職後,OpenAI曾任命首席技術官米拉·穆拉蒂為臨時首席執行官。
[54]
11月20日,OPENAI臨時首席執行官米拉·穆拉蒂計劃重新聘請薩姆·奧爾特曼和格雷格·布羅克曼
[45]
;11月20日,據外媒,OpenAI董事會據稱將聘請埃米特·謝爾擔任CEO,取代創始人薩姆·奧爾特曼
[23]
。在談判失敗後,納德拉在X平台上寫道,奧爾特曼“將加入微軟,領導一個新的高級人工智能研究團隊”,與OpenAI的聯合創始人格雷格·布羅克曼以及其他同事一同工作。
[54]
員工簽署聯名信當地時間2023年11月20日,OpenAI公司超過700名員工簽署聯名信,要求該公司董事會辭職。信中指出,除非董事會辭職並恢復奧爾特曼和格雷格·布羅克曼的職位,不然他們將加入微軟的人工智能研究部門。
[25]
奧爾特曼重返CEO2023年11月22日,OpenAI宣佈,已經原則上達成協議,奧爾特曼重返公司擔任CEO,“並組建由董事會主席Bret Taylor、Larry Summers和Adam D'Angelo組成的新董事會。”
[46]
組建新初始董事會2023年11月30日,OpenAI宣佈,薩姆·奧爾特曼已經迴歸擔任首席執行官,OpenAI成立新董事會。
[47]
同日,OpenAI原董事會成員海倫·託納 (Helen Toner) 在社交平台X發文稱,她正式辭去了OpenAI董事會的職務。
[48]
重組風波影響創始人與董事會之間的決裂OpenAI突然進行重組是硅谷的老生常談:創始人與董事會之間的決裂。但在這個案例中,創始人(硅谷人工智能革命的代表)與董事會(其任務是將社會利益置於利潤之上)都非常特殊。這種決裂威脅着公司的未來以及投資者投入其中的數十億美元。受重組風波影響微軟股價下跌在所有投資者中,微軟可能是與OpenAI的未來最剪不斷理還亂的公司,而這家初創公司的亂局一直是微軟的負累。除了是OpenAI最大支持者外,微軟還圍繞這家初創公司的人工智能軟件重新調整了自己的業務。在奧爾特曼被解僱的消息傳出後,微軟的股價下跌。
[54]
OpenAI堅不可摧的光環被動搖了OpenAI堅不可摧的光環被動搖了。(斯坦福大學教授吳恩達(Andrew Ng)評,他曾幫助創建了谷歌和百度的人工智能實驗室)。OpenAI的混亂引發了人們對人工智能革命背後的人和公司的新質疑:作為世界上首屈一指的人工智能初創公司,如果它能如此輕易地因為背後誹謗他人的行為和不可靠的錯誤想法而陷入危機,那麼人們還能信任它來推進一項可能對數十億人產生不可估量影響的技術嗎。
[57]
AI倫理思考-商業化與安全審查OpenAI這場高層“內鬥”大戲,牽扯到商業利益和觀念博弈兩個方面的矛盾,後者體現為,“加速派”和“末日論派”在人類與AI的關係上的分歧。首席執行官奧爾特曼在加速部署OpenAI產品的商業化,擴大消費者市場。2022年11月,OpenAI發佈基於GPT-3的聊天機器人ChatGPT,開始較為明確地產品化。而2023年11月的開發日上OpenAI不僅在模型層上有所推進,還引入微調(fine-tuning)和檢索增強生成(RAG)等基礎設施層的工具,並推出了GPT應用商店和企業定製等生態層的探索,這些都在一年內發生。2023年7月,首席科學家伊爾亞·蘇茨克維(Ilya Sutskever)在OpenAI內部組建了一隻“超級對齊團隊”,以達到“讓模型在最糟糕的情況下也能遵循人類的意圖”等目的。2023年11月初,蘇茨克維在一個紀錄短片中稱:“我的感覺是,通用人類智能(AGI)的發展會出現雪崩。”這二人的觀念取向,折射出硅谷乃至全世界人工智能行業對安全與進步的分歧觀點,即“有效加速主義”和“末日論”。前者的擁躉希望通過最高效、最具影響力的技術進步與突破來加速社會、經濟或技術系統的變革過程,並把風險視為變革的催化劑。而後者則更加審慎,認為一旦風險不可控,人工智能帶來的巨大影響將毀滅人類社會。
[72]
OpenAI暫停賬户
暫停字節跳動賬户2023年12月16日,因字節跳動一直在秘密使用OpenAI的技術開發自家大語言模型而違反了OpenAI的服務條款,字節跳動的賬户已被OpenAI暫停。字節跳動通過微軟購買了OpenAI的訪問權限,但是微軟也制定了與OpenAI同樣的政策。OpenAI發言人尼克·菲利克斯(Niko Felix)發表聲明,確認字節跳動的賬户已被暫停。字節跳動發言人約迪·賽斯(Jodi Seth)對此迴應稱,GPT生成的數據在“種子計劃”的早期開發中用於註解模型,並且在2023年年中左右的時候已從字節跳動的訓練數據中刪除。“字節跳動獲得了微軟的許可能夠使用GPT API。我們使用GPT驅動非中國市場的產品和功能,但使用自主開發的模型驅動豆包。豆包只在中國提供
[102]
。字節跳動相關負責人迴應稱,正在與 OpenAI 聯繫溝通,以澄清外部報道可能引發的誤解。
[97]
OpenAI監管升級
監管定基調在美國國會沒有采取任何有意義的行動的情況下,歐盟的法律將為西方世界隨後的監管定下基調。當地時間2023年12月8日,歐盟政策制定者就《人工智能法案》達成協議。該法案是全球首次嘗試以全面的、基於倫理的方式監管這項快速發展的技術
[100]
。法案將AI系統的風險分為四類:不可接受風險、高風險、有限風險以及最低或無風險。
[101]
文件稱,被視為構成“系統性風險”的模型將受到額外規則的約束。歐盟將根據用於訓練模型的算力來確定其風險等級。新法案將影響OpenAI。最大的通用人工智能系統,包括為聊天機器人ChatGPT提供支持的GPT將面臨新的透明度要求。除因國家安全豁免外,警方和政府使用面部識別軟件將受到限制。違反規定的公司可能面臨高達全球銷售額7%的罰款,可達3500萬歐元(3770萬美元)。專家稱,目前唯一已達到構成“系統性風險”閾值的模型是OpenAI的GPT-4。歐盟執行機構可以根據數據集大小、是否在歐盟擁有至少10000名註冊商業用户或註冊最終用户數量以及其他指標來指定哪些模型構成“系統性風險”。
[100]
管理政策隨着通用型人工智能向用户端和行業加速滲透,相關隱私保護擔憂和安全監管等議題逐步升温。全球監管持續行動。由於ChatGPT本身在使用訓練數據的來源以及隱私泄露等問題一直備受爭議,不少大型企業都出台相關政策要求員工不要使用ChatGPT。2023年3月,意大利數據保護局宣佈禁止ChatGPT,加拿大已經調查OpenAI,稱該公司涉嫌“未經同意收集、使用和披露個人信息”。2023年5月22日消息,蘋果已經連續數月禁止員工使用ChatGPT和Copilot,此前亞馬遜、摩根大通等也限制員工使用ChatGPT,中國支付清算協會倡議支付行業人員謹慎使用ChatGPT等工具。2022年,中國國家互聯網信息辦公室等三部門發佈《互聯網信息服務深度合成管理規定》;2023年4月,國家互聯網信息辦公室起草了《生成式人工智能服務管理辦法(徵求意見稿)》,對人工智能生成內容、主體責任、訓練數據和數據處理等方面作出進一步規定,保障生成式人工智能技術的合規性和安全性。
OpenAI商標註冊
2024年2月,美國專利商標局拒絕OpenAI將GPT 一詞註冊為商標,他們認為GPT的意思是生成式預訓練轉換器 —— 一個過於籠統的術語,可能會阻止競爭對手將其產品描述為GPT。
[114]
OpenAI所獲榮譽
日期榮譽名稱企業估值排名2023年4月18日2023·胡潤全球獨角獸榜1380億(人民幣)第17名
[10]
2023年8月福布斯發佈2023雲計算100強榜單280億(美元)第1名
[55]
2023年11月24日首期《財富》全球人工智能創新者50強榜單-
[56]
2023年12月20日“漢語盤點2023”年度字詞——“ChatGPT”當選國際詞--
[98]
OpenAI競爭對手
OpenAI中國
百度百度:文心一言產品名稱模型定位模型能力發佈/更新時間文心一言(ERNIE Bot)ERNIE大語言模型百度在人工智能四層架構中,有全棧佈局。包括底層的芯片、深度學習框架、大模型以及最上層的搜索等應用。文心一言,位於模型層;百度在人工智能領域深耕十餘年,擁有產業級知識增強文心大模型ERNIE ,具備跨模態、跨語言的深度語義理解與生成能力
[83]
2023年2月7日3.5版在基礎模型升級、精調技術創新、知識點增強、邏輯推理增強、插件機制等方面創新突破
[84]
2023年5月4.0版知識增強大語言模型理解、生成、邏輯、記憶四大能力都有顯著提升。在萬卡算力上運行飛槳平台,通過集羣基礎設施和調度系統、飛槳框架的軟硬協同優化,支持了大模型的穩定高效訓練。建設了多維數據體系,形成了數據挖掘、分析、合成、標註、評估閉環,充分釋放數據價值,大幅提升模型效果。基於有監督精調、偏好學習、強化學習等技術進行多階段對齊,保證模型更好地與人類的判斷和選擇對齊。可再生訓練技術通過增量式的參數調優,有效節省了訓練資源和時間,加快了模型迭代速度。此外,4.0在輸入和輸出階段都進行知識點增強。
[84]
2023年10月16日
OpenAI其他國家
GoogleGoogle產品名稱定位主要功能模型名稱發佈/更新時間BardBard是建立在一個大型語言模型基礎上的人工智能聊天機器人將結合全世界的力量、智慧以及創造力,利用來自網絡的信息提供新鮮、高質量的迴應。
[73-74]
LaMDA對話應用語言模型當地時間2023年2月6日發佈可支持包括中文在內的40多種語言,圖像分析功能,可以提取相關信息或為圖片取標題。
[75]
當地時間2023年7月13日更新Gemini人工智能模型“雙子座"谷歌迄今為止功能最強大、最通用的大模型。它能夠處理視頻、音頻和文本等不同形式的信息,相較於此前的版本,Gemini可以進行更復雜的推理,並實現更細緻的信息理解。
[95]
“雙子座”是谷歌迄今最靈活的模型,能夠在從數據中心到移動設備等不同平台上運行。“雙子座”將推出Ultra、Pro和Nano三個版本。其中Ultra版本功能最強大,適用於複雜任務;Pro版本可擴展多種任務;Nano版本為高效設備端模型。
[96]
-當地時間2023年12月6日發佈Stability AIStability AI產品名稱版本定位主要功能模型/參數發佈/更新時間Stable Diffusion XL 1.0版本人工智能AI 工具與前代產品(Stable Diffusion XL 0.9 版本)相比,生成的圖片色彩“更鮮豔”、內容“更準確”,對比度、陰影和光照效果也更出眾;1.0 版是可定製的,用户就可以使用該 AI 工具完成複雜的設計;1.0版包含 35 億個參數,可以在“幾秒鐘內”生成多種長寬比的完整圖像;在文本生成方面,能在圖片中生成各種形式的文本,免去用户後期調整字體的麻煩。
[76]
SDXL 模型/35 億個2023年7月發佈Anthropic人工智能初創公司Anthropic產品名稱版本定位主要功能發佈/更新時間Claude-大語言模型聊天機器人聊天機器人Claude被不少人認為媲美ChatGPT;
[81]
美國軟件服務公司Notion、社交問答網站Quora和搜索引擎DuckDuckGo已將Claude集成到其產品內。2023年3月15日發佈
[78]
版本2編碼、數學和推理方面的性能都有所提高。升級之後,Claude 2的處理能力已經提升到了100K個Token,這意味着它可以處理數百頁的技術文檔,甚至是整本書。此外,面向更廣泛的用户羣體免費開放,並支持中文使用。
[79]
2023年7月更新版本2.1可以為專業用户一次性消化多達20萬個token,相當於500多頁的材料,且出現“幻覺”或謊言的頻率將是以前的一半,20萬個token相當於Claude此前處理能力的兩倍,且大幅高出GPT-4企業版3.2萬個token的上限。
[80]
2023年11月22日更新Character.AICharacter.AI產品名稱定位主要功能發佈/更新時間聊天機器人允許人們與名人或動漫角色的虛擬版本進行聊天,同時可以創建自己的聊天機器人和人工智能助手。Data from Similarweb顯示,Character.AI的聊天機器人(具有不同角色和語氣可供選擇),吸引了18至24歲用户。與Open AI的ChatGPT和谷歌的Bard等其他聊天機器人相比,該公司通過此人口羣體幫助自己在個人AI伴侶領域樹立更加有趣的形象。
[81]
-
參考資料
1.
OpenAI宣稱將製造“通用”機器人
.網易科技[引用日期2016-06-21]
2.
量子計算專家、ACM計算獎得主加盟OpenAI
.澎湃新聞.2022-06-21[引用日期2022-06-21]
3.
OpenAI 推出 ChatGPT Plus 訂閲服務,每月 20 美元
.IT之家.2023-02-02[引用日期2023-02-02]
4.
Newsroom
.OpenAI.2020-01-05[引用日期2023-02-05]
5.
內幕曝光:ChatGPT火熱度驚呆OpenAI,CEO擔心過度炒作
.澎湃新聞.2023-02-04[引用日期2023-02-05]
6.
ChatGPT爆火!幕後天才推手8歲學會編程,20歲從斯坦福輟學|人工智能
.新浪網[引用日期2023-02-10]
7.
OpenAI 買下極品域名 AI.com,鏈接跳轉到 ChatGPT
.iT之家.2023-02-17[引用日期2023-02-17]
8.
加拿大就數據安全問題開始調查OpenAI公司
.界面新聞.2023-04-05[引用日期2023-04-05]
9.
OpenAI迴應安全性質疑,公佈保障AI模型安全六大方法
.界面新聞.2023-04-06[引用日期2023-04-06]
10.
胡潤百富 - 榜單
.胡潤百富[引用日期2023-04-18]
11.
數千名用户報告OpenAI出現使用問題|界面新聞 · 快訊
.界面新聞[引用日期2023-04-24]
12.
OpenAI推出手機版本ChatGPT APP 後續將提供安卓版
.金融界.2023-05-19[引用日期2023-05-19]
13.
兩位作家起訴OpenAI稱ChatGPT侵犯版權
.36氪[引用日期2023-07-06]
14.
美監管機構首次出手!OpenAI遭FTC正式調查:生成虛假信息帶來危害
.澎湃.2023-07-14
15.
OpenAI正式上線安卓版ChatGPT
.界面新聞[引用日期2023-07-26]
16.
ChatGPT版權第一案:OpenAI面臨六項指控,因輸出圖書摘要被“抓包”
.騰訊科技.2023-08-06[引用日期2023-08-06]
17.
OpenAI起訴“open.ai ”域名所有者商標侵權
.財經.2023-08-08
18.
OpenAI宣佈推出企業版ChatGPT
.界面新聞.2023-08-29[引用日期2023-08-29]
19.
OpenAI首屆開發者大會最新爆料:全新UI可定製GPT,xAI大模型大範圍可用
.鳳凰網[引用日期2023-11-05]
20.
人工智能語言模型 在智商測試中勝過人類
.百家號-中國網科技[引用日期2023-11-07]
21.
OpenAI突發大地震:ChatGPT 之父遭董事會罷免,董事長也不幹了
.澎湃新聞[引用日期2023-11-18]
22.
OpenAI離職風波加劇,三名高級研究人員辭職
.金融界.2023-11-18[引用日期2023-11-18]
23.
OpenAI董事會據稱將聘請Emmett Shear擔任CEO,取代創始人Sam Altman
.百家號.2023-11-20
24.
不顧投資者呼聲 OpenAI董事會聘請Twitch前高管Shear擔任CEO
.金融界[引用日期2023-11-20]
25.
OpenAI超700名員工要求董事會辭職 不然就去微軟
.國際在線.2023-11-21
26.
最強聊天機器人ChatGPT面世,AI又來搶飯碗了?
.每日經濟新聞[引用日期2023-12-08]
27.
和OpenAI學管理:2023年最強的王炸產品是怎樣煉成的?
.華爾街見聞[引用日期2023-12-08]
28.
有效利他主義與現實:OpenAI革命性的治理模式已死?
.澎湃新聞[引用日期2023-12-08]
29.
有效利他主義!OpenAI、FTX和馬斯克背後強大的“硅谷新思想”
.華爾街見聞[引用日期2023-12-08]
30.
OpenAI新董事會成員名單公佈
.DoNews[引用日期2023-12-08]
31.
OpenAI “內訌”,4人核心團隊決裂!前董事長髮文披露細節:首席科學家“趕走了”我和阿爾特曼!
.每日經濟新聞[引用日期2023-12-08]
32.
英國監管機構審查微軟與OpenAI合作關係,雙方公司迴應
.界面新聞[引用日期2023-12-09]
33.
內幕曝光:ChatGPT火熱度驚呆OpenAI,CEO擔心過度炒作
.澎湃新聞[引用日期2023-12-09]
34.
OpenAI的“六顆寶石”:大模型時代如何創新
.經濟觀察報[引用日期2023-12-09]
35.
全球競相發展AI技術|科技創新世界潮
.科技日報.2023-03-25[引用日期2023-03-25]
36.
ChatGPT 官方 App 現已在歐洲、韓國、新西蘭等地區上線
.百家號.2023-05-25
37.
ChatGPT推出自定義指令功能
.第一財經[引用日期2023-07-21]
38.
OpenAI宣佈ChatGPT安卓APP下週發佈
.界面新聞 · 快訊[引用日期2023-07-22]
39.
大模型晚報|OpenAI宣佈ChatGPT安卓APP本週發佈
.品玩[引用日期2023-07-24]
40.
OpenAI宣佈將GPT-4引入內容審核系統,減少人工參與|界面新聞 · 快訊
.界面新聞[引用日期2023-08-16]
41.
OpenAI宣佈收購人工智能設計公司Global Illumination,為其首次公開收購
.界面新聞.2023-08-17[引用日期2023-08-17]
42.
OpenAI宣佈將在愛爾蘭都柏林開設辦事處
.財經.2023-09-14
43.
微軟宣佈DALL-E 3模型面向所有Bing Chat用户開放
.界面新聞.2023-10-04[引用日期2023-10-04]
44.
OpenAI推出自定義版本ChatGPT,即將上線GPT商店
.界面新聞.2023-11-07[引用日期2023-11-07]
45.
OPENAI臨時首席執行官MURATI計劃重新聘請Sam Altman和Brockman
.網易.2023-11-20
46.
OpenAI:奧特曼將重返公司擔任CEO,組建新董事會
.澎湃.2023-11-22
47.
奧特曼正式迴歸OpenAI
.界面新聞.2023-11-30
48.
海倫·託納辭去OpenAI董事會職務
.財經.2023-11-30
49.
英國反壟斷機構再出手!這次瞄準了微軟與OpenAI的合作
.財聯社[引用日期2023-12-09]
50.
最強聊天機器人ChatGPT面世,AI又來搶飯碗了?
.每日經濟新聞[引用日期2023-12-09]
51.
OpenAI首屆開發者大會最新爆料:全新UI可定製GPT,xAI大模型大範圍可用
.鳳凰網-IT之家[引用日期2023-12-09]
52.
譯名趣談|奧爾特曼不是“奧特曼”
.參考消息[引用日期2023-12-09]
53.
OpenAI:薩姆·奧爾特曼將回歸擔任首席執行官
.四川觀察[引用日期2023-12-09]
54.
薩姆·奧爾特曼的戲劇性週末
.參考消息[引用日期2023-12-09]
55.
2023雲計算100強榜單!
.世界智能大會[引用日期2023-12-10]
56.
《財富》全球人工智能創新者50強
.財富[引用日期2023-12-10]
57.
OpenAI新內幕:奧特曼被指愛權力勝過金錢,解僱之初承諾支持臨時CEO
.騰訊- 騰訊科技[引用日期2023-12-10]
58.
五分鐘速覽OpenAI發佈會:GPT應用商店、GPT-4 Turbo登場
.科創板日報[引用日期2023-12-10]
59.
OpenAI扣響移動端“發令槍” 行業應用加速落地
.東方財富網[引用日期2023-12-10]
60.
OpenAI大招三連,繼續“蘋果”化
.虎嗅[引用日期2023-12-10]
61.
特斯拉(Tesla)CEO伊隆
.新浪網[引用日期2023-12-10]
62.
美媒:嘲諷被裁殘疾員工後,推特CEO馬斯克發推道歉
.環球網[引用日期2023-12-10]
63.
馬斯克創建Neuralink公司 要把人腦與大腦相連
.鳳凰科技[引用日期2023-12-10]
64.
“宮鬥混亂”不影響產品發佈:OpenAI宣佈ChatGPT Voice功能向所有用户開放
.金融界[引用日期2023-12-11]
65.
OpenAI
.OpenAI.2023-12-11[引用日期2023-12-11]
66.
關於
.OpenAI.2023-12-11[引用日期2023-12-11]
67.
今日火線執掌OpenAI,她是誰?
.騰訊- 財富中文網[引用日期2023-12-11]
68.
OpenAI官宣:奧特曼正式迴歸,公司成立一個新的董事會
.界面新聞 · 快訊[引用日期2023-12-11]
69.
OpenAI新CEO:35歲,Model X鐵娘子
.36氪[引用日期2023-12-11]
70.
《麻省理工科技評論》獨家起底OpenAI:背離馬斯克創立初衷,理想主義被盈利壓力碾碎
.DeepTech深科技[引用日期2023-12-11]
71.
Introducing ChatGPT
.OpenAi官網[引用日期2023-12-11]
72.
深度|OpenAI大戲暫落幕,或許更應該思考這個問題
.證券時報[引用日期2023-12-12]
73.
科技巨頭“卷”起來了?谷歌將推聊天機器人競品,蘋果將舉行與AI有關的峯會
.紅星新聞[引用日期2023-12-13]
74.
Google Unveils Bard, Its ChatGPT Rival for AI-Powered Conversation
.cnet[引用日期2023-12-13]
75.
谷歌聊天機器人Bard重大升級:支持中文,識圖功能上線
.The Paper[引用日期2023-12-13]
76.
“文生圖”行業一哥:Stability AI 宣佈推出首個正式版 Stable Diffusion XL 1.0
.IT之家[引用日期2023-12-13]
77.
CHATGPT在線使用
.CHATGPT中文網[引用日期2023-12-13]
78.
全球競相發展AI技術|科技創新世界潮
.中國科技網[引用日期2023-12-13]
79.
Claude 發佈大版本更新,支持中文使用
.硅星人[引用日期2023-12-13]
80.
T早報|OpenAI競對發佈新版聊天機器人;馬雲成立新公司“馬家廚房”;TCL終止顯示驅動芯片開發
.財新網[引用日期2023-12-13]
81.
Google洽談投資獨角獸Character.AI
.新浪財經.2023-12-13
82.
OpenAI宣佈重新開放ChatGPT Plus訂閲
.界面新聞.2023-12-14
83.
官宣:文心一言
.百度[引用日期2023-12-14]
84.
百度CTO王海峯:文心大模型4.0首發,文心一言用户規模已達4500萬
.百度[引用日期2023-12-14]
85.
OpenAI 與出版巨頭施普林格達成史無前例的協議,為 ChatGPT 提供新聞數據
.IT之家[引用日期2023-12-14]
86.
OpenAI 宣佈重新開放 ChatGPT Plus 訂閲,已找到更多 GPU
.IT之家.2023-12-14
87.
OpenAI 宣佈與微軟成立 1 億美元的人工智能創業基金
.財經頭條[引用日期2023-12-14]
88.
OpenAI財務之謎:非營利部分2022年收入為4.4萬美元
.獨立商業視角 新鋭教育觀察[引用日期2023-12-15]
89.
OpenAI的“六顆寶石”:大模型時代如何創新
.經濟觀察報[引用日期2023-12-17]
90.
ChatGPT之父舌戰國會山!OpenAI欲與政府聯手,權力通天
.新智元[引用日期2023-12-17]
91.
GPT-4發佈,已在微軟新必應上運行
.界面新聞 · 快訊[引用日期2023-12-17]
92.
OpenAI宣佈將GPT-4引入內容審核系統,減少人工參與
.界面新聞 · 快訊[引用日期2023-12-17]
93.
人工智能語言模型 在智商測試中勝過人類
.中國網科技[引用日期2023-12-17]
94.
透過 ChatGPT 的進化足跡,OpenAI 傳達了哪些信號?
.IT之家[引用日期2023-12-17]
95.
ChatGPT3.5問世一週年,生成式AI熱潮劍指何方:多模態、生態融合……
.每日經濟新聞[引用日期2023-12-17]
96.
谷歌公司發佈人工智能模型“雙子座”
.新華網[引用日期2023-12-17]
97.
字節跳動公佈OpenAI服務被禁澄清:未來幾天將再次全面排查,確保遵守條款
.騰訊新聞.2023-12-17[引用日期2023-12-18]
98.
“漢語盤點2023”年度字詞揭曉:“振”“高質量發展”當選年度國內字詞
.央視新聞客户端.2023-12-20
99.
美媒:OpenAI發佈新安全指南 賦予董事會否決權
.中新網[引用日期2023-12-21]
100.
談到咖啡機都壞了!歐盟艱難談判達成《人工智能法案》,如何監管?
.澎湃新聞[引用日期2023-12-21]
101.
#歐盟人工智能法案或於2025年正式生效#
.央視網科技[引用日期2023-12-21]
102.
字節跳動被曝秘密使用OpenAI技術、賬户被暫停,三方迴應
.金融界[引用日期2023-12-21]
103.
多名美國作家起訴人工智能公司OpenAI
.新京報.2023-12-22[引用日期2023-12-22]
104.
多名美國作家起訴人工智能公司OpenAI|
.界面新聞 · 快訊[引用日期2023-12-22]
105.
OpenAI:如GPT-5太危險,董事會有權阻止奧特曼發佈
.The Paper[引用日期2023-12-22]
106.
Preparedness Framework (Beta)(見首頁和21頁)
.openai[引用日期2023-12-22]
107.
《紐約時報》就侵犯版權起訴OpenAI和微軟
.界面新聞 .2023-12-27
108.
OpenAI推出GPT商店
.界面新聞.2024-01-11
109.
GPT Store正式上線:超300萬個應用可玩
.虎嗅網[引用日期2024-01-11]
110.
OpenAI新年頭號重磅!GPT Store上線,企業客户新品也來了
.每日經濟新聞[引用日期2024-01-11]
111.
OpenAI研究員Andrej Karpathy離職
.界面新聞 · 快訊[引用日期2024-02-15]
112.
OpenAI推出AI系統將文本轉換為逼真的視頻
.財聯社.2024-02-16[引用日期2024-02-16]
113.
OpenAI深夜發佈首個文生視頻模型Sora,現實將被徹底顛覆
.界面新聞[引用日期2024-02-16]
114.
美國專利局拒絕OpenAI將GPT註冊商標
.金融界.2024-02-17[引用日期2024-02-17]
115.
Sora
.openai官網[引用日期2024-02-17]
116.
Video generation models as world simulators
.openai官網[引用日期2024-02-17]
117.
OpenAI 王炸:新 Sora 模型一句話生成 1 分鐘視頻,效果接近實拍
.IT之家[引用日期2024-02-17]
118.
OpenAI王炸模型刷屏!馬斯克稱人類應認賭服輸,它有何厲害之處
.騰訊新聞[引用日期2024-02-17]
119.
Video generation models as world simulators
.openai官網[引用日期2024-02-17]
120.
Sora爆火96小時,國內大模型火速上線,誰能打贏“翻身仗”?
.上觀[引用日期2024-02-20]
121.
OpenAI稱《紐約時報》僱“黑客”生成ChatGPT侵權證據
.央視新聞客户端[引用日期2024-02-28]
122.
馬斯克起訴OpenAI及奧特曼:違背技術造福人類的初衷,要求GPT開源
.騰訊網.2024-03-01[引用日期2024-03-01]
123.
Research
.OpenAI官網[引用日期2024-03-07]
124.
消息稱新加坡主權財富基金淡馬錫有意投資 OpenAI
.IT之家[引用日期2024-03-07]
125.
OpenAI 推出Assistants API,可一鍵為自家應用定製AI助手
.it之家[引用日期2024-03-07]
126.
Sora問世,人人都能成為內容創作者的時代即將到來了嗎?
.新華報業網[引用日期2024-03-07]
127.
大模型OpenAI領跑 中國企業加速追趕
.貝果財經[引用日期2024-03-07]
128.
年化收入將達50億美元!OpenAI估值千億美元
.數據猿DataYuan[引用日期2024-03-07]
129.
或達800億美元!新模型Sora爆火,OpenAI估值不到10個月增加近兩倍
.央視財經[引用日期2024-03-07]
130.
700餘名OpenAI員工:董事會集體辭職並讓阿爾特曼重掌公司,否則加入微軟
.觀察者網[引用日期2024-03-07]
131.
OpenAI公佈電郵反擊馬斯克
.百家號.2024-03-08
展開全部
收起
圖集
OpenAI的概述圖(1張)
詞條統計
瀏覽次數:次
編輯次數:143次歷史版本
最近更新:
lq_cbhb22
(2024-03-08)
1
公司發展
1.1
早期發展
1.2
轉型期
1.3
發展期
1.4
財務狀況
2
價值理念
2.1
哲學思想
2.2
核心目的
2.3
公司使命
2.4
企業文化
3
公司治理
3.1
融資結構
3.2
管理架構
3.3
人員架構
4
對外合作
4.1
與微軟合作
4.2
市場迴應
4.3
與施普林格
4.4
與淡馬錫
4.5
與政府合作
5
團隊管理
5.1
管理模式
5.2
合作模式
5.3
研究團隊
5.4
應用團隊
5.5
招聘策略
5.6
工作方法
6
主要產品
6.1
ChatGPT
6.2
GPTs
6.3
Assistants API
6.4
Sora
7
產品管理
7.1
發佈策略
7.2
研發策略
7.3
服務條款
8
風險管理
8.1
風險評估
8.2
網絡安全風險
8.3
CBRN風險
8.4
説服能力風險
8.5
模型自主性風險
9
企業事件
9.1
涉投訴
9.2
涉訴訟
9.3
被調查
9.4
提起訴訟
9.5
迴應質疑
9.6
應用問題
9.7
重組風波
9.8
暫停賬户
9.9
監管升級
9.10
商標註冊
10
所獲榮譽
11
競爭對手
11.1
中國
11.2
其他國家
百科協議 隱私協議 意見反饋
Beta
進入詞條
清除歷史記錄關閉
反饋
登錄
About
About
CloseSearch Submit Skip to main contentSite NavigationResearchOverviewIndexGPT-4DALL·E 3SoraAPIOverviewPricingDocsChatGPTOverviewTeamEnterprisePricingTry ChatGPTSafetyCompanyAboutBlogCareersResidencyCharterSecurityCustomer storiesSearch Navigation quick links Log inTry ChatGPTMenu Mobile Navigation CloseSite NavigationResearchOverviewIndexGPT-4DALL·E 3SoraAPIOverviewPricingDocsChatGPTOverviewTeamEnterprisePricingTry ChatGPTSafetyCompanyAboutBlogCareersResidencyCharterSecurityCustomer stories Quick Links Log inTry ChatGPTSearch Submit AboutOpenAI is an AI research and deployment company. Our mission is to ensure that artificial general intelligence benefits all of humanity.Our vision for the future of AGIOur mission is to ensure that artificial general intelligence—AI systems that are generally smarter than humans—benefits all of humanity.null linksRead our plan for AGIRead our CharterWe are building safe and beneficial AGI, but will also consider our mission fulfilled if our work aids others to achieve this outcome.Our workResearchWe research generative models and how to align them with human values.Learn about our researchForecasting potential misuses of language models for disinformation campaigns and how to reduce riskJan 11, 2023January 11, 2023Point-E: A system for generating 3D point clouds from complex promptsDec 16, 2022December 16, 2022Introducing WhisperSep 21, 2022September 21, 2022DALL·E 2 pre-training mitigationsJun 28, 2022June 28, 2022ProductsOur API platform offers our latest models and guides for safety best practices.Explore our productsNew and improved embedding modelDec 15, 2022December 15, 2022Introducing ChatGPTNov 30, 2022November 30, 2022DALL·E now available without waitlistSep 28, 2022September 28, 2022New and improved content moderation toolingAug 10, 2022August 10, 2022Careers at OpenAIDeveloping safe and beneficial AI requires people from a wide range of disciplines and backgrounds.View careersOur structureWe are governed by a nonprofit and our unique capped-profit model drives our commitment to safety. This means that as AI becomes more powerful, we can redistribute profits from our work to maximize the social and economic benefits of AI technology.null linksRead about OpenAI LPRead about our structureResearchOverviewIndexGPT-4DALL·E 3SoraAPIOverviewPricingDocsChatGPTOverviewTeamEnterprisePricingTry ChatGPTCompanyAboutBlogCareersCharterSecurityCustomer storiesSafetyOpenAI © 2015 – 2024Terms & policiesPrivacy policyBrand guidelinesSocialTwitterYouTubeGitHubSoundCloudLinkedInBack to top
一文读懂 OpenAI - 知乎
一文读懂 OpenAI - 知乎首发于AI 系列切换模式写文章登录/注册一文读懂 OpenAIlencx{折腾 ⇌ 迷茫 ⇌ 思考]ing,在路上...关注公众号 “浮之静”,发送 "chat",进 ChatGPT 技术交流群OpenAI 是什么来自 WikiOpenAI 是一家美国人工智能(AI)研究实验室,由非营利性 OpenAI Incorporated(OpenAI Inc.)及其营利性子公司 OpenAI Limited Partnership(OpenAI LP)组成。OpenAI 进行 AI 研究的目的是促进和开发友好的 AI。OpenAI 系统运行在世界上第五强大的超级计算机上。该组织于 2015 年由 Sam Altman、Reid Hoffman 在旧金山成立,杰西卡·利文斯顿(Jessica Livingston)、埃隆·马斯克(Elon Musk)、伊利亚·萨茨克维尔(Ilya Sutskever)、彼得·泰尔(Peter Thiel)等人共同认捐了 10 亿美元。马斯克于 2018 年辞去董事会职务,但仍是捐助者。微软在 2019 年向 OpenAI LP 提供了 10 亿美元的投资,并于 2023 年 1 月向其提供了第二笔多年期投资,据报道为 100 亿美元。OpenAI 发展历程2015.12 - Sam Altman、Greg Brockman、Reid Hoffman、Jessica Livingston、Peter Thiel、Elon Musk、Amazon Web Services (AWS)、Infosys 和 YC Research 宣布成立 OpenAI,并承诺向该合资企业投资超过 10 亿美元. 该组织表示,将通过向公众开放其专利和研究,与其他机构和研究人员“自由合作”。2016.04 - OpenAI 发布了强化学习研究平台 “OpenAI Gym” 的公测版。2016.12 - OpenAI 发布了 “Universe”,这是一个软件平台,用于测量和训练 AI 在全球范围内提供的游戏、网站和其他应用程序的通用智能。2018 - 由于特斯拉为自动驾驶汽车开发 AI,马斯克辞去了董事会席位,理由是与他担任特斯拉首席执行官的角色“未来可能存在利益冲突” ,但他仍然是捐赠者。2019 - OpenAI 从非营利性转变为“封顶”的营利性,利润封顶为任何投资的 100 倍(OpenAI shifts from nonprofit to ‘capped-profit’ to attract capital)。上限利润模式允许 OpenAI LP 合法地吸引风险基金的投资,此外,还可以授予员工公司的股份。2020 - OpenAI 发布了 GPT-3,这是一种在大型互联网数据集上训练的语言模型。GPT-3 旨在自然语言回答问题,但它也可以在语言之间进行翻译并连贯地生成即兴文本。它还宣布了一个关联的 API,简称为 “API”,将构成其第一个商业产品的核心。2021 - OpenAI 推出了 DALL-E,这是一种深度学习模型,可以从自然语言描述中生成数字图像。2022.12 - OpenAI 在推出基于 GPT-3.5 的新型 AI 聊天机器人 ChatGPT 免费预览版后受到了媒体的广泛报道。据 OpenAI 称,预览版在前五天内收到了超过一百万的注册。在发布仅两个月后就拥有 1 亿用户(成为史上用户增长最快的应用)。2023.01 - OpenAI 正在就融资进行谈判,这将使公司估值达到 290 亿美元,是公司 2021 年市值的两倍。2023.01.23,微软宣布对 OpenAI 的一项新的多年期、数十亿美元的投资计划(据报道为 100 亿美元)。该投资被认为是微软将 OpenAI 的 ChatGPT 集成到 Bing 搜索引擎中的一部分。在 ChatGPT 推出后, Google 宣布了类似的 AI 应用程序(Bard),担心 ChatGPT 会威胁到 Google 作为信息首选来源的地位。2023.02.07 - 微软宣布正在将基于与 ChatGPT 相同基础的 AI 技术构建到 Microsoft Bing、Edge、Microsoft 365 等产品中。2023.02.15 - 域名 AI.com 重定向到 ChatGPT 网站,据说域名在 2021.09 被 1100 万美元收购(AI.com Now Forwarding to ChatGPT Website)。2023.02.28 - 微软宣布对 Windows 11 进行重大更新,其中包含一系列利用 AI 的功能并改善人们在 PC 上完成工作的方式的功能。Bing 团队很高兴地与大家分享到:作为此次更新的一部分,我们将 New Bing 直接引入 Windows 任务栏,解锁更多与 PC 交互的方式,包括搜索、答案、聊天和创作(Introducing the new Bing in Windows 11)。名词解释API2020.06,OpenAI 宣布了一个多功能 API,据称“用于访问 OpenAI 开发的新 AI 模型”,让开发人员调用它来执行“任何英语 AI 任务”。GPT参数数量:1.2 亿,训练数据:BookCorpus 是一个包含 7000 本未出版书籍的语料库,总大小为 4.5 GB。这些书籍涵盖了各种不同的文学流派和主题。基于转换器的生成式预训练模型(英语:Generative pre-trained transformers, 简称:GPT)是一种延伸自转换器架构(Transformer)的自然语言生成模型。它可以进行微调以完成各种自然语言处理任务,例如文本生成、代码生成、视频生成、文本问答、图像生成、论文写作、影视创作、科学实验设计等。基于大量语料数据上训练,以生成类似于人类自然语言的文本。其名称中的“预训练”指的是在大型文本语料库上进行的初始训练过程,其中模型学习预测文章中下一个单词,这为模型在具有限量的任务特定数据的下游任务中表现良好提供了坚实的基础。关于 GPT 的原始论文(Improving Language Understanding by Generative Pre-Training)由 Alec Radford 及其同事撰写,并于 2018.06.11 以预印本形式发表在 OpenAI 的网站上。它展示了语言的生成模型如何能够通过对具有长段连续文本的多样化语料库进行预训练来获取世界知识并处理远程依赖关系。GPT-2参数数量:15 亿,训练数据 WebText:一个包含八百万个文档的语料库,总大小为 40 GB。这些文本是从 Reddit 上投票最高的 4,500 万个网页中收集的,包括各种主题和来源,例如新闻、论坛、博客、维基百科和社交媒体等。生成式预训练变换模型 2(英语:Generative Pre-trained Transformer 2,简称:GPT-2)是 OpenAI 于 2019.02 创建的开源人工智能。GPT-2 能够翻译文本、回答问题、总结段落,并生成文本输出。虽然其输出内容有时与人类相似,但在生成长段落时输出内容可能会变得重复或无意义。GPT-2 是一个通用学习器,没有经过专门训练来执行任何特定的任务,并且是作为 OpenAI 2018 GPT 模型的“直接扩展”而创建的,其参数数量和训练数据集的大小均增加了十倍。一些专家对 GPT-2 构成重大威胁表示怀疑。艾伦人工智能研究所(Allen Institute for Artificial Intelligence)用一种检测“假新闻”的工具回应了 GPT-2(Could ‘fake text’ be the next global political threat?)。其他研究人员,如杰里米霍华德,警告说“用听起来合理、上下文适当的散文完全填满推特、电子邮件和网络的技术,这将淹没所有其他言论并且无法过滤”。2019.11,OpenAI 发布了完整版的 GPT-2 语言模型。GPT-3参数数量:1750 亿,训练数据:一个总大小为 570 GB 的大规模文本语料库,其中包含约四千亿个标记。这些数据主要来自于CommonCrawl、WebText、英文维基百科和两个书籍语料 Books1 和 Books2。生成型预训练变换模型 3 (英语:Generative Pre-trained Transformer 3,简称:GPT-3)是一个自回归语言模型,目的是为了使用深度学习生成人类可以理解的自然语言。GPT-3 由 OpenAI 训练与开发,模型设计基于谷歌开发的 Transformer 模型。GPT-3 的神经网络包含 1750 亿个参数,需要 800GB 来存储, 为有史以来参数最多的神经网络模型。该模型在许多任务上展示了强大的零样本和少样本的能力。OpenAI 于 2020.05 发表 GPT-3 的论文(Language models are few-shot learners),在次月为少量公司与开发人团释出应用程序界面的测试版。微软在 2020.09.22 宣布取得了 GPT-3 的独家授权。GPT-3.52022.03.15,OpenAI 在其 API 中提供了具有编辑和插入功能的新版本 GPT-3 和 Codex,名称为 “text-davinci-003” 和“code-davinci-002”。这些模型被描述为比以前的版本更强大,并且接受了截至 2021.06 的数据训练。2022.11.30,OpenAI 开始将这些模型称为 “GPT-3.5” 系列,并发布了 ChatGPT,它是从 GPT-3.5 系列中的一个模型进行微调的。GPT-4Generative Pre-trained Transformer 4 (GPT-4) 是由 OpenAI 创建的未发布的神经网络。 据《纽约时报》报道,它“传言将于 2023 年面世”;Vox 声称其他网站曾表示:据传它优于 OpenAI 此前发布的 GPT-3 和 GPT-3.5。The Verge 还援引谣言称,它将大幅增加 GPT-3 的参数数量(从 1750 亿增加到 100 万亿),OpenAI 首席执行官 Sam Altman 将其描述为“彻头彻尾的胡说八道”。ChatGPT聊天生成型预训练变换模型(英文:Chat Generative Pre-trained Transformer,简称:ChatGPT),是由 OpenAI 开发的一个人工智能聊天机器人程序,于 2022.11 推出。该程序使用基于 GPT-3.5 架构的大型语言模型并通过强化学习进行训练。 ChatGPT 目前仍以文字方式交互,而除了可以通过人类自然对话方式进行交互,还可以用于相对复杂的语言工作,包括自动文本生成、自动问答、自动摘要等在内的多种任务。如:在自动文本生成方面,ChatGPT 可以根据输入的文本自动生成类似的文本(剧本、歌曲、企划等),在自动问答方面,ChatGPT 可以根据输入的问题自动生成答案。还具有编写和调试计算机程序的能力。在推广期间,所有人可以免费注册,并在登录后免费使用 ChatGPT 实现与 AI 机器人对话。ChatGPT 可以写出相似于真人程度的文章,并因其在许多知识领域给出详细的回答和清晰的答案而迅速获得关注,证明了从前认为不会被 AI 取代的知识型工作它也足以胜任,对于金融与白领人力市场的冲击相当大,但其事实准确性参差不齐被认为是一重大缺陷,其基于意识形态的模型训练结果并被认为需要小心地校正。ChatGPT 于 2022.11 发布后,OpenAI 估值已涨至 290 亿美元。上线两个月后,用户数量达到 1 亿。ChatGPT PlusChatGPT Plus 是一项每月 20 美元的订阅服务,允许用户在高峰时段访问 ChatGPT,提供更快的响应时间,并让用户提前访问新功能。Transformer 模型Transformer 模型(直译为“变换器”)是一种采用自注意力机制的深度学习模型,这一机制可以按输入数据各部分重要性的不同而分配不同的权重。该模型主要用于自然语言处理(NLP)与计算机视觉(CV)领域。与循环神经网络(RNN)一样,Transformer 模型旨在处理自然语言等顺序输入数据,可应用于翻译、文本摘要等任务。而与 RNN 不同的是,Transformer 模型能够一次性处理所有输入数据。注意力机制可以为输入序列中的任意位置提供上下文。如果输入数据是自然语言,则 Transformer 不必像 RNN 一样一次只处理一个单词,这种架构允许更多的并行计算,并以此减少训练时间。Transformer 模型于 2017 年由谷歌大脑的一个团队推出,现已逐步取代长短期记忆(LSTM)等 RNN 模型成为了 NLP 问题的首选模型。并行化优势允许其在更大的数据集上进行训练。这也促成了 BERT、GPT 等预训练模型的发展。这些系统使用了维基百科、Common Crawl 等大型语料库进行训练,并可以针对特定任务进行微调。CodexCodex 于 2021 年年中宣布,是 GPT-3 的后代,它还接受了来自 5400 万个 GitHub 存储库代码的训练,并且是为代码自动完成工具 GitHub Copilot 提供支持的人工智能。2021.08,一个 API 以私人测试版的形式发布。根据 OpenAI 的说法,该模型能够使用十几种编程语言创建工作代码,最有效的是 Python。WhisperOpenAI open-sources Whisper, a multilingual speech recognition systemWhisper 于 2022 年发布,是一种通用语音识别模型。它是在不同音频的大型数据集上训练的,也是一个多任务模型,可以执行多语言语音识别以及语音翻译和语言识别。MuseNet关于 OpenAI MuseNetMuseNet 是一个深度神经网络,可以用 10 种不同的乐器生成 4 分钟的音乐作品,并且可以结合从乡村音乐到莫扎特再到甲壳虫乐队的风格。MuseNet 并未根据我们对音乐的理解进行明确编程,而是通过学习预测数十万个 MIDI 文件中的下一个标记来发现和声、节奏和风格的模式。MuseNet 使用与 GPT-2 相同的通用无监督技术,GPT-2 是一种经过训练以预测序列中的下一个标记(无论是音频还是文本)的大规模变换器模型。Microscope关于 OpenAI MicroscopeMicroscope 网站OpenAI 显微镜,它是八种视觉“模型生物”的每个重要层和神经元的可视化集合,通常在可解释性方面进行研究。显微镜使分析这些神经网络内部形成的特征变得更加容易,我们希望它能在我们理解这些复杂系统的过程中对研究社区有所帮助。DALL-E & CLIPDALL-E 网站DALL-E 于 2021 年发布,是一种 Transformer 模型,可根据文本描述创建图像。同样在 2021 年发布的 CLIP 反其道而行之:它为给定图像创建描述。DALL-E 使用 GPT-3 的 120 亿参数版本来解释自然语言输入(形状像五边形的绿色皮革钱包)并生成相应的图片。它可以创建真实物体的图像(带有蓝色草莓图像的彩色玻璃窗)以及现实中不存在的物体(具有豪猪纹理的立方体)。相关资料OpenAI 研究论文OpenAI 官方博客关注公众号 “浮之静”,发送 "chat",进 ChatGPT 技术交流群编辑于 2023-03-01 16:06・IP 属地山西OpenAIChatGPТAI赞同 414 条评论分享喜欢收藏申请转载文章被以下专栏收录AI 系列GPT+ 会是一次革命吗?AI绘画A
从0到1,OpenAI的创立之路 - 知乎
从0到1,OpenAI的创立之路 - 知乎首发于前沿技术切换模式写文章登录/注册从0到1,OpenAI的创立之路OneFlow已认证账号ChatGPT一出,OpenAI名声大震,CEO Sam Altman也成为聚光灯下的C位主角,有些报道甚至开始了对他的“造神”运动。年少成名,他不到30岁就成为YC总裁,从2019年GPT-3开始,他开始主导OpenAI的运营事务,并取得了如今的非凡成就。他擅长将企业发展从1放大到1000,但自OpenAI创立到GPT-2的发布期间,还有更多的故事。Greg Brockman是将OpenAI从0到1拉扯到大的关键先生。他是OpenAI的联合创始人,从2015年开始,Greg和首席科学家Ilya Sutskever主导OpenAI的创建,以及日常运营和研究工作。Greg现在也是OpenAI的董事长和总裁(2022年前一直担任CTO),从企业权力结构来看,他才是OpenAI背后的一号人物。Greg有着非凡履历。2009年,他本科毕业于哈佛大学数学与计算机科学系,2010年在MIT计算机科学读博,期间维护XVM、Linerva和http://scripts.mit.edu等知名项目。毕业后成为互联网支付平台Stripe的CTO,帮助团队实现了员工人数从4人到250人的增长,不过在公司发展蒸蒸日上之际,他选择急流勇退,继续追逐伟大的事业,由此才有了OpenAI的创业历程。OpenAI的诞生也源自一群非凡的投资人。众所周知,OpenAI起源于2015年门洛帕克的一顿晚饭上,那时大佬云集,在基于“构建安全的人工智能以造福人类”的愿景下,他们决定创建一个非营利性机构,并且最终获得了包括Greg Brockman和Sam Altman在内的马斯克、Jessica Livingston(Y C创始合伙人)、Peter Thiel(PayPal联合创始人)、Reid Hoffman(LinkedIn联合创始人)等企业家,以及亚马逊的AWS等知名企业和机构的十亿美元投资。光有钱还不够,负责创建OpenAI团队的Greg还要找到能实现这一愿景的技术人才。ChatGPT大火之时,知乎上有个热议问题:阻碍国内团队研究ChatGPT这样产品的障碍是技术、钱还是领导力?从技术上看,ChatGPT相关算法早就是公开的,没什么秘密,无论是互联网大厂还是融资上百亿的创业公司也不缺买算力和数据的资本。还有不少人反思说国内缺乏那种投资和创业的土壤。但最核心的是,我们缺乏OpenAI这样的团队以及其中极具远见和坚定信念的领导者,这些是使得一切愿景成为可能的必要条件。通过搜寻人际网络,Greg希望邀请一批顶级人才组建队伍。这个网络上的节点人物很是惊人,包括深度学习领域“三巨头”Geoffrey Hinton、Yann LeCun、Yoshua Bengio等大牛,这些大牛又给他推荐了人工智能领域顶尖技术人才,包括机器人与强化学习领域大牛Pieter Abbeel、Andrej Karpathy(后来担任了一段时间特斯拉AI总监后,最近又回归OpenAI)、Ian Goodfellow(GAN网络发明者)、Wojciech Zaremba(Yann Lecun学生)等。当然,除了明星级人物,如果那时你参加线下会议,坐你旁边的人是Greg,他会主动跟你交流,觉得合适也会邀请你加入OpenAI。Greg认为,团队的成功需要招募到对的人。尽管OpenAI成立不久,但经过他和Ilya Sutskever的共同努力,吸引了不少业内顶级大牛加入,而这更多依靠的是对OpenAI使命愿景的认同,以及与聪明人一起工作的环境。最近,ChatGPT让国内不少精英再一次感受到落后的紧迫感,不少创业团队要打造“中国版的OpenAI”。我们不乏真正有抱负的创业者,但想象一下,如果在2015年已经有一支OpenAI团队,Sam Altman和Greg Brockman这群人很可能会去打造另一支不同于它的“DeepMind”团队,而不会称自己要去打造“硅谷版的OpenAI”,并且是为了复现ChatGPT。在Greg Brockman主导OpenAI的最初两年里,2016年4月,OpenAI发布了强化学习研究平台“OpenAI Gym”的公测版,同年12月,发布了软件平台“Universe”,用于衡量和训练人工智能在全球游戏、网站和其他应用程序中的通用智能。那一年,Alphago刚刚问世,新一轮AI黄金时代开启。与此同时,AI领域尚不存在大型语言模型(LLM)这个概念,刚刚成立两年的OpenAI也没有发布GPT模型,他们似乎只有模糊的想法,不过这个新组织每天都在为新技术探索而激动。不管怎样,如果国内要打造这样一支团队,不妨听听当事者Greg Brockman是如何从零到一构建起一支原版的OpenAI,从其创业旅程中一窥他的组织构建思想,他如何聚拢了一大批才华横溢的顶尖人才,这个组织的创新能量又从何而来。(以下内容由OneFlow编译,转载请联系OneFlow获得授权。原文:https://blog.gregbrockman.com/my-path-to-openai)作者|Greg BrockmanOneFlow编译翻译|徐佳渝、贾川在高中毕业后的间隔年里,我曾认真学过编程。我读过图灵的《计算机器与智能》一书,并深受启发:代码能理解那些编写代码者所不能理解的东西。于是我准备着手写一个聊天机器人。那么写出来有多难呢?我想创建的是能与人正常对话的机器人,但找了很久,似乎没有人能做出这种机器人。我很快便搁置了这个想法,转而专注于创建那些能真正产生影响的系统。1. 大学研究项目读大学时,我对编程语言很感兴趣,由此便进入了AI的大门。编译器和静态分析器能“理解”那些我理解不了的程序,于是我便常用其来做一些非常有用的事情,比如快速生成代码并检验其是否正确。我一直想潜下心来去做编程语言研究,却总是受到新的创业点子和新同事的影响。其实我的同事人都还不错,但这些创业想法可就不敢恭维了。无论在哈佛还是麻省理工,我都努力向那些优秀的人看齐,主动融入他们,并与之共建有用的东西。Greg Brockman大三那年,我发现在校创业没有意义,所以我就和那些创业者面谈,汲取经验。与此同时,我终于开始了编程语言研究之旅。我从一位教授那里获得了研究经费,并招募了一些朋友进行静态缓冲区溢出检测项目。几周后,帕洛阿托(Palo Alto)一家尚未启动的初创公司联系了我。一般情况我会直接删除这种邮件,但此时我也正准备与初创公司会面,所以我们团队就立即点开了邮件,此时我也发现,他们也正是我一直在寻找的那种人。于是我离开学校,这也意味着我们的缓冲区溢出检测项目就此搁置了。2. Stripe生涯那家公司就是现在的Stripe。在我的帮助下,公司规模从4人扩大到了250人;在我离开后的一年里,又继续扩大到了450人(当然,这份功劳与我无关)。此时公司的发展正蒸蒸日上,无论有我没我,都会继续继续做伟大的事情,所以我准备离开Stripe。我想做的是与优秀之人同行做些有意义的事情,但开发者基础架构并不是那个我想穷尽余生之力去解决的问题。然而,我终于还是找到了那个我想解决的问题:创造出安全的人类级别的AI(human-level AI)。只要这项技术能真正为人类所用,我想一定会引起轰动,并给世界带来积极影响。(Greg Brockman与Sam Altman)在我最终决定离职之前,Patrick说Sam Altman有很好的局外人视角,而且见过很多跟我情况类似的人,应该能给我一些好的建议,让我去和他谈谈。在与Sam交谈五分钟后,他说:看来你是完全准备好离职了,后续事宜有什么需要我帮助的吗?我说AI是我的首选(这绝对是我的人生目标),但还不确定现在是否就是做这件事的最佳时机,而且我也不知道最佳的贡献方式是什么。他回答:我们一直在考虑通过YC(译者注:Y Combinator,美国著名创业孵化器)建立一个AI实验室,你或许可以跟我们合作。3. 研究深度学习大约在这一两周后,我就离开了Stripe,开始着手深入研究AI,想要更好地了解该领域正在发生的事情。仅从Hacker News上的帖子(例如http://karpathy.github.io/2015/05/21/rnn-effectiveness/)就可以看出:人们对AI尤其是对深度学习的关注度越来越高。但在进入该领域时,我仍然是持有合理怀疑的,在投身AI之前,我想确定一切都是可行的。我的第一个目标是弄清楚深度学习到底是什么,然而事实证明这并非易事。例如,http://deeplearning.net上只是说“深度学习是机器学习研究的一个新领域,引入深度学习的目的是使其更接近于最初的目标——人工智能”。虽然这听起来很令人兴奋,然而却并没有说清楚到底什么是深度学习。幸运的是,我有一些从事AI行业的朋友:Dario Amodei(曾任OpenAI研究主管,现Anthropic创始人和CEO)和Chris Olah(曾任OpenAI技术主管,现为Anthropic联合创始人)。我向他们征求了一些意见,他们给了我一些很好的入门资源,其中最有用的是Michael Nielsen写的书。我读完后还在Kaggle上练习了新学到的技能(在第一次比赛时我就拿到了第一名!)。一路走来,我不断遇到AI领域中那些超级聪明的人,并与我大学时最聪明的一些朋友重新建立了联系,例如现在在该领域工作的Paul Christiano(曾任OpenAI研究员,现Alignment Research Center创始人)和Jacob Steinhardt(加州伯克利分校助理教授)。我觉得这是一个强烈的信号。我了解得越多,就越相信AI已准备好散发自己的光芒。深度学习的能力简直令人难以置信,比如,我们现在可以极其准确地对图像中的目标进行分类(2014年的XKCD就已经实现),语音识别非常精准,还可以生成十分逼真的图像。不过虽然这些技术足够新,但到现在为止还没有改变人们的生活方式,它们如今的影响还仅限于支持某些产品实现特定功能。有一位朋友曾开发过Facebook News Feed。还记得我曾对他说过这样一句话:简单的算法,大量的数据。每个人都试图兜售很酷的新AI算法,但实际上只需要扩展逻辑回归(logistic regression)就会非常奏效。而他对此持怀疑态度。然后我就拿出了谷歌翻译App,将其设置为飞行模式,并向他演示了如何直接翻译图片上的文字。他对此印象颇深,并承认简单的算法对此无济于事(这背后主要是深度学习在发挥作用,不过这不是重点,重点是它有效。)4. 创业想法诞生Sam Altman在2015年6月联系我,问我是否已经想好下一步该做什么了,我告诉他目前的计划是明年开一家AI公司。然后我们打了通电话,他提到他们正在推进YC的AI项目。我问:实验室的目的是什么?“建立安全的人类级AI”,他说。在那一刻我就知道,他很适合当我下一家公司的合作伙伴。现在很少有人敢于明确尝试构建人类级AI。我意识到,有时候一项成就只需要有个胆大的人宣布目标,然后合适的人就会加入其中。大约一个月后,Sam在门洛帕克(Menlo Park)举办了一场晚宴,参加宴会的有Dario、Chris、Paul、Ilya Sutskever、Elon Musk、Sam和其他一些人。我们讨论了AI领域的现状、目前离人类级AI还有多远以及实现人类级AI还需要的东西等等。整场对话围绕着“什么样的组织可以最好地确保AI的有益性”展开。答案很明显:必须是非营利组织,因为没有任何利益冲突来影响其使命。此外,这样组织还必须保持在研究的前沿(根据Alan Kay的名言,“预测未来的最好方法就是创造未来”)。为此,该组织需要有世界上最好的AI研究人员。所以问题就变成了:是否有可能从头开始创建一个拥有最优秀AI研究人员的实验室?我们的结论:还是有机会。这是我第一次见到Elon和Ilya,我对他们的印象非常深刻。Elon充满了好奇心,他真诚地征求他人意见并用心倾听每一份回答;而Ilya则是技术基础的源泉,他是一位头脑清晰的技术专家,知识广博,视野开阔,并且总是能够深入到当前系统局限性和功能的具体细节。我请Ilya对深度学习给出一个好的定义,以下是他的回答:有监督深度学习的目标是解决几乎所有“将X映射到Y”形式的问题。X包括图像、语音或文本,Y包括类别甚至句子。将图像映射到类别、将语音映射到文本、将文本映射到类别等等,如此种种,深度学习都是非常有用的,而且其他方法无法做到。深度学习一大吸引人的特点是它在很大程度上是独立于其他领域之外:在一个领域中学到的许多东西可以适用于其他领域。深度学习模型中建立了抽象层,这些抽象可以完成工作,但很难理解它们究竟是如何做到的。模型通过使用反向传播算法(简单且高效)逐渐改变神经网络的突触强度来学习。因此,我们可以用极少的代码来构建出大规模复杂的系统(因为我们只需要编写模型和学习算法的代码,而非最终结果)。晚宴结束后,Sam送我回城里。我们都认同值得在AI领域做点什么。我知道,只有当有人愿意全心全意地弄清楚这究竟是什么,谁又能够加入其中,我们的愿景才会成为现实。那就让我来当这样的人吧。所以,我明天又要构建一些有影响力的东西了。5. OpenAI的愿景那次晚宴上,我们谈论了成立OpenAI实验室。虽然每个来参加晚宴的人都各抒己见,但并没有一个清晰的愿景,而Elon和Sam则提出了自己的想法:OpenAI旨在构建安全的人工智能以造福人类。我也想尽可能贡献自己的力量,为了如愿以偿,便开始和Sam一起组建团队。不过我们缺少了一个核心要素,即一位AI技术远见者,其直觉和想法可以帮助我们取得突破。(从左至右依次为Ilya Sutskever, Alex Krizhevsky, Geoffrey Hinton)显然,Ilya Sutskever是最佳人选。Ilya可以说是一位艺术家,他常常通过机器学习来表达自己的感受(有时也会通过绘画来表达)。Geoffrey Hinton(深度学习教父)曾告诉我,AlexNet之所以能引发一场计算机视觉深度学习革命,在于Alex Krizhevsky高超的GPU编码技能及Ilya的信念,即深度神经网络必定会在ImageNet竞赛中获胜。(Geoff对自己贡献的管理技巧感到无比自豪。Alex非常讨厌写论文,Geoff告诉他,他在ImageNet上的性能每提高1%,他就可以把论文推迟一周。结果Alex拖延了15周。)一直以来,我都认为自己只能与相识多年的朋友共创公司。然而事实并非如此。八月下旬,我和Ilya在山景城共进晚餐,当时我就知道我们会一起合作,在此之前,我们也只在七月见过一次。我和Ilya聊得十分投机,尽管我对机器学习研究的了解不多,他对工程和团队建设的认识也没有那么深入,但我们对彼此的成就印象十分深刻,也希望能够相互学习。我们交流了彼此的看法、汲取了彼此的长处。Ilya认为,顶级研究人员希望在人工智能组织工作,而该组织致力于为世界创造最佳成果。在我看来,要想解决一些棘手问题,则需将私营企业的资源与学术界的使命相结合。若无外界干预,人工智能将会像自动驾驶汽车一样发挥自身的作用。一旦人工智能的潜力得以证实,人们就会与之展开合作,而后则是一场场技术竞赛。不过,人类级别的人工智能将会是一种与众不同的变革性技术,有其独特的风险和收益。我们看到了这一机遇:在人工智能领域展开合作,汇集众多顶尖研究人员,以取得史上最重大的科技突破。Ilya和我一直在讨论团队组建方案,直到该方案得以落实。期间,我们讨论了战略(即将从事什么工作)、文化(想雇用的人员,即同等重视工程和研究的人员)和策略(举办每日阅读小组)。Alan Kay与我们共进晚餐时,向我们讲述了施乐帕洛阿尔托研究中心(Xerox PARC)的故事,包括Alto的诞生及用硬件“在未来生存”,这些硬件在十年内将花费1000美元。事后,Ilya对用餐期间的谈话做了巧妙总结:“虽然Alan的话我只听懂了一半,但令人振奋不已。不过这顿饭帮我们验证了许多假设,即怎样才能构建一支能将工程与研究相结合的有影响力的团队。6. 早期团队的招募由于Ilya还在谷歌工作,因此无法帮忙招聘,这一工作就落到了我身上。8月至11月,由我负责创办团队。不过,我对人工智能并不熟悉,不清楚如何招募优秀的研究人员。我首先关注的是7月参加过晚宴的人,但不能确认具体人选。下一步,便是通过人际网络与这些人取得联系,并依次寻求他们的推荐,这与我以往的招聘方式有所不同。对于初创公司而言,首要挑战总是要向候选人“兜售”使命,但在OpenAI,使命立刻引发大家的共鸣。于我而言,挑战在于如何说服候选人相信这个未成形的组织。人工智能领域顶尖人才的人际网络对我帮助很大。一位朋友引荐我认识Andrej Karpathy和Wojciech Zaremba(OpenAI联合创始人),由于我并未从事该领域工作,他们对我说的话表示怀疑。Yoshua Bengio又将我引荐给Durk Kingma(曾任OpenAI研究科学家,现在谷歌研究团队),当时后者对于我的提议表示很感兴趣,不过这种兴趣转瞬即逝。真正的转折点是John Schulman(OpenAI联合创始人、研究科学家)的评价,我跟他聊到这一组织的成立,他表示这样的组织正是他所追寻的,能将学术界的开放与使命同私企的资源相结合,因此加入了我们。John的支持也引起了Andrej和Wojciech的关注。招聘工程师相对容易一些。Trevor Blackwell是一位机器人专家,也是YC的合伙人,他一直在与Sam讨论我们正在计划的疯狂想法。Vicki Cheung(现Gantry联合创始人)是在我们成立赞助机构“YC Research(现为OpenResearch)”之后申请加入的。那时,我们虽未表明研究领域是AI,但她深受YC Research构架的鼓舞,并表示很乐意参与我们团队的所有工作。11月初,虽然我们对创始团队有了更深入的了解,但仍然需要让大家正式加入进来。在Sam的建议下,我们邀请了所有候选人去户外漫步。期间,人人都真切地表达了内心想法、观点,才思泉涌(实际上,该地也是Andrej提出Universe之地)。回程中,一路上交通堵塞。不过几乎没人留意到这一点,因为大家聊得太投入了。我们给此次活动的参与者都发了offer,并将offer的截止日期设置为12月1日,这样我们就可以在12月初的NIPS(NeurIPS)机器学习会议上发布成员加入的消息。“月末”就这样开始了。Sam、Elon还有我和每个人都聊了聊,主要是让大家相信这件事的真实性。除了一名完全无意涉足人工智能的工程师外,其他候选人都接受了我们的offer。Fred Brooks在《人月神话》一书中提及了Robert Heinlein的故事,该故事讲述了“登月”项目。该项目的总工程师总会被运营任务分散注意力,例如关于运输车或电话的决策,这种情况一直持续到他收到一份报告,据报告显示不再让他负责所有与技术无关的任务。这一故事给我留下了印象深刻,我认为它同样适用于构建人工智能的项目。技术领导除了做实际技术工作以外,同时还应该亲自做决策。我不知道自己的工程技能何时才能派上用场,不过在此期间,我决定尽我所能帮Ilya分担与研究无关的任务。2016年1月4日,我们整个团队来到第一间办公室(也就是我的公寓)开始工作。讨论中,John和Ilya转身打算在白板上写点些什么,却发现这儿没有白板。我立即给他们买了一块白板,还有一些办公用品。我们的第一间办公室(配有白板)在一月剩下的时间里,我负责组织团队,帮忙确定哪些人负责哪些工作,以及团队想达成的目标。我们讨论了研究人员需要具备什么品质,践行公司理念,设计并确保面试顺利进行。此外,我们还谈论了愿景、工作方式以及想要达成的目标。我和Vicki购买了服务器,创建了Google Apps帐户,同时对我们12月启动的Kubernetes集群进行了维护。余下的时间,我阅读了Ian Goodfellow(GAN网络发明者)的深度学习书籍(并写下了书评,由于我的评论比其官方评审员的评论更加全面,给他留下了深刻印象。因此,这也不失为一种招聘策略)。7. Gym库比起使用新的数据集,使用一种新的算法通常能解决机器学习中的问题,Wojciech建议构建一个库来形成强化学习环境的标准(实际上是动态数据集),现在称之为Gym。这个代码库的质量很快成为我们迭代速度的高阶位(high-order bit)。二月底,我和John讨论了Gym的公开发布时间。按照目前的发展情况,他认为可能要到今年年底才能发布。(我们正在用机器学习训练Fetch机器人。Gym支持控制物理机器人和模拟机器人。)一时之间,工程学成了研究进展的瓶颈。Ilya与我互换了角色,由他负责行政工作,这样我就可以专注于技术工作。和John考察了这项工作之后,我们知道在四月底之前就能构建好Gym。在Stripe时,我发现了一个能够直接创建软件系统的可重复模式,即专注于软件,排除一切干扰,从早工作到晚。这样一来便能激励大家贡献自己最好的作品(重要的是,是以输出质量来衡量而不是工作时间)。这是我感觉最有活力的时候:编程就如魔法变成现实一般,我所想象和描述的事情都将成为可能。这种模式产生了Stripe信用卡保险库(2010年构建完毕,也就是在我假期回家的两周内完成的)、信用卡授权流程(在三周内就能建成,而银行构建周期却需要6-12个月)和夺旗赛(通常我和其他人都要花三周的时间)。从战术上讲,我可以选择一个“试发行”日期和“正式”发布日期,间隔一两周;我从未选择过“试发行”日期,但从未错过“正式”发布日期。随之而来的是从未面临过的挑战。由于我并非该领域的专家,起初,引起了很多摩擦。我会构造一个抽象的框架来帮助Wojciech的工作顺利进行,而John会发现这一举动阻碍了他的工作进程。但很快,我就了解到哪些决定会影响研究的工作流程(例如人们如何记录指标)以及哪些细节研究人员不会关注(例如人们如何录制视频)。在确定了案例对研究的重要性之后,要保持一定的谦逊,才能做出最佳选择。我通常会提出五个可能的备选方案,John则会指出其中有四个方案都不行。但大多数设计决策可以通过软件工程的直觉做出,而无需深入了解相关领域。幸运的是,我不是一个人。大约在Gym发布的前六周,曾与我在Stripe一起研究CTF 3的Jonas Schneider联系了我。短短几天时间,我们就在Gym上建立了合作关系。因为他人在德国,所以我们通过每日交接最终成功地完成了该项目。对于已经建立好工作关系的人来说,这真的很奇妙,若一切从头开始,我们不会保持如此紧密的工作关系。(Gym发布后不久,我们在ICLR(国际表征学习大会)上分发OpenAI的T恤。)总的来说,机器学习系统可视为机器学习的核心之一——通常是一种高级算法,要想理解该算法,至少需要阅读过几章Ian的书——涉及大量软件工程的内容。工程可以围绕数据进行改组,提供输入和输出的封装器,或调度分布式代码,这些都会都以黑盒形式与核心(core)连接。我们在工程和研究方面作出的努力达到一定程度时,机器学习就会取得进步。工程方面每多一分努力(例如减少Universe延迟),我们的模型问题就会逐渐变得更容易,并且有机会完成当前研究。8. Universe平台在今年4月Gym上线后,我和Ilya开始调整组织流程。Sam和Elon都会到访公司,提出一些指导意见,我们会根据其指导来确定团队的结构及目标。(团队在第一间办公室工作的场景。当时办公室有白板,只是图片中未显示。)多样、复杂的AI环境是必不可少的。Andrej提出了一个不错的建议,即创建一个Agent来控制Web浏览器,但这与Selenium测试工具有所冲突。我开始考虑使用VNC,以允许Agent从像素驱动整个桌面。但我们发现,这种方法存在许多风险。例如,2013年DeepMind发布的Atari文章提出,他们花了50个小时从像素训练Pong游戏,我们的环境将比Pong更难。即使是做小规模的实验,我们也需要花几天时间,而且不会取得任何进展。因此,我们设定了一个降低内部风险的目标,即让Agent在一小时内学会Pong(如今我们已取得了突破:十分钟内便能解决Pong遇到的问题)。就像构建Gym时那样,我专注于构建VNC系统,现称之为Universe。与Gym不同的是,该项目并非旨在支持我们现有的研究方式,而是提出全新的问题。关于这一点,我们每个团队都有负责人,他们负责照顾自身团队的成员,我们的工程师Jie Tang已开始带头招聘。因此,行政这一重担并没有完全落在Ilya身上。这十分幸运,因为这样Ilya就能为该风险项目的首个版本构建Agent。一个从整个动作空间随机抽样的Universe Agent(即随意点击、按键)。更多表现良好的Agent请参阅Universe发布的帖子。Universe项目耗时相当长,因此,需要合理分配时间来运营项目。我找到了一个平衡点,编码时,我会将时间进行划分。一次会议会扼杀整个上午/下午的生产力,若上午和下午都有会议,我将精疲力竭,从而导致晚间的编码效率大大降低。因此,我开始将会议时间限制在清晨或午餐后,且每天的会议次数低于三次,隔天的会议次数不超过一次。搭建Universe本身就是一项系统研究工作:虽然高级规范很简单(允许Agent使用键盘/鼠标/屏幕),但从来没有人尝试过构建类似的系统。长期以来,人类一直可以用VNC控制一台远程机器,但还无法实现以编程方式同时控制数十台机器。当我们需要衡量系统的端到端延迟时,Catherine Olsson和我构建了一个系统来将时间戳嵌入图像中。有时挑战不是技术上的:当研究因为训练数据有限而受阻时,Tom Brown在24小时内就组建了一个外包团队来玩游戏。有时候挑战也可能很难以理解,比如当Jonathan Gray注意到由于外包人员的笔记本电脑CPU较低端,游戏动态可能会与AI有所不同。一天,当我正在努力重组一些JSON基准规范时,我意识到:我们需要重新构建这些规范,因为没有人从未尝试过在数千个游戏中对单个Agent进行基准测试。在OpenAI,做艰苦的工作也是最基本的。在接下来的几个月里,由Dario Amodei和Rafał Józefowicz负责Universe的研究工作。他们都是夜猫子,我也和他们一起熬过了很多个夜晚,解决研究中遇到的问题。有时我也想躺在床上睡觉,但每修复一个Bug都会使研究加速几个小时。每个人的工作中都有一些非常有用的东西,能让研究人员提出人类此前从未有过的问题。Universe团队在办公室开会到发布时,Universe团队已经有约20个人了。Universe现在是一个旗舰项目,也是我们研究战略的核心部分。Universe的例子恰好说明“工程”是如何成为当今ML研究的瓶颈,这也让我知道为什么有那么几天只想读Ian的书了。9. 下一步发展方向我们现在是一个拥有四十人的公司,需要有人全力来优化团队。自OpenAI成立以来,我们一直在寻找合适的首任技术经理。几个月前,Sam向我介绍了一位特别出色的工程执行人:Erika Reinhardt。Erika曾在Planet Labs担任产品工程总监,现在在和Sam一起运营http://voteplz.org。在Planet Labs时,Erika是对端到端卫星成像系统了解最深的人之一。她工作努力,自驱力强,总能把事情做好,前同事都说她是所能遇到的最聪明的人。Sam和我就准备邀请她加入公司。公司团建,2016年10月但在选举会和Universe发布会上与我们合作时才是她最具魅力的时刻,她发现她的领导技能在这种环境中非常适用。她告诉我:在看到OpenAI在参议院举办的首次AI听证会上发言的那一刻,她就下定决定要加入OpenAI。当时OpenAI说:我们正处于重大技术变革的开端,此时最重要就是要把握时机。在Stripe时,Marc Hedlund和我常会遇到他在之前的许多公司中都遇到的问题,所以他喜欢开玩笑说所有公司都一样。就这一点而言,确实有现实依据:如果将范围缩小一点,就会发现公司都是围绕一个目标来把人组织起来。但每个公司要解决的问题又不一样,这又决定了公司之间会有所差异。大多数初创公司都是先创造出一种技术,然后随着时间的推移对其进行运营和扩展。OpenAI是创造新技术的工厂,这意味着我们必须构建公司来创造新事物。我们需要维护基础设施和大型代码库,但它们又满足了我们快速行动、创新和通过结合软件工程和机器学习研究来达到新高度的需求。在OpenAI当CTO的这段时光里,我做的正好是我最喜欢做的事:写代码。但即便如此,人仍然是我关注的焦点,所以我在OpenAI的故事是与社会的故事,而不是与技术的故事。在未来,我们团队要继续携手并进,共同应对海因莱因短篇小说中“卡车或电话”的挑战,OpenAI才能持续发展。在此,我向Ilya、Sam、Elon以及为OpenAI付出过的每一个人表示衷心的感谢。其他人都在看ChatGPT搜索风暴ChatGPT数据集之谜OneFlow v0.9.0正式发布“远见者”Andrej KarpathySam Altman的成功学|升维指南深度学习崛起十年:“开挂”的OpenAI革新者OpenAI掌门Sam Altman:AI的下一个发展阶段欢迎Star、试用OneFlow最新版本:编辑于 2023-03-17 12:49・IP 属地北京ChatGPTOpenAILLM(大型语言模型)赞同 253 条评论分享喜欢收藏申请转载文章被以下专栏收录前沿技术关于AI的最新技术
OpenAI - MBA智库百科
OpenAI - MBA智库百科
全球专业中文经管百科,由121,994位网友共同编写而成,共计435,713个条目
查看
条目讨论编辑 收藏
简体中文繁体中文
工具箱▼
链入页面
链出更改
上传文件 特殊页面 可打印版
永久链接
OpenAI
用手机看条目
扫一扫,手机看条目
出自 MBA智库百科(https://wiki.mbalib.com/)
OpenAI人工智能研究公司(OpenAI)
目录
1 OpenAI简介
2 OpenAI的发展历程
3 OpenAI大事件
3.1 阿尔特曼解雇风波
4 OpenAI的研究原则
5 OpenAI的特色产品
5.1 ChatGPT
5.2 DALL·E 2
5.3 Whisper
6 相关条目
7 参考文献
[编辑]OpenAI简介
OpenAI,也称“OpenAI公司”是美国的一家人工智能公司。2015年由马斯克、美国创业孵化器Y Combinator总裁阿尔特曼、全球在线支付平台PayPal联合创始人彼得·蒂尔等硅谷科技大亨创立。
[编辑]OpenAI的发展历程
2015年由马斯克、美国创业孵化器Y Combinator总裁阿尔特曼、全球在线支付平台PayPal联合创始人彼得·蒂尔等硅谷科技大亨创立。
2016年6月21日,OpenAI宣布了其主要目标,包括制造“通用”机器人和使用自然语言的聊天机器人。OpenAI研发主管伊利娅·苏特斯科娃(Ilya Sutskever)、OpenAI CTO格雷格·布劳克曼(Greg Brockman)硅谷知名创业加速器Y Combinator总裁萨姆·阿尔特曼(Sam Altman)以及连续创业家埃隆·马斯克(Elon Musk)等人联合发表博文称:“我们正致力于利用物理机器人(现有而非OpenAI开发)完成基本家务。”[1]
2019年7月22日,微软投资OpenAI 10亿美元,双方将携手合作替Azure云端平台服务开发人工智能技术。
2020年6月11日,OpenAI宣布了GPT-3语言模型,微软于2020年9月22日取得独家授权。
2022年6月,量子计算专家、ACM计算奖得主Scott Aaronson宣布,将加盟公司[2]。
2023年1月30日,微软宣布已与OpenAI扩大合作伙伴关系,声明称,作为两家公司合作伙伴关系的第三阶段,微软将向OpenAI进行一项为期多年、价值数十亿美元的投资,以加速其在人工智能(AI)领域的技术突破。[3]
[编辑]OpenAI大事件
[编辑]阿尔特曼解雇风波
当地时间2023年11月17日,因ChatGPT而名声大噪的OpenAI在官网发布公告称,董事会宣布,公司CEO(首席执行官)阿尔特曼将辞去CEO职务并离开公司,首席技术官米拉·穆拉蒂将担任临时CEO,立即生效。
公告还宣布,作为“人事变动的一部分”,OpenAI联合创始人兼总裁格雷格·布洛克曼将辞去董事会主席职务,但会继续担任公司职务。然而,不久后,布洛克曼就表示,自己也将离开公司。
微软CEO萨提亚纳德拉11月20日在社交平台上宣布,将继续致力于与OpenAI的合作,期待着了解OpenAI的新领导团队并与他们合作。纳德拉还宣布,山姆·阿尔特曼和格雷格布罗克曼及其同事将加入微软,领导一个新的高级人工智能研究团队。微软首席技术官凯文·斯科特 (Kevin Scott) 21日在社交媒体上发文称,欢迎所有考虑离开OpenAI的员工加入微软,并会提供“薪酬相匹配”的岗位。
11月21日晚间,美国人工智能新锐巨头OpenAI宣布,已经原则上达成协议,山姆·阿尔特曼(Sam Altman)重返公司担任CEO,“并组建由董事会主席Bret Taylor、Larry Summers和Adam D'Angelo组成的新董事会。”OpenAI在声明中指出,正在合作商讨有关细节,感谢耐心等待。
新的董事会名单显示,只保留了Quora的首席执行官亚当·德安吉洛(Adam D'Angelo),Salesforce前联合首席执行官布雷特·泰勒(Bret Taylor)和前美国财政部长萨默斯(Larry Summers)加入新成立的董事会。
阿尔特曼随后发文称,自己深爱OpenAI,过去几天所做的一切都是为了让这个团队与其使命保持一致,“当我决定在周日晚上加入微软时,很明显这对我和团队来说是最好的选择。在新董事会和纳德拉的支持下,我期待着重返OpenAI,并巩固我们与微软的牢固合作伙伴关系。”
[编辑]OpenAI的研究原则
OpenAI的使命是确保通用人工智能 (Artificial General Intelligence, AGI),即一种高度自主且在大多数具有经济价值的工作上超越人类的系统,将为全人类带来福祉。我们不仅希望直接建造出安全的、符合共同利益的通用人工智能,而且愿意帮助其它研究机构共同建造出这样的通用人工智能以达成我们的使命。为了达到这个目标,我们制订了如下原则:
广泛造福社会
我们承诺在通用人工智能的开发过程中,将利用所有可获得的影响力,确保它可以造福全人类。我们将避免把人工智能或通用人工智能的技术置于损害人类或过度集中权力的事业中。
我们的首要任务是对人类文明负责。我们预计需要调用大量资源来完成这一使命。同时,我们会积极行动以减少雇员和利益相关者间的利益冲突,确保大多数人可以受益。
关注长远安全问题
OpenAI致力于进行能够确保通用人工智能安全的研究。我们力求在整个人工智能研究领域内推动这类研究项目的广泛应用。
我们担心通用人工智能在发展后期将演变成一场激烈的竞赛,导致缺乏充足的时间进行安全防范。因此,如果一个与人类价值观相符、注重安全的项目领先于我们将近达成通用人工智能,我们承诺将停止竞赛,幷转而协助这个项目。我们会针对个别情况设计具体的合作方案。不过,一个典型的触发条件可能会是「这个项目在未来两年内能够成功研发通用人工智能的概率超过一半」。
引领技术研究
为了能有效地促进通用人工智能对社会的正面影响,OpenAI必须站在人工智能技术研究的前沿。我们认为仅做政策和安全性的倡导是过于单薄的。
我们相信人工智能在达成通用人工智能之前便会产生广泛的社会影响。OpenAI希望在符合我们的使命和专长的领域中努力保持领先地位。
保持合作意愿
我们会和其它研究机构以及政策制定机构积极合作。我们希望可以建立一个国际化的社区,共同应对通用人工智能的全球性挑战。
我们致力于研发公共物品,以帮助社会走向与通用人工智能共处的时代。目前这包括公开发表大多数的人工智能研究成果。OpenAI预料未来对安全和安保的考虑将会使我们减少发表传统的研究成果,而更注重分享安全、政策和标准化相关的研究。
[编辑]OpenAI的特色产品
[编辑]ChatGPT
ChatGPT是由人工智能研究实验室OpenAI在2022年11月30日发布的全新聊天机器人模型,一款人工智能技术驱动的自然语言处理工具。它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码等任务。同时也引起无数网友沉迷与ChatGPT聊天,成为大家讨论的火爆话题。
ChatGPT是人工智能研究实验室OpenAI新推出的一种人工智能技术驱动的自然语言处理工具,使用了Transformer神经网络架构,也是GPT-3.5架构,这是一种用于处理序列数据的模型,拥有语言理解和文本生成能力,尤其是它会通过连接大量的语料库来训练模型,这些语料库包含了真实世界中的对话,使得ChatGPT具备上知天文下知地理,还能根据聊天的上下文进行互动的能力,做到与真正人类几乎无异的聊天场景进行交流。ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。
在OpenAI的官网上,ChatGPT被描述为优化对话的语言模型,是GPT-3.5架构的主力模型。
ChatGPT具有同类产品具备的一些特性,例如对话能力,能够在同一个会话期间内回答上下文相关的后续问题。然而,其在短时间内引爆全球的原因在于,在网友们晒出的截图中,ChatGPT不仅能流畅地与用户对话,甚至能写诗、撰文、编码。
ChatGPT还采用了注重道德水平的训练方式,按照预先设计的道德准则,对不怀好意的提问和请求“说不”。一旦发现用户给出的文字提示里面含有恶意,包括但不限于暴力、歧视、犯罪等意图,都会拒绝提供有效答案。
由于ChatGPT太“聪明”,引起无数网友沉迷与它进行聊天,有人让它帮忙改作业,有人让它扮演虚拟女友、有人让它编写请假理由、有人用它来补习外语,更有人让ChatGPT陪自己演戏。无论是生成小说、疑难解答或者是哲学的问题,ChatGPT都交上几乎完美的答案,令人惊叹不已。
2023年1月4日消息,知情人士称,微软公司正计划推出新版必应搜索引擎,使用爆红聊天机器人ChatGPT背后的人工智能(AI)技术。
2023年1月,巴黎政治大学(Sciences Po)宣布,该校已向所有学生和教师发送电子邮件,要求禁止使用ChatGPT等一切基于AI的工具,旨在防止学术欺诈和剽窃。ChatGPT是一个免费程序,可根据提示生成几乎任何主题的原始文本,包括文章、论文、笑话甚至诗歌[4]。
[编辑]DALL·E 2
DALL·E 2是一个新的人工智能系统,可以根据自然语言的描述创建逼真的图像和艺术。
DALL·E 2可以从一个文本描述。它可以结合概念、属性和样式。如:宇航员、泰迪熊、一碗汤、骑马、懒洋洋地躺在太空中的热带胜地、在太空和猫打篮球、以照片般逼真的风格 以安迪·沃霍尔的风格作为铅笔画.....
DALL·E 2可以将图像扩展到原始画布之外,创造出丰富的新作品。
DALL·E 2可以对自然语言字幕中的现有图像进行逼真的编辑。它可以添加和删除元素,同时考虑阴影,反射和纹理。
DALL·E 2可以拍摄图像并创建受原作启发的不同版本。
DALL·E 2已经学会了图像和用来描述它们的文字之间的关系。它使用了一种称为“扩散”的过程,这种过程从随机点的图案开始,当它识别出图像的特定方面时,就会逐渐改变该图案。
[编辑]Whisper
Whisper是一个自动语音识别系统(ASR),对从网络收集的68万小时的多语言和多任务监督数据进行训练。使用这样一个庞大而多样的数据集可以提高对口音、背景噪声和技术语言的鲁棒性。此外,它还支持多种语言的转录,以及将这些语言翻译成英语。Whisper是开源模型和推理代码,为构建有用的应用程序和进一步研究鲁棒语音处理奠定基础。
[编辑]相关条目
AIGC
NLP
人工智能
[编辑]参考文献
↑ OpenAI宣称将制造“通用”机器人.网易科技.2016-06-21
↑ 量子计算专家、ACM计算奖得主加盟OpenAI.澎湃新闻.2022-06-20
↑ 微软宣布已与OpenAI扩大合作伙伴关系 AIGC概念股开盘走高.网易新闻.2023-01-30
↑ 巴黎政治大学禁用ChatGPT以防抄袭,使用者或面临开除处分.界面快报.2023-01-28
本条目仅是MBA智库百科对OpenAI的介绍。若您需要与OpenAI联系,请访问OpenAI官方网站。
来自"https://wiki.mbalib.com/wiki/OpenAI"
打开MBA智库App, 阅读完整内容
打开App
本条目对我有帮助4
赏
MBA智库APP
扫一扫,下载MBA智库APP
分享到:
温馨提示
复制该内容请前往MBA智库App
立即前往App
如果您认为本条目还有待完善,需要补充新内容或修改错误内容,请编辑条目或投诉举报。
本条目相关课程
本条目由以下用户参与贡献
上任鹅陈,陈cc,Dan. 页面分类: 美国企业
评论(共0条)提示:评论内容为网友针对条目"OpenAI"展开的讨论,与本站观点立场无关。
发表评论请文明上网,理性发言并遵守有关规定。
首页
文档
百科
课堂
商学院
资讯
知识点
国际MBA
商城
企业服务
问答
首页
专题
管理
营销
经济
金融
人力资源
咨询
财务
品牌
证券
物流
贸易
商学院
法律
人物
分类索引
百科VIP
百科VIP会员权益
无广告阅读
免验证复制
开通/续费百科VIP
登录
消息
昵称未设置
百科VIP
未开通
收藏夹
账号安全中心
我的页面
我的贡献
我的讨论页
我的设置
退出登录
打开APP
导航
最新资讯
最新评论
最新推荐
热门推荐
编辑实验
使用帮助
创建条目
随便看看
本周推荐
最多推荐
生产线包装印刷纪梵希食品智能卡宗庆后第一性原理批发敞口头寸头寸
奶头乐理论蘑菇管理定律猴子管理法则情绪ABC理论垃圾人定律100个最流行的管理词汇破窗效应INFPSWOT分析模型21天效应
以上内容根据网友推荐自动排序生成
下载APP
此页面最后修订:10:21,2023年11月23日.
智库首页 -
百科首页 -
关于百科 -
客户端 -
人才招聘 -
广告合作 -
权利通知 -
联系我们 -
免责声明
- 友情链接
©2024 MBAlib.com, All rights reserved.
闽公网安备 35020302032707号
意见反馈
问题分类
类型
反馈内容
添加图片(选填)0/9
联系方式
取消
提交
提交成功
反馈结果请前往 MBA智库App 查看 (我的 > 帮助与反馈 > 我的反馈)
知道了
月入7亿!OpenAI首次披露商业化能力,CEO:营收年化超95亿_澎湃号·湃客_澎湃新闻-The Paper
!OpenAI首次披露商业化能力,CEO:营收年化超95亿_澎湃号·湃客_澎湃新闻-The Paper下载客户端登录无障碍+1月入7亿!OpenAI首次披露商业化能力,CEO:营收年化超95亿2023-10-14 15:34来源:澎湃新闻·澎湃号·湃客字号明敏 发自 凹非寺量子位 | 公众号 QbitAI风头正盛的OpenAI今年能进账多少钱?奥特曼先给员工们透了个底。年化营收达13亿美元(折合人民币近95亿)。这是OpenAI年化营收数字的再一次“修改”。6月份,有方面预估OpenAI今年营收将达2亿美元,当时已经震惊了一遍科技圈,要知道去年OpenAI进账只有2800万美元。但还是保守了。8月底,The Information认为未来12个月,OpenAI能营收超10亿美元。奥特曼的最新消息算是肯定了这一分析。而且间接透露出了一个事实:OpenAI现在每月营收已经超过1亿美元(折合人民币约7亿元)。对比来看,其最强竞争对手Anthroic的年化营收为1亿美元。看来,有网友在2月份时分析OpenAI月流水能比肩王者荣耀,还真不是开玩笑。营收暴增服务还便宜那么问题来了,OpenAI暴增的营收来自哪?最明面的当然是ChatGPT Plus带来的收入。还有另一个主要方面是微软的Azure OpenAI服务。今年1月微软宣布Azure全球版企业客户可以在云平台上直接调用OpenAI模型,包括GPT-4、CodeX和Dall-E。目前还不知道OpenAI从中获得收入的比例。不过,在OpenAI营收数字不断刷新纪录的同时,外界担心可一点都没减少,还有声音认为OpenAI有可能崩溃。原因主要在于,各种披露的数据,都只谈营收但没说盈利。有人猜测可能现在还没赚到钱。但实现盈利也不难,毕竟软件服务增速这么快。加之最近有消息传出,这波大模型趋势里,哪怕是微软都还没赚到钱呢。用户量高达150万的AI编程工具GitHub Copilot,平均每个月在每个用户身上都要倒贴20美元,最高能达80美元。换算一下,微软自做出Copilot以来,光是一个月在它上面亏损就高达3000万美元,一年下来亏损直接过亿。而且和各家对比来看,OpenAI家的服务还是便宜那一挂里的。有人计算了下,他们团队自己的项目在GPT-3.5上微调一次需要花费4-12美元,大约需要1-1.5个小时微调100万个token。如果在亚马逊云(AWS)上,一个单独的p4d.24xlarge每小时售价为32.77美元,如果订阅一年价格为19.22美元。假如OpenAI的GPT-3.5微调只调用8个GPU,那么对比来看,在AWS上用p4d.24xlarge的价格差不多是OpenAI的3-8倍。由此也就不难理解为啥有人会开始担忧。不过换个角度来看,这可能也是OpenAI战略的一环。有人给出了中肯的分析:OpenAI便宜,因为现在它必须便宜,这样能快速抢占市场。这场AI竞赛里的赢家不会是拥有最先进技术的公司,而是能带来出色用户体验、打开大众知名度且产品有护城河的公司。以及今年以来,OpenAI吸金无数,CEO奥特曼也表现出了出色的“搞钱能力”。今年1月微软再向OpenAI加注100亿美元;4月OpenAI拿下超3亿美元融资。如今OpenAI被曝的最新估值,很可能达到800-900亿美元。消息称公司正在组织一轮要约收购,外部投资者能借此机会从一些员工中购买股份,这是OpenAI今年举行的第二次类似要约收购。而这还没达到奥特曼的期望。知情人士透露,他曾暗示OpenAI未来几年会尝试筹集1000亿美元资金。市场预计OpenAI最快在今年内还将筹集另一轮大笔资金。有人便表示,OpenAI如今能在AI领域称霸,不只依靠其技术的领先性,也要看它财务方面的快速增长。参考链接:[1]https://readwrite.com/openais-financial-ascent-from-28-million-to-1-3-billion-in-yearly-revenue/[2]https://news.ycombinator.com/item?id=37860819[3]https://twitter.com/binarybits/status/1712488613844246787[4]https://twitter.com/dotey/status/1712657913284587556— 完 —原标题:《月入7亿!OpenAI首次披露商业化能力,CEO:营收年化超95亿!2月内涨30%》阅读原文特别声明本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。+1收藏我要举报查看更多查看更多开始答题扫码下载澎湃新闻客户端Android版iPhone版iPad版关于澎湃加入澎湃联系我们广告合作法律声明隐私政策澎湃矩阵澎湃新闻微博澎湃新闻公众号澎湃新闻抖音号IP SHANGHAISIXTH TONE新闻报料报料热线: 021-962866报料邮箱: news@thepaper.cn沪ICP备14003370号沪公网安备31010602000299号互联网新闻信息服务许可证:31120170006增值电信业务经营许可证:沪B2-2017116© 2014-2024 上海东方报业有限公为什么只有在美国才能诞生openAI这种伟大的公司? - 知乎
为什么只有在美国才能诞生openAI这种伟大的公司? - 知乎首页知乎知学堂发现等你来答切换模式登录/注册OpenAI为什么只有在美国才能诞生openAI这种伟大的公司?挽救世界人民于水火之中显示全部 关注者8被浏览6,838关注问题写回答邀请回答好问题2 条评论分享6 个回答默认排序Trisimo崔思莫Anthropic粉/A Radical Futurist 关注OpenAI称不上伟大。它是在无数巧合中产生的。你可以说它是偶然的奇迹。他们核心产品ChatGPT,经过很长一段发展时间。直到GPT–2的时候,ilya sutskever,Dario Amodei才意识到一个规则,被称为Scaling Law,也就是规模有多大,能力有多强。——而这个规则是通向AGI最核心的规则。——这也解释了为什么GPT–3为什么膨胀得这么大。这已经是ChatGPT最后一步关键的节点了。在此之前,还有很多关键节点——巧合的契机。如果没有DeepMind(由哈萨比斯创立),就不会有OpenAI。DeepMind表现出强劲的势头,引起了马斯克的注意,马斯克向DeepMind扔过500万美元,获得了一个观察者的位置。戴密斯 哈萨比斯在一次派对上,马斯克(保守派)和佩琪(开明派)彻夜长谈,最后意见不合,割席断交。佩琪插不进DeepMind的局,马斯克一直在寻找自AI上发挥影响力的途径,作为OpenAI攒局人之一,他为OpenAI规划的未来是如何做好AI与人类价值观的对齐。而不是商业化。但Sam Altman这个老6却在暗中推动OpenAI的商业化,如今估值已经达到1000亿$。百达翡丽男如果没有哈萨比斯,就没有DeepMind,没有DeepMind,我们不会看到太多的早期的AI成就,比如雅达利AI(DQN算法) ,Alpha Zero/Fold,Transformer架构,SW2 AI(这些都早于GPT-3)。——我想即使到今天DeepMind可能还会想:OpenAI什么档次,也敢这么高调?没有佩琪,DeepMind也不会足够的资金,去做太大的事。如果没有马斯克,就不会OpenAI的局。没有ilya和Dario,就不会有从GPT走向AGI的思想,没有Greg Brockman,GPT可能很难商品化落地。胖D1:1男没有Sam Altman这个影响力放大镜,我想大部分人都不会这么快知道ChatGPT。当然,还有微软的戏份。OpenAI,像无数块摇摇欲坠的积木拼搭起来的奇迹,偶然中偶然,你可以说它是偶然的奇迹,但算不上伟大。也许OpenAI会一步步复制DeepMind的Transformer,DQN和树搜索……如果要说什么伟大,20美元一个月,我们已经为伟大买单了,对于大部分人来说20美元/月,是不值得的(即使你赚美元)。 我不知道伟大在哪里。中国之所以没有出现OpenAI,因为没有宽松自由的研究环境,KPI的推动下,你只能做增量创新,就像中国的手机,做得很好,但只能算增量创新,而不会有太多革命性创新,更不会有OpenAI这样,各种微小随机性组合起来的现象级公司,中国不喜欢随机性探索,更喜欢有的放矢,有模仿和抄袭对象,动能才会拉满。你可以看到OpenAI在GPT-2之前一直很迷茫,直到确定了Scaling Law。编辑于 2023-12-26 15:01赞同 38添加评论分享收藏喜欢收起Alpaca-fan九州大学 情报科学硕士 关注挽救世界人民于水火,这就太过了。openai说不上伟大,但绝对比绝大部分公司有良心、有理想。单说openai一开始是非盈利的,就这一点有多少人能做到?2015年,马斯克押注新能源汽车,彼时特斯拉还没多少盈利能力,当年openai拉到第一笔启动资金,出资人主要是马斯克、彼得·蒂尔、雷德·霍夫曼、杰西卡·利文斯顿,仔细看看这几个人就会觉得很有意思。蒂尔和霍夫曼是马斯克当年创业Paypal的战略伙伴(虽然老马后来被踹了),而杰西卡·利文斯顿是Y Combinator(简称YC)创始合伙人,而她老公是保罗·格雷厄姆,保罗·格雷厄姆既是奥特曼的领路人,也是YC的创始人,他非常欣赏奥特曼,2014年把YC的总裁位置亲手交给了奥特曼。这种出资阵容,简直就是自家亲朋好友掏腰包。自家人掏腰包创建一个非盈利公司,这种事又有多少人能做到?再说说核心技术成员伊尔亚·苏茨克维,他在受邀加入openai之前,那可是Google Brain的核心之一,2015年的时候Google在AI领域的统治力那可是相当恐怖,而Google Brain作为Google的核心研究组织,地位不言而喻。刚创立的openai比起谷歌,要钱没钱,要人没人。在这种情况下,因为非盈利和为造福人类而加入openai,又有多少人能做到?不止是伊尔亚·苏茨克维,另一位技术核心格雷格·布洛克曼,当时也是Stripe的技术总监,他也受到奥特曼的游说而选择加入openai。无论是出资人还是技术人员,一开始加入openai的目的,除了真的是有理想有情怀,我想不出任何理由。现在openai很受人诟病的一点是,它变成了盈利性质的公司。但不这么做,或许根本看不到chatgpt的诞生。2019年openai因为资金不足,已经在崩溃边缘,奥特曼明白,如果不解决财务问题,openai迟早解体。所以有了Openai LP的诞生。即便成了盈利公司,也能看出来openai已经很努力压制盈利公司的部分了。openai设定了100倍的盈利上限,并且把公司决策权保留在非盈利的母公司Openai Inc上。能看出来,即便真的需要钱,openai也很努力保持自己非盈利的初衷,保证自己的理想主义情怀。奥特曼在5月美国国会AI听证会上坦言,他没有Openai的任何股份,做Openai CEO仅仅是因为热爱,议员甚至半开玩笑地说你得给自己请个律师:个人觉得,美国能诞生这种公司的原因就在于它有足够的土壤诞生这群理想主义者。发布于 2023-12-26 19:57赞同 141 条评论分享收藏喜欢