随着OpenAI推出ChatGPT在人工智能领域掀起的千层浪,生成式AI开始被普罗大众所熟知。《日本经济新闻》在此前报道中指出,全球100多家大规模生成式AI企业总市值达480亿美元,约为2020年的6倍,OpenAI的确引领了市场对生成式AI企业的投资热潮。
实际上,除了OpenAI,AI的发展浪潮中还有Jasper、DeepMind、Stability、Cohere等竞争者。5月3日,《纽约时报》报道称,两名知情人士透露Cohere已获2.5亿美元融资,估值约20亿美元,投资者包括互联网软件巨头Salesforce、芯片制造商Nvidia、多伦多风投公司InoviaCapital和硅谷公司IndexVentures。这是自2022年ChatGPT发布后在生成式AI领域的最新重大投资。而此前,Cohere筹集的总资金已达1.7亿美元,包括2022年由TigerGlobal领投的1.25亿美元B轮融资。
“百舸争流,奋楫者先;千帆竞发,勇进者胜”。作为加拿大的一家初创企业,Cohere何以突出重围,斩获众多投资者的青睐?了解该企业的发展历程、其产品区别于ChatGPT的独特优势后,相信我们会对投融资市场风向的选择理由与生成式AI的发展动向有所理解。
一篇著名的论文
创立于2019年的Cohere是一家自然语言处理(NLP)公司,基于大型NLP模型为外界提供API服务,从而提高计算机理解和生成文本、阅读和写作的能力。该公司由艾丹·戈麦斯(AidanGomez)与两个朋友NickFrosst和IvanZhang一起创办,它的总部位于加拿大多伦多,在美国旧金山、英国伦敦均设有办事处。自合作以来,他们组建了一支约135人的团队,目前还在继续扩建以更好的提供相关API服务。
Coinbase Institutional:BTCUSD订单簿深度接近6个月以来最佳水平:9月20日消息,Coinbase Institutional发推称,市场流动性状况依然强劲,BTCUSD订单簿深度接近过去6个月的最佳水平。[2021/9/20 23:38:38]
两位联合创始人AidanGomez和NickFrosst曾担任过谷歌研究员,其中AidanGomez是大名鼎鼎的《AttentionIsAllYouNeed》论文的作者之一。该论文提出了一种新的、被誉为ChatGPT的“祖师爷”的网络架构“Transformer”,ChatGPT通过Transformer模型进行了序列建模,并通过自回归方式进行训练,使得大语言模型能够根据前文内容和当前输入,生成符合语法规则和语义逻辑的拟人化内容,这使得国内外都掀起了一波未平一波又起的大规模语言模型训练的热潮。
Cohere提供了与ChatGPT类似的产品,目前主要包括:搜索文本、分类文本和生成文本三大类产品,帮助企业快速部署对话式AI聊天机器人、生成式搜索引擎、文本摘要总结、增强向量搜索等,是为数不多在技术层面具备与OpenAI进行竞争的AI企业之一,这也是其受到资本市场青睐的重要原因之一。
川渝高院将共同利用区块链等技术 深度与诉讼服务进行融合:近日,四川省高级人民法院和重庆市高级人民法院采用远程音视频联调方式签署《成渝地区双城经济圈跨域诉讼服务合作协议》,根据协议内容,两地法院将共同拓展人工智能、大数据、区块链等新兴技术与诉讼服务的深度融合,建立智慧服务共建共享机制。
四川省高级人民法院副院长张能表示,本次“云签约”所采用的区块链存证技术,尤其是音视频存证、电子协议存证,是未来川渝两地跨域诉讼服务合作的一次技术性“试水”。 他表示,未来在川渝地区一系列跨域诉讼服务合作的开展, 都将以此为技术支撑循序展开。[2020/9/19]
Cohere曾在2021年9月获得4000万美元A轮融资;2022年2月获得1.25亿美元B轮融资,投资者包括老虎环球基金、“AI教父”GeoffreyHinton、斯坦福大学教授李飞飞、深度学习专家PieterAbbeel等。在2022年10月,Cohere便开始与谷歌、Salesforce、Nvidia进行融资谈判,如今,Cohere获得巨额融资将继续与OpenAI展开激烈竞争,继续加快类似ChatGPT产品的技术创新和更新迭代。
资本为何青睐?
实际上,在OpenAI发布GPT-4之后的一段时间内,大部分人都将目光聚焦于AI大模型,包括Anthropic、AI21、Cohere和Character.AI在内的众多资金充足的初创公司都在投入大量资源来构建更大的算法和模型,以期待努力赶上OpenAI的技术。
中国工程院院士:区块链产业发展需要深度挖掘其价值:中国工程院院士张平表示,区块链技术是非常有价值、有前景的一种应用技术,在新一轮的区块链发展浪潮下,区块链的产业发展更需要厘清相关问题、深度挖掘其存在和发展的价值,更好地为城市的经济产业发展做出更大贡献。(南京晨报)[2020/6/19]
但就在AI竞赛如火如荼开展之时,OpenAI的首席执行官SamAltman却表示巨型AI模型的时代已结束,“未来新一步的进化,将不会来自于巨型模型”。那同属该领域的Cohere又为何会获得资本的青睐呢?
CohereAI将其模型分为两类:生成模型和嵌入模型。生成模型通过对互联网上大量的数据进行训练,而嵌入模型是多语言支持的,可以支持超过109种语言。Cohere的模型有不同的规格,公司的指令模型每周都在进步,而同类领域的其他提供商通常要几个月或甚至一年才会发布重要的模型更新。
尽管CohereAI与谷歌合作获取其硬件能力,但其并不仅限于GoogleCloud。例如,Cohere在AWSSageMaker上运营,并计划在其他云服务提供商上提供服务。CohereAI的方法非常开放,并以客户为中心,他们通过在任何云供应商上运行以使客户获得最佳体验和服务。
相较于GPT-4,CohereAI尚未采用多模态方法。CohereAI的高级副总裁SaurabhBaji表示,“我认为图像和视频非常令人兴奋。但从商业角度来看,这也是一个不同的问题。我们并不关注AGI,而是专注于客户实际面临的问题。很多客户的需求都非常以语言为中心。”
四川省将推进区块链等与国有企业生产经营深度融合:近日,四川省政府办公厅印发《关于构建全省国资监管大格局协同推进国有企业改革发展的指导意见》。指导意见要求充分发挥国有企业在技术创新中的引领带动作用,加快推进产业数字化、数字产业化,协同推进5G、区块链、大数据、人工智能与国有企业生产经营深度融合。(金融界)[2020/4/24]
从AI竞争格局的角度来看,CohereAI和OpenAI都是目前AI领域的重要参与者。虽然两家公司都专注于大型语言模型,但它们的重点和方法略有不同。OpenAI在一系列领域都有所涉猎,包括自然语言处理、计算机视觉和强化学习等。此外,OpenAI也吸引了大量的资本,其中包括像微软、谷歌和亚马逊这样的科技巨头。
相比之下,CohereAI专注于提供易于使用和部署的大型语言模型,为企业客户提供更好的商业解决方案。尽管CohereAI在规模和影响力上与OpenAI存在一定的差距,但其在语言模型方面的专注度和灵活性使其成为一个非常有前途的公司。
另外,在资本方面,CohereAI也获得了很多青睐。除了几个知名风险投资公司的支持,该公司还获得了加拿大政府和Google等科技巨头的支持。这些资金的注入有助于CohereAI继续扩展其业务和规模,并在AI市场上取得更大的份额。
总的来说,虽然CohereAI和OpenAI在AI竞争格局中处于不同的位置,但它们都是这个领域中非常有前途的公司。CohereAI在语言模型方面的专注度和灵活性使其成为一个与OpenAI进行竞争的关键因素之一,而资本的支持也给了CohereAI更多的机会来发挥其潜力,并在市场上取得更大的份额。
Themis与链安科技达成深度战略合作:近日,Themis(GET)团队宣布与成都链安科技就区块链安全验证,智能合约的开发、审计、安全验证等达成战略合作关系。链安科技是一家知名的区块链安全技术服务商,致力于利用形式化验证理论和方法,提高区块链平台和智能合约的安全性和功能性。Themis致力于打造数字资产多中心托管基础设施,应用范围包括数字资产场外交易、数字资产电商和数字资产基金托管等。[2018/6/5]
实用角度看大语言模型
大语言模型是一类基于深度学习技术的自然语言处理模型,它们具有大量的参数,并能够理解和生成人类语言。这类模型通常采用神经网络架构,尤其是Transformer架构。
近期,一篇综述论文《在实践中利用大模型的力量》在AI学术圈爆火,而其中一张名为“大预言模型进化树”的图片引起了不小的轰动,其梳理了2018年到2023年的大预言模型代表作。
相较于OpenAI不断深耕至今走向AI的前沿,曾经颇具影响力的谷歌BERT似乎从一开始就走向了“岔路”。当我们以年为单位看LLM发展史的时候,忍不住唏嘘“在大模型没有成功之前,一切都是场局”。
大语言模型发展进化史
2017年的时候,谷歌研究员在《Attentionisallyouneed》一文中介绍了Transformer架构——这也是目前最常用到的架构之一,是BERT、GPT等预训练模型的基础。时至今日,Transformer架构仍是GPT模型的基础架构。
Transformer架构的提出和预训练的方法将大语言模型推向了新的阶段——以谷歌为首的科技大公司在2017年后聚焦于研发能够处理多种自然语言任务的大模型。
2018年6月,OpenAI采用Transformer架构发布了它们的模型——GPT-1。紧接着,谷歌正式向世界介绍了全新预训练模型——BERT。
时间来到2019年,微软宣布与OpenAI达成10亿美金的合作。次年9月,OpenAI授权微软使用GPT-3模型,微软成为全球首个享用GPT-3能力的公司。
科技巨头Meta当然也不甘示弱,于2022年推出有着“开源版本的GPT-3”之称的OPT,并于今年推出能在单个GPU上运行的大语言模型LLaMA。
如今GPT-4也已发布,更强的文本生成能力与详细的逻辑判断能力让OpenAI在四年内快速崛起,并成功“破圈”。
Cohere的联合创始人NickFrosst对Altman认为大模型不会永远奏效的观点也是表示认同的,他表示“有很多方法可以让Transformer变得更好、更有用,而且很多方法并不涉及向模型添加参数”。Frosst还说,新的AI模型设计或架构,以及基于人类反馈的进一步优化,将会是许多人工智能研究人员已经在探索和有前途的方向。
一些有前景的LLM用例
利用LLM大模型可以做许多“很酷”的事情,但我们必须承认,基于人类实际需求的创新发展方向才是最根本的逻辑,所以“实用主义”是我们考量LLM应用的重要指标。
对于到底是选择只经过预训练的大模型LLM,还是在此基础上经过特定数据集微调后的较小模型问题,《在实践中利用大模型的力量》这篇论文给出的答案是具体情况具体分析,我们可以参照这张决策流程思维导图来获得一些启示。
各种基于LLM构建的应用程序在不断刷新我们的认知,计算机科学家ChipHuyen在其文章《为生产构建LLM应用程序》中为我们提供了一些有前景的LLM用例:
人工智能助手:针对不同用户群体来构建不同的任务,比如安排日程、做笔记、预订航班、购物等。但是,最终目标是打造一个可以帮助你做任何事情的智能助手。
聊天机器人:聊天机器人在API方面类似于人工智能助手。如果说人工智能助手的目标是完成用户交给它的任务,那么聊天机器人的目标更多的是成为一个伴侣。例如,你可以让聊天机器人像名人、电影角色、作家等一样说话。
学习:ChatGPT不仅可以生成问题,还可以评估学生输入的答案是否正确,以及对论文进行评分和反馈。同时,它也很擅长在同一个辩论话题上采取不同的立场,可以成为学生很好的辩论伙伴。
搜索引擎优化:如今,许多公司都依赖于创造大量内容,希望在谷歌上排名靠前。但在未来,搜索引擎优化可能会变得更像一场猫捉老鼠的游戏:搜索引擎会想出新的算法来检测人工智能生成的内容,而公司则会更好地绕过这些算法。人们可能也会减少对搜索的依赖,而更多地依赖品牌。
除此之外,大语言模型可以帮助生命科学研究人员更好地理解蛋白质、分子、DNA和RNA,帮助信用卡公司进行异常检测和欺诈分析以保护消费者,帮助法律团队进行法律释义和抄写等。
在未来的模型面前,或许现在我们看到的大模型只是蝼蚁。但我们可以期待,未来更加强大的语言模型将会更彻底改变人们的生活方式。
现在,我们可以看到越来越多的企业涌入AI的洪流,个体也不可避免地主动参与或者被席卷进去,我们永远不知道明天会发生什么。未来的另一个五年又会有多少大语言模型出现,谁又将冲在行业最前端呢?让我们拭目以待。
郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。