文:Jenny Xiao (肖文泉)、Jay Zhao
去年12月,ChatGPT火爆出圈,资本和科技界迅速开始讨论AIGC技术的潜力和前景。而中国和硅谷很快成为了这场讨论的中心。
AIGC在硅谷持续升温,众多顶级VC纷纷发布相关行研。2022年9月,红杉资本发布了一篇叫做《生成式AI:一个创造性的新世界》的文章,指出AIGC应用将在未来几年大量落地,AI生成的文字、图片、视频将逐渐走入人们的生活。
今年春节刚过,腾讯研究院又推出《AIGC发展趋势报告2023:迎接人工智能的下一个时代》,预测未来五年10%-30%的互联网图像将由AI生成,AIGC市场到2030年可能达到1100亿美元的规模。
不少业内人士认为中国的AIGC产业处于发展的初期,底层技术和应用层面和国外还有较大的差距。虽然国内众多厂商开始布局AIGC,但是目前的商业模式还不成熟。技术层面的不足也限制了应用端的发展。
但事实上,中国是美国市场之外唯一一个拥有完整的AIGC产业链的国家。中国的AIGC产业很可能发展出和硅谷完全不一样的生态系统。
今天,我们就带大家来深入解析对比中国和硅谷的AIGC赛道,看看国内的AIGC行业和国外到底有什么区别,未来又会有什么样的发展趋势。
当全世界把目光放到了ChatGPT上时,中国的AIGC模型也正在飞速发展。
从AIGC模型数量上来看,全世界前十的AIGC模型研发者中,中国机构占了四个。其中有学院派的BAAI智源研究院和清华大学,也有产业界的百度和阿里巴巴研究院。顶级的西方AI机构谷歌、Meta还有OpenAI当然也榜上有名。值得一提的是,除了英美之外,虽然以色列有AI21,加拿大有Cohere,只有中国有多家机构在研发AI模型。
微众银行马智涛:数字世界和实体世界深度融合的三个可探索方向:金色财经报道,2月24日,微众银行副行长兼首席信息官马智涛在“2022产业区块链年度峰会暨FISCO BCOS五周年生态大会”表示,在数字世界与实体世界深度融合上,行业目前仍面临现实瓶颈。而基于区块链技术打造的元宇宙平台,能够将各产业分散的数字化应用从“点”整合成“面”,为更全面的数字化提供了实现基础。
在会上,马智涛分享了行业在构建数字孪生体、营造数实交融的服务场景、助力数据资产化和资产数字化以释放数据要素价值等三个探索方向。他认为,这三个探索方向,在元宇宙这个领域非常值得去深挖,其中区块链的技术扮演着一个非常重要的支撑的角色。[2023/2/27 12:30:54]
中国企业近几年在自主研发上下的功夫也为AIGC产业打下了基础。比如,百度的飞桨PaddlePaddle和华为MindSpore开源框架。这些框架和国外常用框架(比如TensorFlow和PyTorch)的不兼容可能会限制国产框架的发展,但是例如Ivy这样的框架转换器或许能成为中西方AI框架的桥梁。
在社区层面,在2013年开发出来的Gitee成为了号称“中国GitHub”的开源技术社区。如今,很多大模型都在Gitee上开源,比如中科院的紫东太初大模型。Gitee社区也吸引到了超过800万开发者用户。可见Gitee社区和国产框架都成为了中国AIGC发展不可或缺的软件设施。
在硬件层面,国产的芯片也称为了训练AIGC模型的常见之选。在训练2000亿参数的超大盘古模型的过程中,来自华为的团队调用了超过2000块华为昇腾910芯片。而2600亿参数的百度ERNIE 3.0 Titan还有千亿参数紫东太初模型也是在华为昇腾系列的芯片上训练出来的。
南京江北新区管委会副主任:新区逐步实现区块链与实体经济深度融合:南京江北新区管委会副主任陈潺嵋表示,截至目前,新区共有区块链企业近50家,约占南京市四分之一,主要集聚在金融、医疗健康服务、公共服务和企业服务等方面,逐步实现区块链与实体经济的深度融合,区块链产业生态正在显现。(南京晨报)[2020/6/19]
AIGC模型十大开发机构
从预训练语言模型的参数量来看,很多中国的模型其实并不比西方逊色。但是站在用户体验的角度,ChatGPT确实要领先于中国的语言模型,还有西方其他公司的模型。中国的开发者总能够赶上西方的领头羊,但是这个技术追赶的过程却需要2-3年。比如,OpenAI在2020年6月推出GPT-3模型,中国的智源、华为、百度在差不多一年之后才研发出了体量与之相当的模型,又用了一段时间才让模型的技能和GPT-3相媲美。
预训练语言模型参考量
在一定程度上,中国的AIGC底层技术也受益于西方的开源运动。在StabilityAI发布Stable Diffusion模型之后不久,国内的IDEA研究院封神榜团队很快就训练出了名为“太乙”的中文版Stable Diffusion。与原版的Stable Diffusion不同,太乙Stable Diffusion可以更好地理解中文的语言文化环境。
政策 | 中央印发《交通强国建设纲要》 要求推动区块链等新技术与交通行业深度融合:近日,中共中央、国务院印发了《交通强国建设纲要》,纲要提出,从2021年开始,到本世纪中叶,分两个阶段推进交通强国建设。纲要还提出将大力发展智慧交通,推动交通发展由依靠传统要素驱动向更加注重创新驱动转变。
据了解,《交通强国建设纲要》是交通领域近年来规格最高的顶层设计,而其中最大的亮点在于从中长期两个维度规划大力发展智慧交通,要求推动大数据、互联网、人工智能、区块链、超级计算等新技术与交通行业深度融合。构建综合交通大数据中心体系,深化交通公共服务和电子政务发展;构建适应交通高质量发展的标准体系,加强重点领域标准有效供给。[2019/9/25]
在之前的一篇文章里,我们分析过美国的AIGC产业,提到了希望很多AIGC垂直领域已经杀成了一片红海。比如,文案编辑和市场营销领域的文字生成类产品已经有数十家创业公司在做了。图像生成类的产品在Stable Diffusion和DALLE-2出现之后也迅速开始卷了起来。
然而,中国的AIGC产业大多还是一片蓝海。两张市场地图对比不难看出中国的AIGC公司要比西方少得多,有些领域甚至还没有出现很多初创公司。
中国的AIGC市场地图
声音 | 全国人大财经委副主任委员贺铿:区块链等数字技术与制造业、服务业深度融合:据中国经济导报报道,第十一届全国人大财经委副主任委员贺铿在“高质量发展引领中国经济新征程”主题年会上表示,数字经济就是人工智能、互联网、IT的升级版,包括大数据、云计算、区块链等,这些数字技术与制造业、服务业深度融合。[2019/1/25]
西方的AIGC产业是不是比国内要拥挤很多?
这一方面是由于中国的底层技术要比美国落后几年,还不足以支持商业化落地。就在几年前,李开复老师在《AI Superpowers》一书里指出,中国虽然在AI技术层面不及美国,但是在应用端却走在了美国的前面。或许这一说法适用于预测型AI(“predictive AI”,比如人脸识别、推荐算法)的时代,但是在生成型AI(“generative AI”)的时代,应用和底层技术结合得更紧密,中国在应用方面也可能要追赶美国的步伐。
中国在应用层的滞后也是由国内B2B产业的特性决定的。西方的文字和图像生成类产品主要都是面向2B的市场的,而中国的B2B市场要比西方小很多,中国企业往往不愿意在软件上花钱,而更愿意去购买服务。这就极大地降低了初创公司想要进入2B类文字、图像生成SaaS赛道的意愿。我们未来在国内可能看到企业打着卖服务的旗号卖软件--用户的体验和买服务无异,而后端的服务却是由AI软件提供的。
另外,与美国横向SaaS模式不同,中国的AIGC的SaaS很有可能会采取纵向的发展模式。这种模式的特点在于,聚焦于特定的应用领域,比如电商、短视频、金融,而不是追求产品的通用化。这种发展模式弥补了中国在模型通用能力上的不足,也利用了在垂直领域积累的大量的专业数据。
中国软实力宣布将与TenYun项目展开深度合作:2018年1月11日,TenYun项目在香港启动其全球路演的首站,并开始平台原生代币TYC(TenYun Coin)的首发私募活动。香港上市公司中国软实力也宣布将与TenYun项目结缘,共同就研发区块链技术及探索区块链技术在金融业的应用上展开深度合作,与TenYun项目发起方——CTOP Blockchain Technology Inc签署战略合作框架协议。根据路演首站透露出的信息,TenYun项目由金融及区块链领域的团队共同打造,该项目采取完善的实名制区块链技术,打造了TENYUN Blockchain作为底层协议技术的框架,建立起与全球实体机构和数字资产交易机构的合作模式。[2018/1/12]
中国市场的独特性也决定了中国会发展出和西方不一样的AIGC生态系统和不一样的垂直应用。
这意味着中国的AIGC应用虽然比美国慢了一步,但是简单粗暴的“复制到中国”(“copy-to-China”)模式并行不通。还是拿文字生成领域来讲,中国高质量的数据集少、市场营销以视频形式为主、企业不愿意在软件上花钱,这就意味着类似于美国的Jasper.ai和copy.ai这样的文字生成的通用SaaS,在中国就很难获得很大的2B市场。
中国文字生成产品主要在做2C的业务,并且业务的性质也和美国很不一样。学术类写作、英文写作还有翻译成了中国文字类AIGC产品的重点。众多产品都提供这种服务,比如火龙果写作、秘塔科技还有写作狐。
在2B领域,中国的初创公司选择了专攻垂直领域,而不是追究产品的通用性。一个典型的例子就是澜舟科技。在研发出了孟子大模型之后,澜舟科技并没有继续追求模型的通用性,而是专攻金融领域的NLP分析服务。
中国的AIGC的另一个独特之处就是在AI视频领域有着比较强的竞争力。特别是虚拟人和短视频方面,中国的公司更加懂得结合实用性和娱乐性,而西方的公司的产品往往只有实用性。
我们就拿中国的小冰和英国的Synthethia虚拟人公司来做个对比。Synthethia做出来的虚拟人跟普通公司白领无异,而小冰生成的万科虚拟员工崔筱盼却长着一副明星脸。
中国的虚拟人产业近几年逐渐人们的视野。不论是清华大学首位虚拟学生“华智冰”,还是冬奥会上谷爱凌的虚拟分身,每次虚拟人的亮相都能够引起舆论关注。比起专注于2B赛道的西方公司,中国的AIGC公司因为要做2C的业务,所以特别懂得吸睛引流。
咪咕的谷爱凌虚拟人分身在2022年冬奥会上首秀
虽然目这个产业的商业模式还不成熟,但是技术上一旦有了突破,中国公司的市场营销能力将成为其强大的国际竞争力。
但与此同时,中国在AIGC开发工具领域的初创公司甚少,比如在AI代码生成,还有零代码、少代码的工具领域基本上没有什么创业公司。这可能是因为开发工具领域语言、文化隔阂小、政策约束少,像GitHub这样的西方公司可以比较容易进入中国市场。而中国企业在B2B、B2D产品制作能力上的不足也让中国的开发工具产品很难和西方大厂竞争。
说了这么多,我们在最后想对中国的AIGC产业做出三大预测,供大家参考。
一是,中国会重点发展AIGC的底层技术,形成自主的模型和基础设施。近些年美国政府对华的一系列科技制裁,让国内的各大公司担忧自己哪一天会不会也成为美国的打击对象。想要维持AIGC领域的发展,中国的企业和学术研究院必须要投入更多的研发费用,投入到真正的核心技术研发上,形成独立的产业链。
二是,由于中国国内市场的局限性,出海是很多2B的AIGC企业的必然之选。在AIGC领域,已经有一些初创公司打造出了国际化的企业形象,进入了东南亚、欧洲、北美等海外市场。AI语音助手创业公司赛舵科技研发出了多语种的AI语音生成系统,涵盖了超过20种东南亚语言和方言。而高领资本和GGV投的AI模特公司ZMO.ai在中国成立,相继在美国和加拿大成立了办公室,打入北美市场。
ZMO.ai生成的AI模特
三是,政策监管和法律伦理问题将成为AIGC发展的一个重要挑战。去年12月,国家互联网办公室发布《互联网信息服务深度合成管理规定》,进一步规范AIGC产出的文字、图像和视频内容,规范了个人信息在深度合成中的应用。此前,不少AIGC公司都陷入了侵犯产权、个人信息和产出虚假内容的尴尬境地,包括OpenAI的代码生成软件Codex也因为抄袭GitHub开发者的代码而被告上法庭。如何能在发展技术的同时,遵守法律法规、伦理原则,成为AIGC企业面对的一大难题。
硅谷之外,中国的AIGC产业已经开始崛起。不论是从技术发展还是投资创业的角度来看,中国的AIGC产业相当活跃。中国的AIGC公司面临着和西方公司同样的挑战,比如寻找成熟的商业模式、发展下一代AIGC技术,还有遵循法规伦理。与此同时,中国的AIGC也要面对额外的压力,比如美国政策的打击还有技术层面的不足。
跟互联网和移动手机时代一样,中国的AIGC生态必定和西方不一样。当美国的AIGC公司重点发展B2B业务的同时,中国公司很有可能会首先进入电商、物流还有大消费市场,并且很有可能在国际市场上和西方企业一争高下。
中国的AIGC还处于萌芽期。未来,AIGC产业必将改变我们的生活,中国企业也一定能够加入这股浪潮。
注:本文作者为硅谷Leonis Capital风险投资基金Jenny Xiao (肖文泉) 和Jay Zhao
36氪
媒体专栏
阅读更多
金色早8点
金色财经
Odaily星球日报
欧科云链
Arcane Labs
深潮TechFlow
MarsBit
澎湃新闻
BTCStudy
链得得
郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。