原创研究 | AI 创业:团队决定命运?
爆米花独角兽
2024-09-05 15:23
订阅此专栏
收藏此文章
Builder: Ren,Ryan&Zenith

推特:@renkingeth


写在前面

本文是《AI算法分析94家海外AI独角兽》的姊妹篇,前文我们详细分析了94家独角兽企业的细分赛道,本篇将聚焦于团队分析,旨在为创业者和投资人提供指南,帮助找到可靠的对标基准(benchmark


VC 通常会关注公司或产品的对标(benchmark),因为对标的高度通常决定了项目的潜力。然而,除了赛道分析之外,团队的对标和标准参考同样重要,但这一方面却往往被忽视。本篇将借助机器学习模型的分析方法,对独角兽团队进行系统化的分析,从而提供一个更加全面的团队参考标准。


如果你是经济学或管理学的博士生,推荐阅读推理过程,它可以成为一个学术课题素材;如果你是时间有限的投资人和创业者,可以直接跳到文末查看结论和深度吐槽。大家也可以对 VC 或者创业分别祛魅一下。



Figure I: AI Unicorn Mapping By VC Popcorn






01

团队 Team

我们把 94 家独角兽企业的团队打了 6 类标签,然后又把 6 类标签合并为 2 个分类,分为 CEO brand 和 Team grade 两个部分,互相关联:

CEO brand指的是这个创业者最鲜为人知,或者对 VC 而言最能代表他的品牌标签;如果有一个 CEO 有多个品牌标签,我们会选择最突出,或者代表他最高成就的品牌标签,例如 Sam altman 有很多标签,在 AI 领域,我们把他叫做明星创业者,即 Star。李飞飞既是大学教授,又是谷歌云 AI 首席科学家,我们则定义他为大厂 C(科技大厂 C level)。

● Team grade则是看这一个创业公司创业时期的团队组成,我们为每一个创业团队的成员都打了标签(后面加入的高管排除在外),每一个标签赋予了不同的分数权重,然后对每一个创业公司进行了打分。分数越低,代表团队级别越高,1 分为最高级别。换句话说,CEO brand 是个人标签,team grade 则是集体标签。


【1】CEO brand 介绍

每一个企业只有一个 CEO brand 标签,一共 14 种标签:

Star(明星):这一类别的 CEO 通常是知名或杰出人物,往往在媒体上有显著的曝光率或公众认可度。他们在科技或商业领域可能具有类似明星的地位。

例如 Sam Altman,一系列 Transformer 作者和 Open AI 的 coufounder 等。

所对应企业:Anthropic, OpenAI, Cohere, Tenstorrent, Adept, Covariant, Character.AI


 big tech C(大科技公司 C 级高管):指那些曾在大型科技公司(如谷歌、微软或亚马逊)担任 C 级高管,例如 CEO、CTO、COO。他们从顶级科技公司带来了广泛的领导经验。

例如,Chris Walker 在创办 Untether AI 之前,曾在英特尔担任企业副总裁和总经理;Amit Bendov 在创立 Gong.io 之前,曾在 Sisense 担任 CEO 等。

所对应企业:Inflection AI, SandboxAQ, Typeface, Gong.io, Xai, Untether AI, SiliconBox, Xaira Therapeutics, World Labs


 Unicorn Cofounder(独角兽公司联合创始人):包括那些曾共同创立过独角兽公司(估值达到 10 亿美元或以上)的创始人。他们在将企业发展到显著估值方面有着丰富的经验。

例如,AI21 Labs 的创始人 Amnon Shashua 是 Mobileye 的总裁兼首席执行官;Arvind Jain,在创立 Glean 之前,联合创立了云数据管理公司 Rubrik(RBRK),当前市值 56 亿美元。这些创业者都极其成功,而且也不是仅仅沾边的 10 亿美元独角兽 founder,但是又和 Google 等企业体量存在巨大差距,我们定义他们为 Unicorn Cofounder。

所对应企业:Lemonade, Graphcore, Stability AI, G42, Augment AI, Harness, Glean,Eightfold, Krutrim, AI21 Labs, d-Matrix, TempUSA, K Health, Quantinuum, Figure


● Serial Entrepreneur(连续创业者):指那些创立过多家公司的个人,通常具有成功退出的历史。这些创业者在创办和扩展业务方面有着丰富的经验,但是他们未达到独角兽高度,但是大多也有大厂经历或者藤校经历。

所对应企业:Together AI, Midjourney, Core Scientific, Cognition AI, Builder.ai, ShieldAI, Verbit, OpenSpace.ai, Jasper.ai, Advance Intelligence Group, NotCo, AlephAlpha, Metropolis, Flock Safety, Cerebras Systems, KoBold Metals, Weight &Biases, Wiz, Glance


● Scientist(科学家):指那些拥有强大科学或研究背景的 CEO,通常拥有计算机科学、生物学或物理学等领域的高级学位。他们通常是各自领域的领军人物,以技术专长而著称。

所对应企业:Mistral AI, Xanadu, Anyscale, Sakana AI, Lightmatter, Ayar Labs, MammothBiosciences, Cera, Owkin, Skild AI


● Big tech Senior(大科技公司高级职位):指在大型科技公司担任高级职位的管理人员,虽然可能没有担任 C 级角色,但他们通常负责管理大型团队或重要部门,具有重要的领导责任。

所对应企业:Perplexity AI, Monte Carlo, Cresta, SeekOut, SambaNova Systems, Groq,ConcertAI


● Researcher(研究员):指那些在学术或企业研究领域有着丰富职业经历的 CEO,他们通常都有 phd 学位。其实在 Star,Unicorn Cofounder,Serial Entrepreneur 和 Scientist 里也有很多研究院类型的创业者,但是我们只取了他们最突出的特点,而不是按照每一个特点都进行标签。

所对应企业:Snorkel AI, Viz, AMP Robotics


 Big tech Junior(大科技公司初中级职位):指那些曾在大型科技公司担任初级职位的人士。通常学历也是藤校,然后在大厂工作了 2-3 年。

所对应企业:Imbue, Relativity Space, ElevenLabs, Replit, Scale AI, Abnormal Security,Harvey


● Ivy grad(常春藤盟校毕业生):指那些毕业于常春藤盟校(如哈佛、耶鲁、普林斯顿)的 CEO。主要指的是刚毕业的藤校毕业生以及辍学生,他们没有其他工作经历。

所对应企业:Runway, Spring Health, EliseAI


 Grassroots(草根):指那些从基层起步的 CEO,没有学历,和大厂经历的创业者。在创业初期也没有得到一线 VC 的支持。

所对应企业:Hugging Face, Notion, Synthesia, Vercel, Paradox,GeneDx, Shiprocket


● The Military(军人背景):指那些拥有军方背景的 CEO,带有特定资源。

所对应企业:Helsing, Hailo Technologies, Salt Security


 Banker(银行家):指那些来自银行或投行行业背景的 CEO。他们通常在金融、投资和资本市场方面有丰富的经验。

所对应企业:CoreWeave, Pagaya


 VC(风险投资人):指那些拥有风险投资背景的 CEO,可能是前风险投资人,或者具有与风险投资公司合作的丰富经验。他们对创业公司融资和扩展的动态有深刻理解。

所对应企业:Fractal Analytics


 Serial Entrepreneur, grassroots(连续创业者、草根):这是一个混合类别,结合了“连续创业者”和“草根”的特点,指的是既没有学历,也没有大厂经历的创业者,他们曾经创办过中等级别的公司,并且成功退出;这个案例其实只有一个。

所对应企业:Bright Machines


 Figure 1:不同 CEO brand 的数量


Table 1:不同 CEO brand 的数量


从 Figure1 和 Table1 可以看出,AI 独角兽的 CEO 主要集中在 Serial Entrepreneur、Unicorn Cofounder;Scientist 和 Big tech C 则为数量第二多的类别。背景最亮眼的Unicorn CofounderScientist, Star和 Big tech C 四个加起来,就占比 43%。而纯草根占比只有 7%。

[2]CEO 品牌与团队评级的关系

Figure 2:不同 CEO brand 的平均团队级别

 如 Figure2,可以观察到不同团队分数(team grade)和 CEO brand 有肉眼可见的规律。似乎 CEO brand 越响亮,团队分数越高。于是,如下图 Figure 3,我们操作了一个方差分析去判断这个规律是否真的存在,测试结果显示,p 值为 2.05 * 10^{-32},小于 0.05,这意味着这个规律是真的存在的,CEO 的背景是影响团队整体质量或实力的重要因素,CEO 品牌上限决定了创业公司初期的人才密度和高度。


Figure 3:团队级别与 CEO 品牌的方差分析


【3】CEO 品牌与融资额,估值的关系

Figure 4:CEO brand 的平均估值与平均融资额

 如 Figure 4 所示,CEO brand 的平均估值和融资额,按照规模进行排序,依然观察出每组不同,Star 的融资额和估值远远高于其他类别。于是我们决定使用 Tukey's HSD 模型来检测一下这些差异是否在统计学上显著,结果如 Figure 5 表示,

 Serial Entrepreneur 的融资能力显然强于 Scientist 和 Researcher(大学教授);Unicorn Cofounder 的融资能力显然强于 Researcher;

 除此之外,并无显著差异,也就是是 Star 与其他类别的差异是无效的。因此我们觉得有必要再进一步研究一下 Star 是否真的无效;我们又用了 Mann-Whitney U 来检查我们的结果,如 Figure 6 结果证明不同 CEO brand 之间无差异。我们认为是 1. 样本量太少;2.因为本身就都是独角兽企业,背景差异已经被拉平。


Figure 5:Tukey's HSD on CEO brand 的平均估值和融资额


Figure 6:Mann-Whitney U on CEO brand 的平均估值和融资额


【4】CEO 品牌与赛道 / 子赛道的关系

Figure II: AI Unicorn Mapping

Figure 7:每个 CEO brand 项目 x 赛道的数量


 如 Figure 15 所示,我们推测 CEO brand 对于选择创业赛道会有一种倾向性,即不同类型的 CEO 会选择不同赛道;因为赛道过于宏观,我们更想知道子赛道与 CEO brand 之间的关系。于是我们采用标准化残差(Standardized Residuals) 去确定 CEO brand 和 Sub-Category(子赛道)之间是否真的有显著关联。


Figure 8 :CEO brand 与子赛道的标准化残差分析

经过测试,我们发现一部分组合之间存在显著关联,如 Figure 8:

 Banker 与 Computing

 Banker 和 Finance

 Ivy grad 和 AIGC/Editing

 Ivy grad 和 Real Estate

 Researcher 和 Data management

 Researcher 和 Robot

 Big tech Junior 和 Devtools

 Big tech Junior 和 space

 VC 和 Enterprise

这些结果表明特定的 CEO 品牌在特定的子类别中有明显的偏好或优势,这些偏好可能与他们的职业背景、教育经历或行业经验密切相关。例如,Banker 去选择 fintech 领域创业;Ivy grad 选择了 real estate 和 Editing 工具这样技术门槛较低的领域;Researcher 则选择了数据管理软件和机器人相对有技术门槛的赛道。


02

Team Grade

【1】团队评级与数量的关系


Table 2:团队评级 x 公司 x 团队组合




Figure 9 :团队评级 x 公司数量



Figure 10 :团队评级组合比例



我们将背景相似度较大的团队级别分组后,发现级别较高的团队在数量上远超过级别低的团队。

【2】团队评级与融资额、估值的关系

Table 3:不同团队级别基本信息图


如 Table3,我们可以直观看到不同级别的团队融资额、估值、创办时间都有一些区别;各个级别的团队主要出现在 2016, 2017 和 2021 年,这和资本市场环境,以及 AI 技术发展都有关系。


Figure 11 :Team Grade 的平均融资额和平均估值

 从 Table 3 和 Figure11 数据中可以看到,Team Grade 较高的团队(即分数较低的团队)通常对应更高的融资额和估值。这表明团队质量越高,获得的融资额和估值可能也越高。于是我们做一个相关关系分析,去看一下进一步的结果。


Figure 12 :Team Grade 的平均融资额和平均估值相关关系分析

如 Figure 12 展示,相关性分析结果显示了 Team Grade 与融资额和估值之间的相关系数:

 Team Grade 与融资额的相关系数: -0.236

 Team Grade 与估值的相关系数: -0.215


结果解读:

• 相关系数为负值,表明 Team Grade 越高(即团队分数越低),融资额和估值越低。这符合我们预期,即团队质量越高(Team Grade 越低),融资额和估值越高。

• 不过,相关系数的绝对值不大(接近 0.2),说明这种关系虽然存在,但并不非常强。


Figure 13 :Team Grade 的平均融资额和平均估值回归关系分析






















在这个基础上,我们对数据进行了回归分析,试图找到每一个团队级别对融资和估值的影响系数是什么。融资额的回归分析结果显示了以下内容:


• 截距(const): 1637.66,这表示当 Team Grade 为 0 时的预期融资额。

• Team Grade 的系数: -250.60,这意味着每增加一个 Team Grade,融资额平均减少约 250.60 百万美元。

• t 值和 p 值: t 值为 -2.32,p 值为 0.022,表明 Team Grade 对融资额的影响在统计学上是显著的(p 值 < 0.05)。


估值的回归分析结果显示了以下内容:

 截距(const): 8367.14,这表示当 Team Grade 为 0 时的预期估值。

• Team Grade 的系数: -1260.57,这意味着每增加一个 Team Grade(降级),估值平均减少约 1260.57 百万美元。

• t 值和 p 值: t 值为 -2.11,p 值为 0.038,表明 Team Grade 对估值的影响在统计学上是显著的(p 值 < 0.05)。

结果解读:

 Team Grade 对估值也有显著的负向影响,说明团队评分越高(质量越低),估值越低。


总结:

• Team Grade 与融资额和估值之间存在显著的负相关关系,即团队质量越高,融资额和估值越高。

• 每降低一个团队等级(1 为最高,每增加一分),公司的融资额平均会减少约 2.51 亿美元,估值则平均降低约 12.61 亿美元

• 回归分析结果进一步确认了这一趋势,且这种关系在统计学上显著。


【3】团队评级与子赛道选择的关系

我们想看一下 team grade 和子赛道之间是否也有关联系,是否能得出不同的子赛道匹配不同级别的团队,于是我们对 team grade 和子赛道的关联度进一步做卡方检验,得到结果卡方统计量(Chi-square statistic): 148.37,p 值(p-value): 0.258。由于 p 值大于 0.05,整体来看,Team Grade 与子类别之间没有显著的统计学关联。然而,个别 Team Grade 与子类别之间可能仍存在显著的关联,这可以通过观察标准化残差来发现。

通过标准化残值我们发现,以下组合有显著正向关联,这还是说明部分团队组成和部分行业有特定的吸引力;例如等级 1 的团队喜欢创业大模型和社交方向(大模型相关);等级 5 和 6 则以垂直领域创业居多。

  • Team Grade 5 和 Data management:

  • Team Grade 5 和 Gov & Public affairs

  • Team Grade 5 和 Security:

  • Team Grade 6 和 Real Estate

  • Team Grade 1 和 Social

  • Team Grade 1 和 Fundation models



03

多维度分析

【1】全维度,多标签统计分析


我们把 AI 独角兽的所有大类标签一起做了一个统计分析,包括,创办时间,团队组成,CEO 品牌,团队评级,融资额,估值,国家,VC 机构,大厂投资等等,想去探究不同标签对估值和融资额的影响。结果发现,

如 Figure 14,成立年份 (founded) 也具有统计学上的显著性,成立年份越早的公司估值越低,成立越晚的公司估值越高。

其他变量如 团队评级、子类别、类别、国家、CEO 品牌 对估值的影响不显著。这个则推翻了我们先前的的结论,也就是他认为团队级别和品牌对估值等等没有影响。所以我们觉得有必要进一步研究一下。

Figure 14:Founded yr vs. Funding


【2】CEO Brand 在更大样本量下的分析

于是我们随机抽取了 800 个公司(非独角兽),然后去分析和计算不同 CEO brand 对估值或者融资额的影响。最后果然在更大的样本下,如 Table 4,我们发现了不同组之间都存在显著差异,而品牌属性更强的与品牌属性较弱的差异则更大。


Table 4:Selected T-test results


我们在想那么 CEO brand 之间的差异是否也有可能是不同 AI 赛道估值不同造成的结果呢?于是我们在同一组数据上进行了统计实验。如 Table 5,结果发现在 Category 里,只有 Infra 和其他组是有显著差异的。也就是 infra 的估值显然高于类别,其他类别之间则无差异。


Table 5:Selected T-test results


那么 Infra 的估值和融资额更高,会不会和 infra 里的 CEO 品牌更好或者 team grade 更高有关系呢?于是我们又做了一个这三者之间的相关关系分析。如 Figure 15,结果证明三者之间并无关联,换句话说,infra 的估值和融资额就是高,并不是因为团队背景好,所以估值高。证明 AI 投资也还是有赛道可以选。


Figure 15:M-W U Test results



04

结论与吐槽

 CEO 背景、团队等级、赛道影响:

  • 部分 CEO 背景对公司估值和融资有明确影响;

  • 团队等级对公司的估值和融资有很大的影响。每降低一个团队等级即增加一分(1 为等级最高),公司的融资额平均会减少约 2.51 亿美元,估值则平均降低约 12.61 亿美元。

  • 此外,只有"Infra"赛道对估值和融资有明显的影响,其他赛道则没有显著差异。


• AI 创业方向的选择:不同的团队在 AI 细分创业方向的选择上没有明显差异。


• 新兴 AI 企业的估值和融资趋势:近年来创办的 AI 公司,估值和融资额普遍更高。


因此,我们可以得出,


• 毫无疑问,在 AI 领域,投人远远大于投赛道投人是第一位的;细分赛道没那么重要。


• 而且我们的VC 们,创业公司们可以按图索骥,找一找自己的 portfolio 和自己的团队的 benchmark,属于什么 CEO brand,什么团队评分,可以评估一下自己公司的上限和成功率


• 事实上我们知道美创业团队背景差异巨大,一个中国的第一梯队创业者(大学教授 +4 亿美金成功退出连续创业者)在美国只是第三梯队。也就是说中国顶流团队要比美国顶流的公司少几乎 26 亿美元估值。


这里面还有几个有意思的点,


• 在传统互联网投资里,往往是越靠近 C 端的估值越高,CEO 背景也更多元化。2C 离钱近,离变现越近,估值越高。所以我们也看到了现在海内外最强的 AI 巨头都是由 2C 产品转化而来,例如 Google,国内的字节,阿里。


• 但是在AI 创业公司这里,如果我们把所有赛道都分析一遍会发现,他介于半导体和软件 software 之间,和 Web3 极其相像,都是底层基础设施的估值更高。换句话说,离钱越远,估值越高


为什么?


除了表面上的技术驱动以外,很大的核心是在 AI 和 web3 领域 2C 的创业方向太容易被证伪了:

• 首先,普通用户摸得到看得见,是个人就可以评头论足,bb 几句产品体验;人人都是“投资人”,我听过无数投资消费的 VC 跟我抱怨,自己的工作和散户没有区别;也就是说,产品好不好,VC 的评价没有权威性。


吐槽:2C 创业最难的就是找方向,大多数钱花在这里,就是看似有个大方向,做起来全是坑,所有钱花在找方向上;相对而言,如果 PMF 明确了,那就绞尽脑汁把 product 做好就可以了,所以并不是中国创业者喜欢 Copy to China,而是同等智商情况下,这么做省钱省力。所以国内的原创 idea,弥足珍贵,例如共享单车,人人都能想到,但是 idea 与执行还有一道鸿沟。


• 其次有客观指标,用户数据就成为判断项目的金标准,必须保持持续增长,一旦不增长,就很难融到下一轮了。


而 Infra 就不一样了,


第一,方向相对而言更好找,很多 infra 赛道和科研无异,正如杨振宁所说,科研比商业简单,科研是有规律的。


吐槽:这里面要在说一下中美计算机科研的不同,比方说近几年清华的计算机论文 publication 和 citation 数量基本上全球前二水平,但是为什么最有影响力的论文却还是 google 那几篇呢?因为论文 publication 和 citation 数量就是学术界评分的 pmf,这刷起来,国人团队又是第一。所以有 pmf 之前,是海外擅长的;一旦 pmf 确定了,国人团队往往后来者居上。商业创业,科研,都这样,这是中国特色。从这点上来说,只要美国那边搞定 AI 应用的 pmf,中国这边就能出爆款。


第二,Infra 技术门槛高,大多数人看不懂,大多数 VC 也看不懂,大多数学计算机的 VC 也看不懂,各种盲人摸象;因此也不并不以技术高低作为是否投资项目的标准,这为“吹泡泡”估值奠定了基础。那么我们不禁要问,VC 如何评估一个在 3-5 年内没有亮眼业务数据的技术项目呢?让我们看下面的两个小 case。


吐槽:Case 1:Sam altman, Elon musk 都不懂 AI 技术(硅谷工程师听过他们线下演讲的,都知道吧),Elon musk 甚至连原理都不太了解,看他和杨力坤的论战得出,此人连基本科研规则都不懂,和高晓松一个路数,主打把道听途说讲的身临其境,《硅谷》里的嘴炮哥,这种真的是硅谷创业奇才;说实话我现在不太相信他几句话解决了什么 tesla,spaceX 众多科学家解决不了的科研难题,这和孙正义 3 分钟投马云一样,就是一个公关小品文;但是,这不妨碍他们创造了 Open AI。


Case 2:李开复老师是真的懂 AI 原理的,他在微软主导和推动了统计学成为 NLP 主流,替代规则流派,极大发展了 NLP 在语音识别、机器翻译等领域的效果,可以说这个是大模型出现的前提。笔者有一大半本科同学硕士时期从神经学领域(基于统计学)转去机器学习专业就是受此影响。但是,他创办的零一万物(也很牛 b)技术会超过 Open AI 吗?


第三,Infra 经常迟迟不推出产品,久久不商业化;这就是为持久“吹泡泡”量身定制的,金融人士最爱。


吐槽:事实上多数 AI 企业商业化落地的那天就是死亡的那天,看看过去的自动驾驶,芯片领域的案例,比比皆是。在这一刻 web2,web3 VC 精神交汇了。中国 VC 在这里有时候很拧巴,一方面也想做那个“撑死胆大的”,一方面又担心政策变脸,不敢真的下注烧钱没完的项目,心里想的是寒武纪,但是又担心投的是柔宇科技;但是硅谷 VC 就知行合一了,他们投 web2,web3 都是一个路数,自己造势,自己抬轿子,没有技术壁垒也要造出一个资金壁垒,吃的准就 Netscape /coinbase 高位套现,吃不准就 Wework/Opensea。区别就是中国的泡泡靠揣测圣意,而硅谷泡泡却是自导自演。


写在后面

我们会分享各式文章,有诙谐的,也有严肃的报告,我们会继续分享独角兽相关的内容,包括中国篇,团队篇,机构篇,Web 3 AI 篇。

这期间,还有插科打诨,行业吐槽等等;总的来说,研究是手段,吐槽才是目的。

用脱口秀说说柯基犬(科技圈)的事儿

关注推特 @renkingeth,一起吐槽



原创研究: AI 算法分析 94 家海外 AI 独角兽


【免责声明】市场有风险,投资需谨慎。本文不构成投资建议,用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

爆米花独角兽
数据请求中
查看更多

推荐专栏

数据请求中
在 App 打开