百亿美金的渠道扳手腕,云数据的生成式AI之争

2023-08-01|来源:远大期货

这两家云数据巨子如安在人工智能范畴打开剧烈比赛?

文章源自| Aspiring for Intelligence

SnowflakeDatabricks一向是数据库范畴重视度十分高的两家公司,虽然同在一个地盘,但各有特色,比赛一向没有摆到台面上。而这一次的生成式AI浪潮,两家公司十分活跃的经过收买布局,Snowflake完成了对Neeva(企业级AI查找引擎)的收买,Databricks 13亿美金收买MosaicML(ML模型布置),并低沉宣告对OmniML(模型紧缩)的收买。两家一改一向以来外表友善、暗里较劲的态势,挑选同一天举行公司最重要的年会,亮明自家的生成式AI布局,野心藏不住了。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

Snowflake 2020年上市,现在市值579.2亿美金(2023.8.1),Databricks还未上市,依据上一轮融资,其估值已到达380亿美金。在生成式AI的加持下,Databricks的估值/未来上市市值能否追上Snowflake?Snowflake又能否更上一层楼?‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

作为出资了Snowflake的基金Madrona的合伙人Vivek和出资人Sabrina同享了他们对两家公司在生成式AI范畴扳手腕的观念,以下,Enjoy。‍‍‍‍‍‍‍

上星期对数据和人工智能范畴从业者来说是重要的一周,两个最重要的参与者——DatabricksSnowflake——分别在旧金山和拉斯维加斯举行了他们的年度会议(Databricks的Data and AI Summit和Snowflake的Summit)。这两个巨子决定在同一周举行他们的重要活动,这大概率不是偶然。在曩昔十年中,Snowflake和Databricks一向是朋友也是对手,但这一周显着标明,它们现在是互相的首要比赛对手,而新的战场便是人工智能。

毫不奇怪的是,两个会议上的评论和宣告大部分都环绕生成式人工智能。所传达的重要信息是,为了树立生成式人工智能战略,每家公司都必须从数据战略开端。果然如此,Databricks和Snowflake都为自己为什么能够在这一旅程中为客户供给*支撑进行了证明。

两家公司从价值链的不同部分开端,从前乃至是战略协作伙伴联系,为安在这个人工智能的新时代演变为如此剧烈的比赛对手呢?

让咱们深入探讨。

【快速免责声明:Madrona曾出资Snowflake的C轮,并仍持有该公司的一些股份。】

硅兔编辑部翻译

01

Snowflake:从数据仓库到数据云

Snowflake由Benoît DagevilleThierry Cruanes于2012年创立。他们是两位在Oracle作业多年的数据库专家,他们敏锐地观察到大多数数据仓库“固化、贵重且难以运用”。Dageville和Cruanes与Vectorwise的前首席执行官Marcin Zukowski协作,构建了根据三个要害条件的未来数据仓库:

1)彻底根据云的架构;

2)将核算与存储别离,完成近乎无限扩展;

3)在核算资源运用上具有弹性,然后完成查询处理和灵活性方面的史无前例的速度。

现在,Snowflake现已从“只是”一个云数据仓库开展成为一个“数据云”,为客户供给拜访、构建、协作和变现其数据的单一渠道。仅用十多年时刻,Snowflake已开展成为市值550亿美元的上市公司,为6000多家客户和许多《财富》500强企业供给服务。Snowflake已与首要超大规模云服务供给商(Azure、AWS和GCP)并肩作战,现在他们清晰将目光投向人工智能范畴以赢得更多重视。

为了完成这一方针,他们在人工智能和机器学习范畴进行了一系列收买和产品推出,包含:

1)Snowpark答应数据科学家运用其*编程言语进行端到端的机器学习作业负载开发、布置和编列。经过Snowpark,客户能够吸取、剖析和转化其数据,以练习机器学习模型和运转更多的猜测性剖析。

2)Streamlit是一个数据驱动的运用程序构建东西,Snowflake于2022年3月以8亿美元收买。Streamlit使客户能够仅经过几行代码开发数据密集型运用程序。Streamlit简化了经过前端Web运用程序对数据剖析使命和机器学习模型输出进行上下文明的进程。

3)Neeva是Snowflake本年早些时候收买的公司,旨在加快企业与数据的交互和查找,特别是以更具对话性的办法进行。

02

Databricks: 构建Lakehouse

Databricks成立于2013年,仅比Snowflake晚一年。与Benoit和Theirry是职业从业者不同,Databricks是由一群与学术界和开源社区有着深沉根由的人士创立的。包含现任CEOAli Ghodsi在内的七位创始人是UC Berkeley的AMPLab研究员,他们构思了Apache Spark,这是一个用于大规模数据处理的开源一致剖析引擎。Spark现已开展成为*且最常用的数据处理结构之一,在大规模数据工程、数据科学和机器学习方面起着重要作用。

Databricks开端的方针是商业化Spark,推出了企业级的Spark版别,供给了大型安排所需的一切功用(管理、支撑、保管等)。Databricks随后开展成为立异的“Lakehouse渠道”,一致了数据、剖析和人工智能。一致的Lakehouse概念将“集成、存储、处理、管理、同享、剖析和人工智能”融合在一个渠道上。

在曩昔的十年中,Databricks已成为全球估值最高的私家公司之一,2021年估值到达380亿美元,并于近期完成了10亿美元的收入里程碑。他们为不计其数的企业客户和开源用户供给服务,并被视为最受注目的IPO之一。在一切这些增加中,他们越来越将自己定位为人工智能范畴的*,并最近进行了重要的收买和产品发布,包含以13亿美元收买MosaicML(下文将更具体介绍),并开源了Dolly,这是一种以低于30美元的本钱练习的指令调优LLM。

03

AI中的磕碰

Snowflake和Databricks都有杰出的生态位,能够持续运用长时间的结构性趋势,由于企业正在为生成式人工智能的改变做准备。跟着生成式人工智能运用的广泛运用,这两家公司都企图将自己定位为战略性的多产品数据渠道。以下是各自会议中的一些重要公告以及咱们对每家公司全体人工智能战略的观念。

Snowflake首要公告:

开发者公告

1)Snowflake的原生运用结构:经过答应开发人员创立、分发和变现运用程序,以新的办法运用数据,可根据Snowflake的数据云扩展。

2)Snowpark容器服务:扩展数据可编程性和核算根底架构,以支撑编程言语、拜访第三方软件,并为保管全栈运用程序和LLM供给增强的安全性和管理。经过泛化Snowflake的核算渠道,供给进一步的灵活性,使客户能够从底层(数据层)一向到UI层运转完好的端到端运用程序。

3)其他重要公告:Snowpipe流式处理功用;动态表格(也称为资料化表格);Document AI(一项新服务,用于提取文档中的非结构化数据);以及Iceberg Tables。

协作伙伴公告

Snowflake宣告NVIDIAMicrosoftWeights & Biases等几个重要协作伙伴。

1)与NVIDIA的协作方案将其NeMo企业开发结构嵌入到Snowflake的数据云中,这将使Snowflake的客户能够构建和布置LLMs和根据人工智能的运用程序,运用存储在Snowflake中的专有数据。

2)与Microsoft的协作将扩展与Azure的协作伙伴联系,重点是环绕Microsoft Azure的OpenAI和Azure AI/ML服务进行新产品整合。该协作有可能将作业负载和客户引进数据云。

3)与Weights & Biases这家*的MLOps渠道的协作,Snowflake的容器服务使Weights & Biases能够加快在Snowflake数据云中进行ML模型、LLMs和LLM驱动运用的迭代开发。终究,这项协作将协助企业和用户更轻松地构建和运用生成式人工智能。

4)除了这两家公司,Snowflake还宣告了与Alteryx、Hex、Dataiku、RelationalAI、Pinecone等公司的许多其他协作伙伴联系。

咱们的观念

直到最近,Snowflake没有泄漏任安在现有才能上增加生成式人工智能的方案,许多出资者对Snowflake在这个范畴(特别是与Databricks比较)的比赛才能标明忧虑。但是,在2023年的峰会上,Snowflake展现了一个强壮的愿景,将自己定位为可信任的数据云供给商,并以此打造了一个与生成式人工智能相关的强壮故事。

Snowflake与Nvidia的协作,以及Snowpark容器服务的宣告,使他们在AI数据仓库中成为一个更具可行性的参与者。他们想传达的中心观念是,他们能够让客户在Snowflake数据云中安全地拜访、开发和布置LLMs和根据人工智能的运用程序,一起供给Nvidia GPU和AI软件的加快核算。

虽然他们的故事和传递的信息令人形象深入,但咱们以为他们在人工智能范畴相对于Databricks依然处于下风状况...

Databricks首要公告:

开发者公告

1)LakehouseIQ:根据LLM的自然言语接口,用于查找和查询数据,并强壮地了解客户的数据、内部行话和运用形式,以了解客户的架构、文档、查询、体系等。

2)LakehouseAI:Databricks在Databricks ML方面宣告了许多新功用,包含一些关于LLMOps的才能,例如整合数据、为机器学习准备数据集、微谐和策划机器学习模型,以及布置模型自身。Databricks还宣告了关于向量查找、特征服务和MLFlow Gateway的许多功用。

3)MosaicML:就在峰会开端之前,Databricks宣告以13亿美元收买MosaicML,该收买在峰会期间定位为“构建GenAI模型的机器”。

4)其他值得注意的公告:Delta Lake 3.0、MLFlow 2.5支撑不同后端LLMs、Lakehouse Apps和Databricks Lakehouse Monitoring智能监控。

咱们的观念

Databricks经过将数据、人工智能模型、监控和管理才能整合到Lakehouse渠道中,采取了一致的人工智能办法。因而,Databricks使客户能够更高效地开发他们的GenAI解决方案,而且客户以为Databricks是一个值得信任的协作伙伴,均匀而言,在机器学习开发方面更快速、更经济、更易于运用。

虽然Databricks现已被视为人工智能仓库中的要害参与者,但经过对模型(如Dolly,一个开源的指令跟从LLM)的出资以及对MosaicML的严重收买,Databricks在GenAI范畴稳固了其领导地位。Databricks持续着重他们的Lakehouse是GenAI草创企业练习和布置自己的人工智能模型的*办法,以本钱效益的办法运用自己的专有数据,而不受大型科技公司的捆绑。

04

展望未来,咱们能够等待什么呢?

虽然生成式人工智能的热潮现已持续了8个多月,但曩昔一周清晰标明,Snowflake和Databricks正在打开比赛,抢夺这个范畴的心智和商场份额。

那么,咱们能够对这种加重的比赛有哪些等待?

1.收买将持续进行→ Snowflake和Databricks都相对有杰出的生态位来持续收买与其全体战略相得益彰的小公司。Snowflake在其资产负债表上具有约40亿美元的现金,而Databricks则具有可用于买卖的高估值。一起,数百家AI和数据东西草创企业巴望在干旱的IPO商场找到出口。咱们不以为Neeva和MosaicML会是这些巨子最终一次收买,商场将呈现整合。

2.客户将获益→ 在Snowflake和Databricks之间逐步晋级的比赛中,最显着的赢家应该是他们的客户。这两家巨子正在快速为他们的渠道增加新颖的产品和服务,构建“一站式商铺”,供客户构建数据运用程序并运用LLMs。这种渠道增强将有助于民主化拜访人工智能,并让数据科学家、数据工程师和人工智能从业者能够更有意义地进行协作。

3.Azure和AWS将赚取更多的赢利→ 跟着Snowflake和Databricks持续在AI商场上进一步扩张,它们将需求很多的核算才能,首要由Azure和AWS供给。数据工程师Anant Packidurali敏锐地观察到这一点。与Nvidia在AI中获益相同,为Snowflake和Databricks的核算需求供给根底设施的超大规模云服务供给商不管谁在AI比赛中取胜,都将取得利益。

跟着企业对数据的依靠程度越来越高,以支撑其生成式人工智能战略,咱们信任Snowflake和Databricks都处于杰出的方位,能够运用这一代的改变。虽然它们来自价值链的不同部分,而且它们的联系在曩昔十年的开展中发生了改变,但它们现在正处于一场奖赏巨大的比赛中。

友情链接:      香港股票开户远大期货正大期货