当前位置:首页 行业动态 正文

数据为王的垂直大模型将迎来白炽化竞争

2023-05-24

大部分人都不看好创业公司的通用模式,远望资本的创始人程浩曾在公开场合表示,大企业的流量和资金肯定要比创业公司多得多,更重要的是,大企业的核心优势就是场景化,无论是百度的问答、搜索、腾讯的微信,还是阿里的天猫精灵,都有成熟的场景化。

 

由于通用型大模型的机会并不多,很多创业公司都将目光投向了垂直型大模型。

 

目前,通用大数据的数据来自于公开的网络,但网络数据与世界范围内的数据不同,尤其是垂直领域,还有大量的私人数据。

 

而那些专注于垂直领域的初创企业,积累了大量的数据与知识,拥有核心优势。范特科技首席技术官郭长柱认为,大数据模型对于大厂来说,是一种不能同时兼顾的选择,“大厂想要构建一个生态系统,需要大量的企业接入它的大数据模型,并以它的大数据为基础,为其他行业提供帮助,如果大厂在这个时候插手,那就不符合大厂的身份了,所以他们不会轻易这么做。”

 

如果说互联网时代的每一个行业,都值得利用互联网重新做一遍的话,那么大模型时代的每一个行业,也是如此。

 

这让投资人们都很激动,在2022年11月的奇绩创新论坛上,陆奇投资了五十五个项目,其中十六个都是在 ChatGPT还没发布的时候,就被他投了进去。

 

今年的前4个月,国内人工智能行业已经完成了243笔融资。面对越来越火热的市场,创业者们纷纷使出浑身解数,想要抓住这一次机会。

 

对于初创企业来说,训练大型模型的成本降低,只是一张门票而已。对于纵向大模型来说,其核心与关键在于计算能力、算法与数据。

 

从某种意义上来说,用钱可以买到算法,但用钱买不到数据,尤其是一些垂直行业,很多数据都是私密的,用钱买不到也没什么意义。

 

这是一种天然的优势。

 

蔡志森对猎云网说,“三维家”已经拥有了全国范围内的二千八百万套户型数据,八千一百万套软硬装、家俱、家用电器、材料、装饰材料的素材库,十六亿三千万套风格多样的设计方案库,另外,三维家还拥有一套真正的定制柜体数据库,拥有数千万套参数数据。”

 

同时,随着用户的不断使用,这些数据也会自动生成,以三维家为导向。

 

与三维家一样,极睿科技也是一家专注于电商内容的公司,每年都会产生几百万甚至上千万条的电商内容。

 

除了数据壁垒之外,明确应用场景,掌握垂直大模型落地的全过程,也是其核心竞争力。

 

在实践中,大型模型提供了基本的功能,而具体的业务则包含了多种功能。

 

郭长柱认为,当前以大模型为基础的“模型即服务(MaaS)”是一种创新模式,也就是将大模型作为基本能力对外标准输出,实现对用户需求的端到端解决。但很少有人能直接用大模型来解决这个问题,尤其是在 CV领域,他们一般都是在基础能力的基础上进行定制。

 

“比如,用大模型对垂直领域中的小模型进行自动标注,用大模型中更通用的特征进行二次开发,比如 VQA,检测,分割,识别等。此外,一些业务还可能涉及到多个大型模型功能的集成,甚至需要多模态的语言与视觉特征匹配。这就需要在实际业务中支持多个大模型的定制业务流程,实现大模型的自由组合与深度定制。”

 

OpenCSG还在实践中积累了大量将大模型落地到通用行业的实践经验,包括垂直行业语料生成、大模型调整、业务融合等。

 

尽管大型模型看起来“很香”,但是我们都知道,在过去,大型模型的一次投资是非常昂贵的。此前市场上有消息称,GPT3单次训练成本高达四百万美金,所以很多人认为,训练大型模型的门槛至少是几千万美金。

 

但对于垂直行业来说,一味地追求“大”是毫无意义的, OpenCSG的创始人兼 CEO陈冉将大模型比喻为“玉”,“如何运用大模型的能力,可以说是雕琢这块玉石,才是最重要的。”

 

郭长柱还提到,大型模型的评判标准,不能从参数尺度上去概括,核心是看它是否具有“涌现”的能力,也就是它的精确度能否达到一个突飞猛进的程度。“而在垂直领域,一个普通的大型模型,需要数十亿的参数,而一个垂直的大型模型,需要数十亿的数据。”

 

再加上各种开源模型的出现,原本用来训练模型的“门票”,已经变成了用一百万块钱买来的。

 

不过对于初创企业来说,这也是一笔不小的开销,所以降低成本,提高效率,就成了他们的第一个目标。

 

最大限度地利用了最优的投入产出比,采取了弹性的计算环境,使前期的零星探索任务能够按量算完成。有了明确的方向,就可以转换成定期的训练了。

 

而极睿科技与清华大学人工智能研究院的合作,更是从学术团队的角度,提供了最大程度的运力支持,实现了投入产出比的优化。