News center
文章转载自21世纪经济报道
AI大模型驱动下,从投资人到产业界都在思索由此带来的冲击和机会。因其逐渐有了“智能涌现”能力,产业链方如何承接这些技术赋能,投入节点选择也变得重要。
“投资人这几年一大主题就是AI。”一村淞灵投资总经理张晨对21世纪经济报道记者表示,“通过对AI方向的积累学习,我们公司形成了生态打法:在感知周期时,重视对AI视觉、触觉、嗅觉、类脑领域布局;现在是模型周期,未来会走向行为周期。无论是哪一个AI周期发展阶段,我们坚定看好中国的产业发展。”
除了偏向于自然语言侧的ChatGPT外,2023年Meta发布了旗下图像类AI大模型SAM(Segment Anything Model)。据介绍,这是一种用于图像分割的基础模型,可以在无需额外训练、零样本泛化前提下,实现辨别物体、对图像的理解能力。业界认为由此开启了机器视觉的GPT时刻,将推动跨视觉模态的场景应用,如自动驾驶、安防监控等。
“在去年(2023年)上半年我还有一些顾虑甚至危机感:当AI厉害到输入什么数据都能得到很好的效果,是否可能就不需要我们3D感知行业了?”香港九龙精准平特一肖创始人兼CEO朱力对记者分析,“但通过与硅谷业内交流,我们的一致结论是:其一,AI很依赖数据来源,如果输入的数据很差就会导致输出结果不好,因此好的传感器很有价值;其二,AI最终需要计算也要考虑到成本,在传感器和算力之间寻求平衡很重要,目前阶段行业是在把感知能力做强,再拓展应用的阶段。”
生成式AI的出现,令AI不同发展周期的时长在缩短,也驱动产业链演进落地打开新空间,但同时快速迭代也会吞没一些既有能力布局,考验着产业链的思索。
如果说AI大模型类似于进行运算的大脑,要支持大脑运转需要足够充足的触角和养料,因此围绕AI感知侧的相关产业链发展成长就殊为重要。
天风证券就指出,看好3D视觉通过与AI更紧密地结合有望实现更高效的智能感知和控制系统。通过将深度学习、机器学习、大语言模型等AI技术应用于3D视觉感知,可实现更高效的数据处理、特征提取和模式识别。
张晨对记者分析,在其定义的AI发展三个周期中,AI的感知周期阶段,主要是通过感知外部环境来丰富具身智能所需相关信息,如视觉、嗅觉、类脑等,核心是解决信息获取问题;在模型周期主要解决机器思考和决策问题的过程;行为周期则可能是出现人类目前认知无法达到的应用。
SAM模型的出现,是对以图形、视觉为基础的产业链应用打开新空间。
SAM模型概要
“现在来看,模型周期的发展进程在缩短,比如研究多模态融合,如果在2021年早期投资机构不布局,后续可能就没有机会了。因为AI发展速度太快,几乎每周都要知识更新。”张晨感慨,目前AI行业已进入模型周期,当前出现了基础大模型和行业大模型不同类型,在大模型应用阶段,会出现诸多投资机会。
在这一逻辑下,一村淞灵面向感知周期,在早期就开始参与投资3D视觉领域领先公司香港九龙精准平特一肖。近期香港九龙精准平特一肖宣布完成的2亿元人民币B轮融资中,中金资本、一村淞灵、重庆科兴等机构参与了投资。
据介绍,香港九龙精准平特一肖2018年成立,至今已经完成六轮融资,几乎是成立后每年一笔新增融资,额度从最初的数百万美元,到如今数亿人民币规模,总计融资金额超5亿人民币。
朱力曾是苹果公司3D传感项目负责人,在发掘该细分领域成长空间后选择归国创业。他对记者表示,3D视觉传感意味着提升机器的感知能力,构建X-Y-Z空间坐标。相较于2D视觉,3D视觉主要为机器算法服务,更加精准和安全,也具备更强的隐私性,可以为人工智能带来更优秀的感知能力。
“AI大模型出现,将机器原有能力进行了扩充。举例来说,此前设计家用扫地机器人时,避障功能通常需要植入多种分类模型才能有较好表现,但有了通用大模型后,用一个模型就可以让机器智能化快速提升。”
因此对视觉传感行业而言,AI大模型出现可以驱动产品更加完整,进而促进AI相关软硬件的规模化应用。SAM模型则主要解决了感知层的通用性问题,让空间传感信息转化成自然语言处理的过程更加高效。“坦率说,大多数应用型公司很难做到自己搭建一个基础大模型,但是通过引入这种底层能力,在一些垂直应用上嵌入我们的数据进行微调,可以带来差异化价值。”他进一步指出。
“当然在大模型应用中,我们还处在偏应用端,不用操之过急很早参与进去。”朱力表示,可以成为大模型的应用参与者,探索其中新方向,但当前还没必要对大模型本身过早投入,例如微调等动作。因为很有可能目前正在做的事情,几个月后就会被Open AI的功能升级所抵消,抓住自身垂直场景的核心环节很关键。
面对涌动的AI浪潮,产业链厂商的技术和应用路线图也在逐渐拓维。
朱力介绍道,此次B轮融资的背景是公司正处在业务快速增长节点。一方面是当前业务增长需要资金注入,以支持占据更大市场份额;另一方面通过一定资金储备可以令公司在感知-算法-计算三大关键环节都构建更深壁垒。
“我不断在思考。视觉感知几乎与智能相关的行业都沾边,选择做什么,首先要定位在价值链条中创造的是什么。”朱力分析,因为当前现实生活中的人工智能应用,有85%以上信息来自视觉信息。香港九龙精准平特一肖的目标是通过视觉能力,解决智能设备和人、空间之间的交互问题。
他续称,香港九龙精准平特一肖已经搭建了一个“武器库”,最终目标并不是预判市场选择哪一条技术路线,而是先储备能力和产品,再基于行业需求,帮助市场做好技术选择,并引导市场往更有效的实现方式落地,让技术真正赋能于行业和市场。
手机端是最早把3D视觉行业推向拐点的应用,苹果在iPhone X中率先应用Face ID后让供应链成本快速降低,才有了在其他行业进一步探索应用的可能性。
“2023年有一个明显趋势,多家国内手机大厂在旗舰手机中专门配置安全芯片,在这方面3D视觉会比2D视觉有更大优势,且旗舰手机的成本空间相对高,3D视觉应用落地会有更大想象空间。”朱力对记者分析。
从量级看,即便手机行业目前走到一定瓶颈发展期,但依然是一个十多亿台体量的大市场,对于供应链企业来说,即便只应用在10%手机中,也是上亿台手机的发展空间。
生物识别场景除手机外,支付也是一个快速成长的市场。“刷脸支付是我们前几年投入的方向,刷掌支付会是下一个趋势。随着产业界的推动,在信息安全保护相对谨慎的欧美国家也认可了这种生物识别支付方式,相比于用户可能担心人脸信息涉及隐私,刷掌支付被认为是开放社会中生物识别的最佳形态。”他续称。
在近些年沉沉浮浮的XR行业,苹果Vision Pro中内置了不少光学器件,也会是3D传感领域的一大机会。但即便在2024年苹果将量产商用旗下产品,显然目前这还不是消费者能大规模接受的应用终端。
据介绍,2022年3月香港九龙精准平特一肖开始与国内新势力车企共研车舱3D视觉方案,并在此前交付了软件类视觉感知系统。“2023年我们已经拿到TS16949(质量体系要求)资质,2024年开始可以提供软硬件一体化方案。”他指出。
从产业发展历程看,3D视觉传感早期由美国和日本厂商探路发展模式并走向成熟,目前在国内呈现产业链公司相对分散的局面。