近日AI数据公司「整数智能」宣布完成了数千万元人民币A轮融资。本轮投资由峰瑞资本领投,老股东藕舫天使跟投。此前整数智能还获得唐氏(中国)投资、尖晶资本等机构的投资。
据悉,本轮融资资金将用于数据集构建服务和智能数据工程平台的强化建设,招募全球顶级的人才团队,加速公司对全球市场的产品和业务布局。
整数智能是一家致力于为人工智能提供数据服务支持的数据公司,业务涵盖智能驾驶(Automobile AI)、生成式人工智能(Generative AI)、具身智能(Embodied AI)等诸多领域。目前公司团队规模在百人以内。
人工智能的发展离不开数据、算法和算力三大支柱。AI大模型加速爆发下,数据需求呈现指数级增长,而高质量数据对于提升AI模型的准确性和泛化能力至关重要。整数智能致力于通过有效数据管理和智能标注工具,大幅降低数据准备的成本和时间。
据公司创始人林群书介绍,整数智能的数据服务有两大特点:一是覆盖全业务场景,二是提供一个能够AI自动化、并且不断进化升级的数据平台。
首先,整数智能提供的数据集构建服务(ACE Service)覆盖数据采集、清洗、标注和成品数据等各个环节,为智能驾驶、生成式人工智能、具身智能等领域提供解决方案。此外,整数智能还形成了人工智能训练师的培训体系,在全球建立了多个人工智能数据标注产业基地。
以智能驾驶场景为例,当下高阶智驾已经成为车企必争的智能化技术高地,海量智驾数据的获取与处理也成为挑战。
图源官方
对数据处理行业而言,原本的2D\3D数据标注工具链已经无法满足更多要求,因此整数智能推出了4D标注工具,即在三维空间数据的基础上叠加时间维度的序列信息进行场景重建,可以把原本需要数百帧的标注工作,极限压缩到一帧来进行。
据林群书介绍,整数智能从去年初就推出了4D标注工具,随着工具链优化,不仅能做到百倍效率提升,自动化标注准确率还能最高达98%,获得了国内诸多头部公司的订单。
生成式AI与具身智能,同样是整数智能瞄准的业务场景。针对生成式AI,整数智能提供了数据采集、数据清洗能力以及数据标注工具,储备了丰富的多模态成品数据集,还沉淀了数学、编程等领域的专家库资源,用于专业领域训练数据集的生产;针对具身智能,整数也能够提供包含视觉、触觉、声音等多种感官数据的数据集等。
其次,在数据平台方面,整数智能的智能数据工程平台(MooreData Platform),能够处理图像、视频、文本、音频、点云等多模态数据。通过AI智能工具加持,使数据标注效率提升500%以上。通过平台内置的MLOps模型训练系统,实现数据标注工程与模型训练工程的闭环与迭代,能够快速在新行业或新场景进行AI智能标注,并且不断提升AI智能标注的精度,使得获取高质量数据的时间成本与人力成本不断降低。
林群书认为,人工智能浪潮和数据标注业务增长将在全球范围内发生,整数智能的业务重心也从专注于国内开始往全球布局。
目前,整数与国内外1000余家顶级科技企业和科研机构建立了合作关系,在新加坡、法国巴黎、美国硅谷等地设立了Global Office,并在东南亚和非洲建立了AI数据训练师产业基地。
本轮融资后,林群书表示将继续强化整数智能的4D标注业务根基,推进合成数据开发,以及推动海外品牌建设和全球化业务布局。
针对本轮融资,峰瑞资本表示,“前沿数据缺失”已成为阻碍AI行业发展的最大障碍,解决方法是人机结合方式的“数据生产”。即便是像OpenAI顶尖公司,也需要部分依赖外部合作伙伴来实现数据生产的目标。整数智能就是这样一家优秀“AI数据工厂”。他们以中国为起点,在海外市场也取得了不错的进展。在中国汹涌的出海浪潮、高效数字化的基础和工程师红利等多重因素的加持下,整数智能未来有望在欧洲、美国及其他国际市场取得更大的突破和成就。
藕舫天使表示,大模型、具身智能、自动驾驶,正在引领一场新的人工智能技术革命。高质量标注数据直接影响AI模型对特定任务的理解和学习能力,整数智能推出的MooreData智能化数据标注平台,可以实现高效自动化数据标注数据生产的低成本、高精度、快产出,从而缩短AI模型开发周期。随着整数智能全球化业务不断落地,我们相信整数智能会成为新一代AI产业的基础设施引领者,为世界AI产业发展贡献中国力量。