北京海天瑞声科技股份有限公司,向科创板提交申请并获受理。这是海天瑞声第二次冲刺科创板,2019 年 4 月的时候,海天瑞声就顶着“人工智能第一股”的名号,首次提交科创板 IPO 申请。
但那次冲刺并没有得偿所愿,7 月的时候,公司基于长远发展的战略布局和引入战略投资者的考虑,主动撤回了申请材料。
这段时间,通过增资、老股转让等方式,海天瑞声引入了中移投资控股有限责任公司、中国互联网投资基金、芜湖青和、 芜湖博信等机构投资者。
海天瑞声属于典型的“人工智能”产业链企业,但其业务并非 AI 主线,属于围绕产业链提供技术支持和服务的。
海天瑞声率先触网科创板,这是一个“淘金的”比不过“卖水的”典型的当代案例。
海天瑞声的主营业务是 AI 训练数据的研发设计、生产及销售,属于“人工智能基础数据服务业”,为高大上的 AI 产业链公司提供 AI 算法模型开发所需的专业训练数据集。覆盖智能语音(语音识别、语音合成等)、计算机视觉、自然语言等多个 AI 核心领域,全面服务于人机交互、智能驾驶、智慧城市等多种创新应用场景。
所以,在整个“人工智能”产业链中,海天瑞声的业务属于支撑体系。
正如海天瑞声在招股书中披露的一样,算法、算力、数据是人工智能发展的三大要素,其中训练数据是 AI 算法发展和演进的“燃料”。
笔者在之前的文章里曾提过,教会机器像人一样思考,并不是一件容易的事情。
疫情期间,辅导神兽们学习,养育一个有血有肉、智力健全的娃娃,尚且能逼疯一个老母亲,更何况教会以沙子为原材料的机器去思考?
为了让机器跟孩子一样去认知,也需要准备足够的海量数据来灌输给机器,来教会机器认知。但这些用来训练机器认知模型的数据,跟我们平时灌输给孩子们的碎片化知识并不一样,必须是基于人类认知加工过的“熟数据”,而且必须是正确的“熟数据”。
海天瑞声做的就是这事情,为人工智能产业提供“熟数据”,提供产业发展的动力燃料。
当然,人工智能涉及领域比较广,从客户角度可以看出海天瑞声产品范围。目前海天瑞声客户累计数量超 400 家,覆盖了主要的大型科技公司、人工智能企业及科研机构,训练数据覆盖智能语音(语音识别、语音合成等) 、计算机视觉、自然语言等多个 AI 核心领域。
产品和服务已获得阿里巴巴、腾讯、百度、科大讯飞、海康威视、微软、 亚马逊、三星等国内外客户的认可,应用于其研发的个人助手、 智能音箱、 语音导航、搜索服务、 智能驾驶、 机器翻译等多种人工智能产品相关算法模型的训练过程中。
随着人工智能行业的兴起,对训练数据的需求也指数级增长,数据训练服务行业已经具有相当规模,为人工智能的成长和强大,源源不断地提供弹药,形成了完整的产业链条。