海天瑞声8月31日发布投资者关系活动记录表,公司于2022年8月24日接受15家机构单位调研,机构类型为其他、基金公司、证券公司、阳光私募机构。

投资者关系活动主要内容介绍:

问:训练数据行业的市场空间如何?

答:AI训练数据行业整体处在快速增长期,根据IDC研究报告,预计中国AI基础数据服务市场近5年复合年增长率将达到47%,预期2025年将突破120亿元。此外,随着AI+垂直场景相结合的趋势、以及这些垂直行业自身的蓬勃发展,训练数据行业将迎来更大的增量市场空间。目前,智能驾驶的高速发展已带来爆发式的训练数据需求,未来随着机器人、数字人等在各领域的商业化落地,训练数据需求将会加速释放,市场容量增长非常可观。

问:智能语音是不是公司的优势业务?

答:智能语音是公司优势业务之一,公司在智能语音方面积累深厚。截至22年6月底,公司已积累智能语音标准化训练数据集764个,覆盖智能家居、机器人、虚拟人等11种应用场景。此外,截至6月底,公司语言研究能力已覆盖190种语种/方言,尤其是在多语种方面具备显著优势,公司在多语种方面的积累也成为公司拓展境内、境外市场的重要抓手,同时也为公司毛利水平提供了良好支撑。此外,语音方面的口碑积累也为公司开拓AI+市场奠定了良好的基础。以智能驾驶为例,智能语音已成为公司在智能驾驶业务领域拓展的重要切入点,通过语音产品建立与智能驾驶客户连接,上半年公司智能驾驶客户持续增长,截至6月底智能驾驶客户数量已超过40家。未来,公司将持续加大语音方面研发投入,增厚语音领域壁垒,赋能公司智能语音业务以及整体收入的持续增长。

问:公司获得境外客户认可的核心竞争力是什么?

答:除了长期合作的良好口碑,公司在语音方面积累深厚,尤其是多语种方面的积累和能力,可以更好服务境外公司全球化布局。截至今年6月30日,公司已覆盖超过190种语种/方言,不仅包括含英、法、德、意、西、日、韩等常见语种,还包括东南亚、一带一路等国家地区的罕见多语种,尤其在亚洲多语种的服务上具备竞争优势。除核心业务能力外,公司也从去年开始制定了更为全面的全球化发展战略,从品牌升级、体系搭建、团队建设、营销推广等多维度升级海外市场布局,大大提升海外客户触达和服务能力,上半年境外业务增势显著,收入同比增长131%,境外市场签单额同比增长近2.5倍,达历史同期最佳水平。

问:海外业务的盈利能力如何?

答:海外市场是公司业务收入的重要组成部分,同时也是公司盈利能力的重要支撑。在公司强力的全球化战略布局下,今年上半年海外业务增势明显,收入占比大幅提升,占总收入比重为57.14%,境外市场签单额同比增长近2.5倍,整体拉升公司业务收入水平;同时境外业务以产品销售为主,且其定制服务毛利水平整体高于境内,极大增强了公司的综合盈利能力。

问:请介绍公司在自动驾驶业务布局现状以及未来规划?

答:公司已于去年完成智能驾驶团队的搭建,从研发、技术、业务、销售等全方位布局智能驾驶业务。为更好满足智能驾驶数据需求,公司已从技术能力和资源供给多个维度进行规划和布局。

今年上半年,公司完成了第三代智能驾驶标注平台上线,平台工具链基本实现了业内主流需求全覆盖(包括50多种2D标注及重点3D标注功能),下半年公司将继续秉承技术驱动逻辑,持续加大智能驾驶研发投入,预计将于年底上线第四代智能驾驶标注平台,其将进一步完善3D功能,通过打造业内标杆平台,更好服务于智能驾驶业务拓展。

此外,为更好承接快速增长的智能驾驶业务需求,保障合规、充足、可持续的数据生产能力,公司已提前在资源方面进行规划布局。上半年,公司已在安徽省建立并投入运营一体化基础数据创新服务基地;未来,公司还将通过政企、校企合作等方式,继续扩展京外数据基地建设,支撑持续增长的产能需求。

未来,公司将通过不断夯实的平台及资源能力拓展更多商务资源,同时利用商务机会持续迭代自身技术和资源水平,形成良性循环,持续增强公司竞争实力。

问:目前智能驾驶我们只涉及了标注类业务吗?

答:公司已于今年上半年通过北京市规划和自然资源委员会行政许可,获得乙级测绘资质,公司在此项资质获取之前,仅聚焦于智能驾驶标注类业务以及智能座舱业务,但随着资质获取,公司业务范围将进一步拓展至数据采集环节,未来可通过开拓采标一体服务,进一步提升智能驾驶业务的毛利水平。

问:拿到乙级测绘资质对公司意味着什么?

答:公司已于今年上半年通过北京市规划和自然资源委员会行政许可,获得乙级测绘资质,这也意味着公司拥有了车辆上路采集资质,可为智能驾驶客户提供数据采集服务。未来公司将通过拓展采标一体服务,进一步提升智能驾驶业务的毛利水平。

问:公司智能驾驶客户有哪些?

答:受益于智能驾驶业务蓬勃发展以及公司在该领域的强力布局,截至2022年6月底,公司已服务超过40家智能驾驶领域客户,覆盖传统车企、新势力车企、智能驾驶技术公司等。目前公司也在该领域进行持续的客户拓展,进一步加固客户储备,迎接行业爆发。

问:智能驾驶数据服务领域,平台是主要的核心竞争力吗?

答:平台能力是衡量一家专业数据服务商在开展智能驾驶数据业务方面的核心要素。数据处理平台是否具备较强竞争力,首先要看其功能点的覆盖程度,覆盖的功能类型越丰富,其可处理的数据场景、以及可满足的客户需求就会越多。在智能驾驶领域,目前同时具备2D标注、3D点云标注、2D-3D联合标注以及3D语义分割标注的供应商比较有限,能以最快速度覆盖更多功能需求的数据服务商将能更好掌握智能驾驶数据市场的主动权以及议价能力。

第二个评价要素是平台的产出效率。平台的智能化程度越高,对人的依赖程度越低,在提高平台的生产效率的同时可以大幅降低生产成本。

第三是平台友好度,即平台操作的便捷性。便捷性越强,标注员上手越快,标注效率则越高。

从长期看,数据处理平台除了覆盖数据标注需求外,如何能与客户的算法平台连接,做好数据管理的工作,进而加速数据训练迭代,也将是评判平台能力的因素。

问:如何看待智能驾驶领域客户自建团队,对我们业务会不会是一种威胁?

答:客户自建团队在整个AI训练数据市场并非新现象,而是伴随着整个AI行业的发展一直存在的。但客户自建团队主要解决其自身的部分数据需求,如敏感数据等,对于那些需要投入较高研发力量以及数据安全要求较高的复杂数据,客户出于成本以及规模化效益考虑,仍会大量购买数据服务提供商的数据及服务。

相较于客户自建团队,海天历来都是对接众多大型科技公司、头部人工智能企业、科研院所等,项目经验丰富,积累了大量的know-how,对数据处理的理解更广、更深刻,同时我们搭建了成熟的数据处理算法平台,通过更高效的人机交互实现降本增效,保证数据质量的同时能有效降低成本,为客户提供更高性价比的训练数据产品/服务。

因此,公司判断,智能驾驶数据业务市场空间足够大,即便部分客户未来会长期维持自建团队,但出于成本以及规模化效益考虑,仍会持续大量购买第三方数据服务,不会影响海天在智能驾驶领域的整体收入体量和增长趋势。

问:智能驾驶的市场需求空间如何?

答:智能驾驶训练数据需求还处在快速上升阶段,从长期来看,市场需求主要与以下三个要素相关:1)车厂的车型及传感器丰富度。通常来说,不同车型、不同传感器会有不同的硬件配置方案,继而需要不同的数据解决方案,因此车型/传感器等硬件配置的多样性程度将会直接影响所需数据解决方案的数量;2)量产车数量。量产车的数量决定了整个的训练数据需求基数的大小;3)智能驾驶级别的逐渐提升。智能驾驶级别和渗透率的提升决定了数据处理场景的种类和体量。这三个要素对训练数据需求的影响是相互叠加的。目前这三方面的发展均处于初步阶段,随着自动驾驶行业的发展和更多搭载更高级别功能的量产计划落地,公司预测,相关的数据业务市场将会呈现较大的增长空间。

问:智能驾驶平台建设方面有何进展?

答:今年上半年,公司完成了第三代智能驾驶标注平台上线,平台工具链基本实现了业内主流需求全覆盖(包括50多种2D标注及重点3D标注功能),同时在停车位检测、车道线预识别、车前障碍物检测等多个算法能力上新增多个模型,显著提高智能驾驶相关数据服务的标注效率。下半年公司将继续秉承技术驱动逻辑,持续加大智能驾驶研发投入,预计将于年底上线第四代智能驾驶标注平台,其将进一步完善3D功能,通过打造业内标杆平台,更好服务于智能驾驶业务拓展。

问:公司智能驾驶业务的最新进展如何?

答:公司已于去年完成智能驾驶团队的搭建,从研发、技术、业务、销售等全方位布局智能驾驶业务。为更好满足智能驾驶数据需求,公司已从技术能力和资源供给多个维度进行规划和布局。

今年上半年,公司完成了第三代智能驾驶标注平台上线,平台工具链基本实现了业内主流需求全覆盖(包括50多种2D标注及重点3D标注功能),下半年公司将继续秉承技术驱动逻辑,持续加大智能驾驶研发投入,预计将于年底上线第四代智能驾驶标注平台,其将进一步完善3D功能,通过打造业内标杆平台,更好服务于智能驾驶业务拓展。

此外,为更好承接快速增长的智能驾驶业务需求,保障合规、充足、可持续的数据生产能力,公司已提前在资源方面进行规划布局。上半年,公司已在安徽省建立并投入运营一体化基础数据创新服务基地;未来,公司还将通过政企、校企合作等方式,继续扩展京外数据基地建设,支撑持续增长的产能需求。

问:智能驾驶行业的核心竞争力是什么?

答:智能驾驶数据领域的核心竞争力主要体现在三个方面,分别是平台能力、算法能力以及数据安全能力。

平台能力是数据标注能力的基石。平台功能点覆盖的丰富度是评价平台水平的核心要素,目前同时具备2D标注、3D点云标注、2D-3D联合标注以及3D语义分割标注的供应商比较有限,能以最快速度覆盖更多功能需求的数据服务商将能更好掌握智能驾驶数据市场的主动权以及议价能力。

第二个核心要素是算法能力。平台的智能化程度越高,对人的依赖程度越低,在提高平台的生产效率的同时可以大幅降低生产成本。

第三个要素是数据安全能力。智能驾驶数据不同于传统的语音类数据,由于其采集图像涉及大量的地理及个人隐私信息,为更好防范数据安全风险,国家相关法律法规要求数据流转链条上各类企业必须做好充分的数据安全保障。因此,未来不具备相关数据安全能力的供应商将逐渐被市场淘汰。

问:目前智能驾驶的数据市场集中度较低,未来竞争格局将如何发展?

答:智能驾驶市场主要参与者有品牌数据服务商,客户自建团队以及一些中小服务商。从目前行业格局来看,品牌服务商占据较大比例的市场份额。根据海天观察,在品牌数据服务商里,Appen和百度智能云数据众包在该领域实现较早布局、处于领先;海天从去年开始发力该领域,并将会通过持续提升平台和算法的能力、拓展客户资源,加速培育能力,力争未来在该领域实现高速增长。

问:过往语音能力的积累在智能驾驶领域有复用的空间吗?

答:智能座舱是智能驾驶业务里的重要组成部分,而智能座舱又以智能语音为核心业务线,公司自成立以来始终致力于语音语言学研究,目前已覆盖190种语种/方言,该方面积累已成为公司智能座舱领域的重要竞争力和智能驾驶新客户拓的重要切入点,未来公司将通过语音能力触达更多智能驾驶领域优质客户,驱动智能驾驶数据业务快速发展。

问:今年上半年,定制和产品的收入比例是多少?

答:2022年1-6月,公司定制服务收入为5905.10万元,训练数据产品收入为5429.52万元,定制服务占总收入比重为51.45%,训练数据产品占总收入比重为47.30%。

问:定制服务和产品的定价模式是什么样的?

答:定制服务可以分为:定制数据集和数据加工服务。定制数据集生产流程跟产品数据集类似,但需求来源于客户且数据集知识产权归属于客户,因而价格会更高一些;数据加工服务,是由客户提供原料数据,海天瑞声负责数据加工,将加工后的数据集交付给客户,供其进行客户自身AI产品的算法训练。

定制数据集,按照单价(例如语音小时单价、每张图片单价、视频小时单价、每行文本单价等)乘以量(例如语音小时数、图片张数、视频小时数、文本行数等)的逻辑进行定价;数据加工服务,则是按照数据加工的有效工时或数据量定价,价格的高低与项目的复杂程度紧密相关。总体价格会根据公司生产数据的成本,考虑合理的利润率后报出。

标准化产品的定价模式与定制服务有所不同。标准化的训练数据产品是按每个数据集定价,考虑产品的制作成本、市场上的稀缺性等因素,每个数据集产品有一个价格区间,根据商务谈判情况给出最终报价。

问:除了自动驾驶,还有几个潜在的AI+行业?

答:公司认为除智能驾驶外,金融、医疗、公检法等行业或将成为训练数据下一阶段应用的重要领域,是尚未估量的新增蓝海市场,由于每一个垂直行业内部均有诸多细分,因此市场容量非常可观。

问:我们在数据安全方面具体获得了哪些资质?

答:公司自成立之初即把数据安全、数据合规视为生命线,公司在多年的数据风险识别和管理实践中,已经形成了较为成熟的安全、合规管理体系。公司已通过了业内重要的ISO/体系认证、个人隐私信息安全管理体系认证,形成了具有自身特色的数据安全与隐私保护整体解决方案。此外,2021年,公司《人工智能训练数据资源全生命周期风险识别与管理应用案例》被中共中央网络安全和信息化委员会办公室评为人工智能企业典型应用案例;充分体现了公司在承担数据安全责任与遵循隐私保护等原则的实践精神。目前,公司符合GDPR、《数据安全法》、《个人信息保护法》等一系列国际通用与国内法律法规的管理规范要求,获得了业务领域合作客户的高度认可。

问:训练数据行业的竞争壁垒是什么?

答:经过多年发展与积累,公司逐步构建起了在行业内的竞争壁垒,核心竞争力主要体现在:

1.公司的业务模式是服务产品双模式,且产品化贡献显著,是收入和毛利的主要来源,标准化数据集的研、产、销体系是公司从业多年探索出来的业务模式,其复用性为公司的规模化和高利润率提供了保障。而保持这样的能力需要具备对行业需求的强判断力和较强的资金实力。

2.技术平台能力:公司历来重视技术的研发,近年来更是加大研发投入的力度,全面提升公司的算法能力、平台能力、工程化能力,加深算法辅助能力与人工工作的结合,达到更佳的人机协同效率,这样能够做大规模、提升效率、降低成本。

3.供应链资源管理能力:公司拥有成熟的数据处理平台,解决了数据规模化过程中对产能、质量、成本几方面平衡的难题,同时通过长期建设的供应链体系,保障资源的获取,未来,公司会进一步加大供应链资源平台的建设,使人员管理、采标资源分配、质量检验、远程工作等各方面的能力得到显著提升,为垂直行业客户和政府客户的客群拓展提供支撑。

4.数据安全及合规能力:

数据安全及合规能力已经成为了衡量品牌数据服务商综合能力的重要指标。公司在多年数据风险识别和管理实践中,已形成了较为成熟的安全、合规管理体系。公司全方位做好数据风险管控工作,通过了业内重要的ISO/体系认证、个人隐私信息安全管理体系认证,形成了具有自身特色的数据安全与隐私保护整体解决方案。2021年,公司《人工智能训练数据资源全生命周期风险识别与管理应用案例》被中共中央网络安全和信息化委员会办公室评为人工智能企业典型应用案例;充分体现了公司在承担数据安全责任与遵循隐私保护等原则的实践精神。目前,公司符合GDPR、《数据安全法》、《个人信息保护法》等一系列国际通用与国内法律法规的管理规范要求,获得了业务领域合作客户的高度认可。

问:客户自建团队是否会对公司造成影响?

答:客户自建团队在整个AI训练数据市场并非新现象,而是伴随着整个AI行业的发展一直存在的。但客户自建团队主要解决其自身的部分数据需求,如敏感数据等,对于那些需要投入较高研发力量以及数据安全要求较高的复杂数据,客户出于成本以及规模化效益考虑,仍会大量购买数据服务提供商的数据及服务。

相较于客户自建团队,海天历来都是对接众多大型科技公司、头部人工智能企业、科研院所等,项目经验丰富,积累了大量的know-how,对数据处理的理解更广、更深刻,同时我们搭建了成熟的数据处理算法平台,通过更高效的人机交互实现降本增效,保证数据质量的同时能有效降低成本,为客户提供更高性价比的训练数据产品/服务。

因此,公司判断,智能驾驶数据业务市场空间足够大,即便部分客户未来会长期维持自建团队,但出于成本以及规模化效益考虑,仍会持续大量购买第三方数据服务,不会影响海天在智能驾驶领域的整体收入体量和增长趋势。

问:公司上半年新增人员主要是集中在哪些部门?

答:公司上半年新增27人,其中超半数隶属于基础研发部门,负责公司标注平台搭建及预标注算法研究,助力公司向平台智能化方向演进。此外,为进一步拓展公司全球化业务能力,上半年公司增强了海外销售团队建设,深入布局美国、欧洲以及日韩销售网络,实现客户触达能力和服务水平的双向提升。

问:今年收入增长预期如何?

答:训练数据行业整体处在快速增长期,根据IDC研究报告,预计中国AI基础数据服务市场近5年复合年增长率将达到47%。此外,随着AI+垂直场景相结合的趋势、以及这些垂直行业自身的蓬勃发展,训练数据行业将迎来更大的增量市场空间。公司收入会随着行业增长以及自身在全球化、行业化、智能化三大方向上的拓展下,持续向好,但收入水平也将同时受到未来疫情发展、国际形势演变、以及行业竞争态势等多方面因素影响,综合考虑上述影响后,预计下半年收入增速会较上半年有所提升,公司仍将30%的收入增速作为今年的奋斗目标;

北京海天瑞声科技股份有限公司的主营业务从事AI训练数据的研发设计、生产及销售业务。公司的主要产品有数据资源定制服务、数据库产品、数据资源相关的应用服务;公司自2007年至今连续荣获“国家高新技术企业”及“中关村高新技术企业”称号,2018年被评为国家规划布局内重点软件企业。公司是“中国人工智能产业发展联盟”、“中国语音产业联盟”的理事单位,参与了行业标准的起草工作,在人工智能数据库架构设计、开发标准、质检评测等领域,以专业性和创新性获得了行业的普遍认可。公司近年来获得了2017年中国信息协会、信息化观察网评选的“年度人工智能数据服务领域领军企业”;2018年中国语言产业联盟颁发的“智能语音创新大赛行业先锋奖”;2018年中国信息协会、信息化和软件服务网颁发的“2018年人工智能行业最佳产品”等多项国内外人工智能领域奖项。

调研参与机构详情如下:

参与单位名称参与单位类别参与人员姓名

万家基金

基金公司

叶勇、胡文超

上投摩根

基金公司

王嵩、舒亮

华商基金

基金公司

金曦、陈杰

嘉实基金

基金公司

何鸣晓、刘晔、李涛、王鑫晨、王雪松、谢泽林

招商基金

基金公司

杨渺

金鹰基金

基金公司

刘忠腾

鹏华基金

基金公司

董威

中信建投

证券公司

甘洋科

兴全证券

证券公司

朱可夫

华泰证券

证券公司

郭雅丽

天风证券

证券公司

张若凡、缪欣君

山西证券

证券公司

张红兵

鸿道投资

阳光私募机构

方云龙

亘曦资产

其他

朱登科

龙全投资

其他

李龙全、王振鹏