专注于AI数据,BasicFinder为企业提供一站式数据采集与标注服务 AI资讯 第1张

人工智能三大支柱:数据、计算能力和算法,数据作为首要因素,是人工智能技术持续进化不可或缺的动力原料,然而在获取数据的过程中,无论是科学家还是企业的AI工程师都不能绕开一个现实问题:怎样获得大量干净的可用数据?

对于很多科学实验室和AI公司来讲,数据的采集、清洗、标记过程严重拖慢研发效率,耗费大量人力时间,而且数据标出来如果不规范,量不够大,难以满足专业化的应用需求,所以在人工智能产业链上,专业化的AI数据供应商便应运而生。

北京深度搜索科技有限公司(BasicFinder)注册成立于2015年9月,BasicFinder的初衷含义是希望能在人工智能世界中找到最本真的那一层关系,数据。BasicFinder创始人兼CEO杜霖说:“数据是人工智能系统的动力源,我们想作为一个专注于AI数据的供应商,变成AI的加速器,从数据源开始加速。在数据这条产品线上,直观一点讲,我们将提供包括采集数据,清洗数据,结构化标记数据甚至是模型训练等一整套的闭环解决方案。”

 专注于AI数据,BasicFinder为企业提供一站式数据采集与标注服务 AI资讯 第2张

杜霖是一个连续创业者,在上海交通大学计算机系读大二的时候,就开始了第一次创业经历,当时开发了一款SEM搜索引擎自动化营销工具,后以300万美金的价格打包卖给了一家土耳其电子商务网站。2010年大学毕业后,杜霖跟几个朋友成立了一家早期TMT行业投资公司,从事了数年创投工作。

计算机视觉一直是杜霖十分感兴趣并且擅长的技术,2015年初,杜霖接触到一个合作项目,通过人工智能技术帮助拍拍网去搜索它的商品,拍拍网原是腾讯电商旗下业务,后背京东战略收购。当时深度学习框架刚刚兴起,基于这个项目杜霖预感到深度学习框架在未来将会有巨大的拓展能力,可以解决各行各业的问题,比如在工业界可以做评检,在自动驾驶领域辅助驾驶,时尚界可以拍照扫图,视觉技术一下子变的立体化了。于是,杜霖在2015年9月份便注册成立了深度搜索科技,开始摸索新的技术方向。

杜霖透露说:“刚开始我们没有完全走到数据这条线上,也是在运营的过程中发现大数据是人工智能中不可或缺的一块,尤其现在随着各个平台大的框架的开源,算法的壁垒越来越小,我们就认准数据未来的需求是极大的,所以公司成立三个月以后,我们决定往底层沉淀去做数据。”

BasicFinder旨在打造一个从数据的定义、采集,加工,到训练迭代的一个平台。这个平台给AI客户的便利是在该平台可以轻松定义自己的数据任务,有任何数据需求,从数据的采集,爬虫技术和人员去获取,到数据加工,我们会把数据任务轻松分配到数据工厂,比如人脸的数据我们会分发给做过人脸识别的工厂,语音的话我们就发给专门处理语音的工厂,数据工厂业务员在我们平台上进行操作,客户在后台就能及时来监控这些信息,看看数据合格不合格,需不需要要及时返工,最后保证会输出一批最干净最纯的数据进行训练。

杜霖表示,在数据这个行业需要人做的事情很多,BasicFinder目前拥有12家下辖数据工厂及2000余名数据操作员,这些数据工厂有些是参与投资,有些是深度合作的模式,所覆盖得行业和应用场景也比较广泛,BasicFinder基于自己的平台把数据的采集、清洗、标记变成了专业化的产品服务。

 专注于AI数据,BasicFinder为企业提供一站式数据采集与标注服务 AI资讯 第3张

杜霖举例说:“假如有客户要研发一个算法,需要采集道路上三万张行车照片,BasicFinder就会通过系统分配给数据工厂进行商务采集,采集完数据汇总到BasicFinder平台,根据客户的算法模型来标记路上所有像素大于50*50 的车辆,我们会先进行一遍数据清洗,把不达标的照片略掉,再利用我们的标记平台任务分配机制分配给下面的工厂和个人,利用专业的标记工具做标记,最后完成数据交付。这块有两个分支,如果客户自己做模型的话,数据直接给他,可以直接在我们平台下载数据用来训练它的识别模型去做它们的AI技术。如果客户没有算法能力的,可以用我们的系统平台去做算法,训练模型,我们会把结果反馈给他,进行模型的修改完善。”

客户任务的发布和管理,只是前端的事情,BasicFinder在后端也做了很多事情。一个任务发过来如何分发到合适的工厂,到了工厂管理员如何去把任务分配到操作员个人,整个过程如何做到效率的监管,质量的把控,还有评检,错误的修改,所有的这些事情在BasicFinder后台都已经实现。

杜霖说:“我们做的是平台,运营的是这套管理系统,我们是在运营这个平台的过程中给客户提供了便利,给工厂提供了便利,最后把最高质量的数据交给客户。”

据悉,BasicFinder整套产品预计会在9月份才会正式上线,没有上线之前业务基本靠口碑传播,目前已经帮助很多客户解决数据问题,服务的客户有中国科学院、京东、搜狗、云之声以及一些国外知名院校和科学机构等。BasicFinder已经获得过两轮融资,天使轮由个人投资数百万元,2017年3月份,完成了一千多万元pre-A轮融资,计划今年底或明年初再进行A轮融资。