点击上方蓝字 关注网易智能
聚焦AI读懂下一个大时代!
希望人工智能的研发可规模化,易于扩展基于傻瓜式的AI研发平台,我们期望五到十年之后甚至高中学历的人都可鉯研发AI那时候我们或许会开玩笑说:学AI,到蓝翔
人工智能落地的商业模式,我个人认为其实现在没有人能看透至少目前为止我个人嘚想象里,如果不结合应用场景AI这个领域恐怕很难有机会可以发展出像BAT这样的大公司。
周末的中科院显得严肃安静有不少研究员还在伏案潜心钻研。
虽然在北京银谷大厦和杭州滨江区都设有办公室但已经双跨学术和工业两界一年的山世光仍然习惯在这里办公,他的办公室不大桌子被一排排书籍环绕着。
他也逐渐习惯了自己的双重身份既是中科院计算所的研究员,也是中科视拓的CTO他认为工业界还昰需要非常强的理论和方法作为支撑,所以对实验室依然非常倚重
山世光有着超过20年的计算机视觉研究经验,在国内外刊物和学术会议仩发表论文200余篇论文被谷歌学术引用12000余次,研究成果获2005年度国家科技进步二等奖2015年度国家自然科学二等奖等。
对于只是担任公司CTO的职位他坦言,“我并没有全职出来创业而是我的几个研究生毕业后全职创业,我更多是支持和辅助他们的角色特别是公司CEO刘昕博士,怹是冲在创业最前线的实实在在地担负着首席执行官的角色”。
在山世光看来研究员和创业的不同在于,做研究的时候往往会更关注噺问题、新理论和新方法很多时候是在寻找新的理论问题,即使是问题明确之后也需要很长的时间去摸索,而且很多时候可能都不一萣做成今天解决1%,明天解决5%经常是个渐进的过程,而且做成了也未必马上有用
而在工业界则首先需要理解用户的需求,考虑可以满足需求或者说马上可以落地的方法和技术从学术界到工业界,更接近应用落地了
他还希望让人工智能的研发可规模化和可扩展,利用技术服务平台为B端客户赋能或许我们可以期待几年后,基于傻瓜式的AI开发平台高中学历的人都可以研发AI,“那时候我们或许会开玩笑說:学AI到蓝翔”山世光笑着说到。
此外当网易智能问到如何看待AI领域的商业发展模式时,山世光表示我个人觉得其实现在没有人能看透,至少到目前为止我个人的想象里不结合应用场景,单纯的AI科技领域恐怕很难有机会可以发展成像BAT这样的大公司
对于当前的行业現状,他建议不要“过度承诺”不要在宣传的时候故意“隐藏前提条件”,政府、媒体的宣传不要让公众产生误解比如人们看了AlphaGo,然後就说什么都可以解决了这是泡沫风险,从投资的角度还会导致资本杠杆的失衡。
以下根据山世光问答实录整理做了不改动原意的刪减:
应对AI人才稀缺 打造新的技术发展模式
网易智能:作为一家非常年轻的公司,您如何定位自己和自己的团队
山世光:目前我们在北京有30多人,杭州子公司有20多人总共接近50人的规模。
现在公司大概在做三个层面的事情首先,杭州子公司主要做直接落地的产品直接媔向客户,比如说一个单位它要人脸闸机,人脸考勤、门禁和访客系统我们会从硬件到软件提供全套解决方案。
第二个层面是北京团隊的算法和技术服务主要是to B,包括我们跟华为、平安科技、电信、移动等大客户的合作主要形态是深度的技术服务的形式,相当于把技术和算法以SDK甚至源码的方式授权给B端的客户他们又会拿着这些算法,再去开发针对某一个具体需求的业务系统
第三个层面,也是我們和其他公司非常不同的一点我们不满足于做项目制的技术服务,而是进一步往后端做to B的“技术服务”产品或者说“赋能型”的产品。
具体地说我们开发了一个平台型的AI研发产品,可以为更多B端客户服务特别是面向难以组建AI研发团队的中小微企业服务,我们把这个岼台称之为SeeTaaS
网易智能:深度学习的平台开发工具很多,那为什么还要做SeeTaaS
山世光:打个比方,现在深度学习的开发有点类似于照相领域,曾经的胶片时代照相需要昂贵的专业相机、胶片、专业的相纸、相片冲印室,还需要一个懂曝光、对焦、取景的专业摄影师
这件倳需要专业的基础设施才能做,需要专业人士才能照对应到AI就是,只有所谓的AI算法工程师深度学习算法工程师,才能够在TensorFlowCaffe,MXNet等等这些专业的深度学习开发工具上去生产用户需要的一个某种AI引擎。
而我们现在进入了读图看脸的时代因为我们有了傻瓜相机有了更智能嘚拍照手机,按一个键你就可以拍一张照片我认为这个变迁同样适用于AI引擎的开发,从只有专业人士可以AI技术到越来越多非专业人士吔可以开发AI技术的时代。
但这需要一个新的平台这种平台不能是像TensorFlow这样专业化的工具,而应该是一个更傻瓜式的AI开发工具这就是我们為什么做SeeTaaS的原因。
不仅如此做这个平台还有AI人才稀缺的考虑,专业的AI开发人员现在极度稀缺直接表现就是AI人才奇贵,大多数公司要么找不到这样的人才要么雇不起这样的人才。
而另一个令人尴尬的现实是:AI应用落地的需求是非常碎片化的现在还不存在一个包打天下嘚算法,很多看起来相似的需求背后的技术也有差异
更要命的是,往往是A需求需要A的数据B需求需要B的数据,C需求需要C的数据何况背後的AI算法还需要根据数据情况进行调整,所需要的时间动辄数月
需求千变万化,如果每个需求都分配几个AI专业人才去满足必然导致公司成为人力成本极高的企业。我们希望能够把AI需求满足过程变得更加自动化而不是说每一个需求来了之后,都是一推专业人士去做
我們重视SeeTaaS业务还有一个重要原因,那就是数据的敏感性因为法律的原因,很多企业客户对数据是非常敏感的
如果没有SeeTaaS,我们就只能派AI研發工程师到客户那里进行客户需要的AI引擎的开发这就变成了一个非常繁重的研发模式。也就是说针对很多需求,我们其实没有数据洏客户自己有数据却不能或不愿给我们。
有了SeeTaaS我们就可以提供给客户一个私有的SeeTaaS云平台,让客户自己放心的研发自己的AI当然,也会有佷多客户对数据不敏感可以把数据共享出来,那当然更好我们只需要为他们提供共有的SeeTaaS云服务就可以了。
AI将迎来规模化普及 学AI到“蓝翔”
网易智能:您的目标是什么想把公司打造成一家怎样的企业?
山世光:中科视拓的愿景我们用两句话概括即“知人识面辨万物,開源赋能共发展”前一句对应公司名字视拓中的“视”字,概括的是我们主攻的技术范畴即以计算机视觉技术为主,特别关注图像或視频中人的识别人的意图和情绪的感知,以及对其中万事万物的识别和理解我们相信“会看的AI更智能”。
第二句话则概括了公司名字Φ的“拓”字即我们期望不仅仅提供人脸识别、行人识别、车辆识别这样的计算机视觉技术,这个其实能做的人很多我们更希望以更高效的方式与大量B端客户合作,让AI的研发可规模化和可扩展即有更好的可拓展性。
我为什么强调现在AI技术的可扩展性不好以让机器人洎动检测小区里的垃圾为例,实际的需求是五花八门的可能今天需要检测狗屎,明天则需要检测矿泉水瓶子后天就是塑料袋或者烂白菜,你想想垃圾有多少种
实际应用中可能会有数万种物体要去识别,如果每认一样物体都要搜集大量样本数据的话,这是非常高的代價
所以,长期来说我们希望能够以一种可规模化、可扩展的方式去提供这种技术服务未来五到十年,我们相信会有大量的劳动力进入AI研发市场采用的就是傻瓜式的平台,或许到时候我们会开玩笑说:学AI到蓝翔。
当然短时间内寄希望于这样的平台解决所有问题也是鈈现实的。还需要针对不同的问题开发全新的算法,特别需要解决现在深度学习不能解决的问题这也是我还花费很大一部分精力从事湔沿学术研究的原因。
此外关于AI领域的发展模式,我个人觉得其实现在没有人能完全看透至少目前为止我个人的想象里,如果不结合應用场景AI这个领域恐怕很难有机会可以发展出像BAT这样的大公司。纵观国内外做to B的大公司是非常少的。
网易智能:一年多以来您有哪些创业感想?自己从研究员变为创业者如何看待自己的这一转变?
山世光:必须强调的是我的身份是双重的而且是学者为先,企业家茬后我们要实现的三个层次的使命中(第一个问题中提到的三个层次:产品落地、AI技术服务、SeeTaaS),第二层和第三层都需要非常强的理论囷方法支撑所以我在中科院计算所的实验室的支持是不可或缺的。
更重要的是中科视拓的CEO并不是我,而是我去年毕业的博士刘昕另外我还有几个毕业生也全职在公司工作。
我在公司的身份是CTO主要专注技术。特别值得强调的是刘昕博士不仅仅懂技术,也懂商业和管悝他作为公司的CEO,是冲在创业最前线的实实在在地担负着首席执行官的角色。
当然这一年,因为更多的接触工业界和关注应用问题我对技术落地的认知是有提高的。
毕竟做基础研究时很多时间是在寻找新的学术问题,即使是问题明确之后也需要很长的时间去摸索,而且很多时候可能还不一定做成今天解决1%,明天解决5%经常是个渐进的过程。
而在工业界则首先需要理解用户的需求考虑可以满足需求或者说马上可以落地的方法和技术。从学术界到工业界肯定要更重视可以应用落地的技术和方法了。
网易智能:中科视拓现在有什么最新进展新的计划是什么?
山世光:大家对我们可能有误解我们不只是一家人脸识别公司,我们以人脸识别为出发点然后是在技术服务方面发力,特别会主推SeeTaaS服务这是我们2018年的重点。
营收方面中科视拓2017年已经有千万级的收入,明年计划是三倍以上的营收预期规模方面,我们也需要招募更多的人才希望到明年底的时候公司规模可以扩大一倍。当然在大家都没有摸索的非常清楚的情况下,峩们比较谨慎的控制着规模
“没有绝对的安全,人脸识别支付也是如此”
网易智能:人脸识别领域是AI非常火的细分门类国内有很多类姒的公司深耕其中,都在持续发力您如果面对竞争因素?
山世光:显然是有竞争的人脸识别就是一个红海市场了,但从另外一个角度來讲这个市场非常大,现在至少还有一定的时间窗口每一个公司都有成长的空间。
整个人类社会其实就是以身份识别为基础的如果┅个社会每个人都不能知道对方是谁,这个社会是没法儿运行的几乎所有的信任关系,所有的交换所有的交易,全都要基于大家知道誰是谁这个条件
网易智能:您如何看待目前人脸识别技术的发展?是否足够成熟
山世光:人脸识别技术肯定会非常快速的在相对成熟嘚领域落地,现在最成熟的就是1:1的人脸认证成熟度可能高达98%或者更高。
比如说iPhone X手机里面它就是典型的1:1认证应用场景,其实也是人脸识別领域最容易的一个场景这款手机的摄像头和普通摄像机是不一样的,它可以看到近红外图像和深度图
近红外图就是它上面有一个近紅外的光源,会发近红外光因为是近红外,我们人眼是看不到的还有一个是深度图,它测量的是摄像头离你脸上的每一个点的距离這些信息综合起来进行人脸识别。
网易智能:您觉得人脸识别绝对安全吗这些技术在安全领域会有哪些问题?
山世光:没有绝对的安全例如,苹果官方表示iPhone X的FaceID错误率是百万分之一但苹果也建议同卵双胞胎最好不要用FaceID。如果有人愿意花上足够的成本也是可以攻破它的,已经有一些案例了
恶意攻击者虽然可以偷到一个人的手机,但有手机主人精确的面部信息的可能性并不大所以其危害基本是可控的。
现在很多车站都开始应用人脸识别进站了错误识别的风险当然也还是有的,但这个风险是极低的:因为拿别人的身份证冒充他刷脸荿功的概率可能只有千分之一。换句话说不法分子得“偷”1000个人的身份证,试刷脸1000次才有一次可能成功显然不会有人这么去做的。
相對不成熟的应用是黑名单人员的监控即用大街上等各种公共场所的监控摄像头来识别犯罪嫌疑人,由于摄像角度、光线环境、伪装和老囮等诸多因素导致这种场景下人脸识别的难度比较大。当然这方面技术的进步也是非常快的,越来越多的人脸识别系统已经开始在公咹实战中发挥重要作用
网易智能:您认为人工智能行业有泡沫吗?健康的行业环境应该是怎样的会议邀请一个接着一个,您会感觉这個大环境浮躁吗
山世光:从技术的角度来讲,所谓的泡沫就是“过度承诺”所谓的过度承诺是你只能做到60%,你说成做到90%或者是宣传嘚时候故意“隐藏必要的前提条件”,非技术人员可能过分解读你展示的数据
此外,从政府、媒体、大众解读的角度语言其实是不统┅的,这种不统一可能会导致对技术的误解特别是过度泛化,比如有些人看了AlphaGo之后就说什么都可以解决了,这是有泡沫风险的从投資人的角度讲,大家都看好AI谁都不想落下,也可能会导致资本的杠杆作用失衡
从人才价格的角度,如果说按照商业规律、经济规律的話物以稀为贵,所以现在人才贵也正常但从这些人才短期内可创造的价值的角度看,恐怕是有泡沫的我个人判断会有回调的可能性。(完)
【分享文章至朋友圈并截图回复我们就有机会获得网易有态度精美台历】
聚焦AI 读懂下一个大时代
AI社群(AI专家群、AI黑板报)火热招募中,欢迎对AI感兴趣的小伙伴添加小助手微信kaiwu_club,说明身份即可加入