打磨一颗AI“芯”_风闻
AIPharos月光社-AIPharos月光社官方账号-2020-01-17 10:55
文/杨健楷
人工智能正忙于跨界。
在去年一个世界级半导体大会上,我看到一个夸张的数字:中国现在做AI芯片的公司已经超过100家,看芯片的投资人已经快不够用了。
AI加上芯片,两个当下最时髦的概念触发了中国创投圈的集体想象。
英伟达在AI训练芯片领域一骑绝尘,股价扶摇直上,涨了十几倍。谷歌、华为、阿里等巨头忙着推出自家的AI芯片,以满足庞大的数据中心的算力需求。在巨头的火力尚未到达之前,高达万亿级别的物联网AI芯片,仍然是一块未被充分开垦的处女地。
估值急剧飙升的AI独角兽们,在算法日趋同质化,竞争日益激烈的背景下,争先恐后发布了自己的AI芯片,动辄称“自研”。而那些在消费电子时代大赚其钱的芯片设计厂商,好像没了动静,他们的动作,也不为人所注意。
声量的高低,是市场热度的一个明证,但或许并非长远实力的指向标。
在北京的冬天,我们采访了亿智电子创始人陈峰。这位在珠海已经工作二十年的芯片老兵,先后经历过炬力、全志两个芯片大厂的上市,后来凭借自己的经验踏上了AI芯片的“跨界之旅”。
亿智电子,这家公司如何在当下的环境里走出一条不一样的AI芯片之路?以下,是AIPharos月光社对陈峰的采访:
选择AI:一件“跟以前不一样的事”
#当初创业的时候,为何选定了AI芯片这个方向?
当时我们出来创业,确定了几点。首先,我们一定要做跟以前不一样的事情,但是不能做自己不擅长的事情。于是就确定了三个领域:人工智能、机器人和柔性屏。
在公司成立之前,已经出现了一个趋势:人工智能算法开始趋同,研发成本急剧下降。我们团队只能专注干一件事情,最后这个方向确定为人工智能。
我们16年出来做人工智能芯片时,AI芯片还不像现在这么热。从我们公司的名字“亿智”——亿万设备智能互联,就可以看出,我们一开始就是奔着人工智能来的。
#除了人工智能外的其他两个领域呢?
至于另外两个领域,我们分别投资了一家公司。也没什么协议,双方都很熟悉,我的“徒弟”想开公司,我很认可,那给钱、投资占股就好了。
#你们三位合伙人都是芯片公司出身,亿智是如何搭建算法团队的?
在北京招人工智能算法团队,也算机缘巧合。我有个同学在北京,他在做模式识别全球大赛上拿到了很好的名次,于是我找到他合作。现在,他是亿智的首席科学家,北京AI算法团队就是由他组建、领导的。
#创建亿智,为什么隔了近两年才对外融资?
我们一开始三个合伙人,自己掏钱出来创业,成立了亿智这家公司,每个月领1750块钱工资。17年年底,北极光创投投了我们天使轮。当时我们也没有什么融资的概念,在珠海的芯片公司里,我们也算为数不多的花VC钱的公司。
#作为一家AI芯片公司,亿智如何追平算法上的差距?
亿智交付的首先是一个通用的AI计算平台。这个平台上面不只是我们的算法,还可以支持第三方的。至于说怎么追平算法上的差距,应该说我们和算法商各有千秋。
对于算法能力比较弱的公司,在代理商去交付产品的时候,我们已经把算法搞好了,客户直接用就可以。对于算法能力很强的客户,他们会基于我们的平台去开发自己的算法。
顶级聪明的人,往往不来做芯片
#珠海的芯片设计产业为什么发展的这么好?
珠海的芯片设计业起步,比上海还要早大概十年,这个时间点特别好。90年代珠海是经济特区时,北上广深并没有现在这么强的吸引力。进入21世纪后,珠海并没有跟上北上广深的发展步伐,没有互联网产业来跟芯片业抢人才。
这群芯片老兵在在珠海扎根之后,大家都在珠海娶妻生子,人才流动性并不强,就形成了一个非常稳定的芯片研发团队。
#做一个成功的SoC级芯片,最需要什么?
应该说,做芯片这件事,就是靠不断地去磨,不断地去积累,因为这里面的工作其实挺枯燥的,不像大家想的那样。
芯片靠的不是说一个单兵有多强就够用,就是招50个顶级名校硕士、博士放一块,也不可能很快把一个芯片做得很稳定。
SoC级的芯片里面有很多IP,每一个IP都是一个小团队,有一些团队甚至会形成自己的黑话。要做成SoC芯片,每个团队之间都需要不断地去磨合试错。只有在大幅降低了沟通成本之后,才能把IP做好。
所以,并不是说找一帮聪明人就可以把SoC芯片给做了。反而是最聪明的人不来做芯片。
某顶级名校电子工程系出来的毕业生,找工作轻轻松松,轻而易举就可以在互联网公司拿高薪。而在互联网公司做软件开发、做算法,有点吃青春饭的感觉,因为老人的编程能力永远比不上年轻人的进步速度。
做芯片的学习曲线就不一样了,这个学习曲线非常长。二十年过去了,大陆能做SoC的也就是那几家。所以,当很多算法公司去做芯片时,他们会面临一个非常陡峭的学习曲线。
芯片这一行,最关键是IP化的能力
#相较于传统的芯片设计厂商,亿智在AI芯片领域的优势是什么?
我们的优势在于AI算法的IP化。
做一个芯片,不是说今天有需求马上做,那样肯定来不及。我们做一个芯片,研发至少需要18个月,做的是一两年之后的事情。
我们从16年就开始干这件事情,领先传统的应用处理器(AP)厂商一两年的时间。当他们开始做AI芯片的时候,会面临两个问题。第一,找不到合适的算法团队;第二,算法IP化的能力不强。在没形成一套方法论之前,算法IP化的每个环节都很容易耗费不少时间。如何少踩坑、或者说不踩坑,只有靠慢慢积累才能走出一条路来。
当传统厂商发现时间紧迫,必须买第三方IP加快研发节奏的时候,时间已经晚了。买了第三方IP,没有办法让客户在上面做快速二次开发,因为他们不懂IP,没办法支持算法移植开发,因而做出来的芯片可用性不强。
#IP对于AI芯片为什么这么重要?亿智的IP都是自己研发的么?
IP是我们最大的资产。除了CPU、GPU等少数IP外,绝大部分IP都是自己研发的。只有我们自己做出来IP,才能给别人一个好的开发环境,才能支持众多碎片化场景,应对100个、1000个客户的开发需求。
现在,有的公司用CPU也可以跑AI功能,然后号称自己是AI芯片。但我们要看实现一项AI功能,效率有没有发挥到极致?花100瓦的功耗用CPU算,那肯定没有实用性,光电费就要花不少钱。而仅仅是电费的花销,对于一个公司来说一个月可能相差数倍到数十倍不等。
举一个例子,对比一下两者的差别。在人脸检测和跟踪识别上,亿智的产品能做到每秒30帧,某厂商用CPU算是一秒一帧,而CPU计算的功耗是亿智芯片的5倍,这样算下来,计算一帧的功耗差别有150倍。通俗来讲,如果用后者的闸机产品过人脸,又慢又费电。
#自制IP的费用是比较高昂的,为什么不去买IP供应商提供的IP?
要是去买第三方的IP,这个IP一般是极其冗余的。
当市场竞争不激烈的时候,用户对功耗、性能等还不太敏感,先买IP的公司跑得快,但当很多公司买了一样的IP,产品的竞争力就要大打折扣。这个时候,就显示出了自制IP的必要性。自制IP的成本一定更高,但更能满足客户对功耗与性能平衡之间的需求。
我们自己设计IP的时候,性能不是越强越好,而应该是刚刚够用最好,千万不要over design(过度设计)。我们的最终目的,是做到最好的性价比。
IP研发要耗费很长时间。我们16年出来之后,花了整整三年时间去做全新的IP。要是偷别人的东西,芯片早就出来了。我们每个人都签了很严格的知识产权协议,员工每一行代码都不能用前公司的。如果被查到用原来的IP,麻烦就大了。
AI+芯片,还是芯片+AI?
#我们观察到,有很多AI芯片雷声大雨点小,落地的难点究竟在哪?
AI芯片有两条路线,一条是以算法为基础,“AI+芯片”,另一条是以芯片为基础,“芯片+AI”。两个背景不同的人群,完全不同的做事方法,都在跨界做AI芯片,但是市场上能够量产销售的SoC级芯片方案,寥寥无几。
一些公司通过购买人工智能IP的方式推出了AI芯片,但一年多的时间无法真正落地,其实就一个原因,可量产性。可量产性包括这么几个维度:算法二次开发复杂度、系统稳定性、生产良率、功耗。
比方说一些厂商用的协处理器方案,这意味着在一台机器里面,同时存在着两三个系统。系统越复杂,焊点越多,耦合越差,生产良率本来就比较低,生产出来死机的概率也会比较高。最后出了问题还不好解决,因为是多家公司做出来一个东西,扯皮是常有的事。而SoC方案比较起来就简单多了,因为不存在系统冲撞的问题。
#亿智对于市场策略有何考量?
短期来看,我们其实就一招:标准化人脸及人体相关的应用。
这样,客户就不用再自己去开发算法,我们都标准化了。对于其他非标准化的市场,我们提供一个平台级的开发环境,支持大客户在平台里面进行开发。
中长期来看,毫无疑问,我们一定要培育自己的算法生态。我们需要在深圳培育自己的算法方案商,而不是服务于传统AP厂商的应用级、产品级方案商。只有培育了数目众多的算法方案商,我们才能更好地服务非标应用领域,服务于极度碎片化的C端客户。
结语
AI芯片是一个好故事,但不全然关乎AI。
中兴事件之后,中国大陆对于半导体产业的反思一浪高过一浪,等到科创板开板,半导体板块的股票被视作“国之重器”,市场对于这个产业的公司,正在给予百倍的估值与殷切的期望。
但是,在这个高潮之前,中国半导体经历了长时期的低潮。人工智能的热度,芯片的热度,都是周期性的。人们的情绪在高亢与低落之间来回起伏,但无论人们的情绪如何,走向春天都需要漫长的艰苦跋涉。
我们期待着,像亿智电子这样的中国AI芯片公司,能够在未来扮演更重要的角色。