7月4日,百度创始人兼董事长李彦宏在Baidu Crea-te2018百度AI开发者大会上正式发布百度自研的中国第一款云端全功能AI芯片“昆仑”,其中包含训练芯片昆仑818-300,推理芯片昆仑818-100。 “市场上现有的解决方案和技术不能够满足其对AI算力的要求是百度决定自己研发芯片的原因,”据李彦宏介绍,“昆仑芯片的计算能力跟原来用FPGA做的芯片相比,计算能力有30倍左右的提升,可适用于语音、图像、自动驾驶等很多方面。”但南都记者在现场了解到,该款芯片目前仍在试生产中,具体量产时间表尚未可知。
无独有偶,手机厂商华为、美图,语音识别厂商出门问问、若琪都开始往上游芯片延伸。中美贸易争端之后,国产终端厂商们做芯片热情空前高涨。如同前几年互联网造车热,今年许多发布的芯片也被吐槽可能沦为“PPT芯片”。当然除了品牌需求,自己做芯片更多也是寻求性价比更高、或者竞争力更大的发展路线。
为什么大家都自己做芯片?
“百度大约从2011年起开始大规模地对AI技术进行投入,不断遇到各种各样的问题,也需要用创新的方法来解决,其中一个重要的问题,就是对算力的需求一直在提升。我们早期用的是CPU,后来开始用GPU,再往后用FPGA,端到端去做各种各样的优化,到2017年的时候,我们还是觉得这些市场上现有的解决方案和现有的技术不能够满足我们对A I算力的要求。”李彦宏如是表示。
无独有偶,在南都记者采访中,许多做芯片的厂商都表示主要是“(市场上)没有合适的芯片”。出门问问与若琪都选择与杭州国芯合作开发芯片。
此前云知声CEO黄伟说过“语音识别公司不自己做芯片死路一条”。而若琪CEO祝铭明也对这个观点表示赞同。“如果有别人做我们就用别人的了。”祝铭明说,大家都知道芯片利润率很低,做这个事情不赚钱。“有时候计算力不是越高越好,而是需要针对特定场景做特定优化,寻找性价比最高的方案。”
但实际上据业内人士透露,自主研发芯片并不是提高整体的计算力,而是对部分功能进行优化,与过去强调复杂运算的CPU不同,许多人工智能的应用,尤其是“学习”需要简单而大量地重复输入,这也是为什么“十项全能”的CPU之类的通用芯片在人工智能领域难以施展拳脚的原因。
出门问问同样研发了一款前端接收信息的芯片模块“问芯”。“打个比方,电视关机后同样离线语音唤醒。这解决了语音识别重要的痛点,”以及为什么其他厂商在已有通用芯片之外还需要一个前端信号芯片时,出门问问CEO李志飞解释说:“一是(通用芯片)贵,二是集成效果不好也不方便。(出门问问的)‘问芯’AI芯片模组直接可以用USB。”
而百度的“昆仑”则强调使用云端计算力。“这是中国第一款全功能的云端AI芯片,可适用于语音、图像、自动驾驶等很多方面,它的算力也非常强大,而且它是可编程的,也非常灵活。”
李彦宏还透露“昆仑芯片”的优势就在于“灵活可编程”:“这些芯片,和芯片之上的软件、开发框架、各种各样的应用一起构成了一个庞大的平台和生态系统”。
据南都记者了解,“昆仑”芯片可适配语音识别、图像优化、自动驾驶,目前还在试生产中,量产时间表尚不可知。
AI芯片那么好做吗?
从云知声、出门问问发布的时间表看,芯片从设计到量产都只有3年多时间,这与“一个芯片产业需要几十年技术沉淀”的普遍印象相差甚远。但实际上,芯片有很多种,生产方式与定义也都有所不同。
在去年9月发布首款人工智能手机芯片麒麟970后,高通相关人士曾告诉南都记者,AI的单元模块内置到芯片上并不是难事,高通之前就可以做。“所谓的AI芯片并不是独立的一块芯片,而是针对一些AI功能进行加速优化。”
“并不是需要专门做一块AI芯片,关键是释放更多计算资源跟其他模块去处理复杂场景。”今年初商汤与高通在创新视觉和基于摄像头图形处理等领域合作芯片优化,商汤CEO徐立告诉南都记者,软硬一体化开发是AI手机的趋势,关键是打破从芯片低端到终端应用之间的中间开发层(SDK)隔阂:“以前芯片层主要优化操作系统,但现在AI则要求芯片直接优化应用。”
这催生了两种AI芯片。一种就是类似于美图MT-AI图像处理芯片、出门问问“国芯”这一类前端处理芯片,用更小模块,更便宜、更低功耗的方案处理特定问题,一种即是在通用芯片上集成对一些具体功能加速的架构处理,比如百度这次发布的“昆仑芯片”。
“今天的芯片跟过去理解的芯片不大一样,”祝铭明说,今天做芯片并不需要花精力去做各类IP(知识产权)内核“现在讲SoC (集成电路芯片)新品,更多的是架构层面的优化,根据需求业务对IP进行组合优化。”
对于科技企业蜂拥做AI芯片的现象,驭势科技创始人兼CEO吴甘沙向南都记者表示,“一方面说明AI芯片的门槛比通用芯片门槛低,另一方面目前大多数都说可以做出来AI芯片,但能否用得好能不能大批量卖出去还有待时间验证。”