解读华为麒麟950实力几何不吹不黑。

IT168评测本月初,华为在北京召开媒体沟通会。在30多家媒体的见证下,传闻已久的麒麟950 SOC芯片正式发布。同时,现场还放置了麒麟950开发板,供媒体体验。而我们的IT168手机频道编辑也出席了现场体验。在之前的文章中,我们也对麒麟950的初期体验做了一个简单的总结:1。表演真的很厉害。2.封装面积进一步减小。3.真的不热。距离麒麟950发布已经超过10天。目前网上对麒麟950的真实性能众说纷纭。有人说这是中国人的骄傲,有人说麒麟950分分钟就要被砸成渣。今天我们IT168手机频道就根据沟通会上给出的数据,以及会后的采访,总结一下麒麟950是一款怎样的产品。

1的性能在很多方面都有提高。我们知道,SOC不仅包括我们通常所说的CPU,还集成了GPU、调制解调器、ISP、DSP等组件。我们需要承认,SOC是实力的象征。目前业内能推出移动SOC芯片的厂商并不多,华为是少数几个一直坚持SOC路线的厂商。在本次沟通会的最后,华为还发布了麒麟950 SOC的架构图。如下所示:

通过架构图,虽然华为没有给出图例,但是我们也可以看出架构中蓝色部分是麒麟950新升级的部分,而灰色部分是麒麟芯片之前一直使用的架构。新升级的部分包括:CPU、协处理器、GPU、ISP、DSP、内存控制器。其中CPU和GPU的升级基本沿用了ARM的公开设计,而ISP的设计,比如更多的是华为自主研发的成果。看到这张图,想必关注华为的朋友和笔者都有一个共同的疑问——为什么——Modem没有升级?华为之前在麒麟920上使用了第一个商用的CAT 6调制解调器,但是为什么时隔一年半之后,却没有像高通、三星一样为我们带来全新的下行CAT12/上行CAT13的调制解调器?关于这个问题,华为相关人员也给出了答案,在我们的文章后面会详细说明。

2A72更适合手机?目前已经商用的旗舰SOC芯片基本只有三款:高通骁龙810、三星Exynos7422和苹果A9/A9X。前两个模型采用大的。A57+A53的小架构。很多业内人士也清楚,ARM推出A57的初衷并不是将其应用于智能手机,而是利用A57架构打造一款高性能低功耗的服务器级处理器。去年年初,ARM也推出了代号为“西雅图”的基于28nm制程工艺的A57架构服务器处理器。大家都知道智能手机行业还处在一个“硬件为王”的时代。再加上三星在14nm FinFET工艺上的成功,基于A57的手机处理器也如鱼得水,随后高通迅速推出基于20nm工艺的骁龙810与之对抗。但是A57真的适合智能手机吗?在这个问题上,每个人都有不同的看法。在上半年的麒麟935沟通会上,华为也对此发表了看法。

经过测试,在28nm制程工艺下,A57架构核心的性能比A53架构核心提升了56%,而功耗是后者的256%。在20nm的传统工艺下,性能和功耗的不对等比例并没有得到很好的改变,所以华为得出结论,A57并不适合当时传统工艺下对续航发热越来越敏感的消费者。当时ARM发布了全新的A72架构,样片基于全新的16nm FinFET工艺,热效率非常出色。所以华为最终跳过A57架构,直接开发A72架构SOC。(事实上,海斯早已获得A57架构授权,并于去年9月与台积电联合开发了基于16nm FinFET工艺的网络处理器芯片。)

海思推出基于A72架构的麒麟950也是业界首批基于A72架构的智能手机SOC(在高通推出骁龙620/618之前,高通最近展示了基于骁龙618的网络摄像头)。相信大家对A72架构SOC的特性和性能还是有些陌生的。笔者在这里简单给大家介绍一下:

性能方面,ARM官方宣称A72架构的核心性能是A15架构的3.5倍(数据基于16nm FinFET工艺A72对28nm传统工艺A15)。与A15相比,A57的架构性能提升了1.9倍(数据基于20nm传统工艺A57对比28nm传统工艺A15),由此可见,A57的架构性能相比同频率同工艺的A72的核心性能应该提升了25%到35%左右。对了,之前ARM官方宣称A72架构的酷睿处理器已经可以做到PC级别的CPU性能,我想大家不会真的用手机处理器去对比酷睿i7。不过接近早期酷睿处理器的性能还是合适的。

工艺方面,麒麟950采用了台积电16nm FinFET+工艺。作为台积电16nm FinFET工艺的首批用户,华为海思参与了从研发到晶圆生产再到量产的全过程。官方宣称是第一次在PDK建模、EDA、Lib/IP设计、SoC集成、验证最新工艺的全过程与台积电同步,这意味着麒麟950基本上是用台积电的16nm工艺优化而诞生的。官方宣称麒麟950从15年8月开始稳定量产。所以即将发布的华为Mate 8基本不会因为SoC供应不足而缺货。

FinFET工艺诞生于20世纪90年代,当时美国政府认为有必要研究25nm以下的工艺。由于传统工艺栅栏在进入25nm以下时无法有效控制漏率,美籍华人胡正明提出了FinFET技术和FD-SOI技术来解决漏率问题。其中FinFET技术通过修改删除列的形式来控制漏电。实际上芯片的总功耗是P=Pswitch(接通电路时的功耗)+Pshort(删除开关时的功耗)+Pleak(泄漏功耗)。高通骁龙810之所以会在运行过程中出现降频甚至关核的问题,很大程度上是因为泄漏功耗高,导致整体功耗高。甚至整机功耗超过4W,这种情况时有发生。因此,很多人认为骁龙810降频是为了降低温度。其实根本问题是20nm的传统工艺已经无法控制A57架构漏电带来的超高功耗。因此,在新一代SOC芯片中,高通也采用了FinFET技术。想了解更多关于FinFET的故事,可以点击上面麒麟团队为胡正明教授拍摄的宣传片。(PS教授。胡正明还长期担任台积电的CTO)。总体来看,ARM官方宣称基于16nm FinFET工艺的A72核心比28nm的A15下降了75%,也比20nm的A57下降了50%。使用大的。小的大的小的核心架构会更省电。这一切的功劳很大程度上归功于FinFET工艺的成熟。

除了CPU性能提升和功耗降低,A72架构还有另外两个特点。其中,CoreLink CCI-500是新增的。CoreLink CCI-500最大的变化是增加了一个“窥探过滤器”,使窥探控制不再局限于单个集群内的CPU,而是可以扩展到整个处理器的所有内核。此前,这一特性仅体现在高通骁龙805及其后续旗舰SoC芯片中(高通采用自研CCI,而非公版ARM)。总的来说,CCI-500的加入可以提升30%的内存性能,让很多需要大内存吞吐量的场景,比如4K视频,体验更好,进一步解放多核性能。但是通过麒麟950的架构图,我们可以看到Cache连贯互联是灰色的。换句话说,麒麟950仍然采用上一代CCI-400规格。搭载CCI-500失败也让麒麟950 SoC有点遗憾。

我们要明白,华为麒麟走的公开设计道路,意味着处理器性能优势更多取决于生产周期。当更多A72公开设计芯片推出时,麒麟950的优势将不复存在。相比之下,高通一直采用公版+修改的模式,效果显著。在骁龙810上采用公版设计后,在骁龙820上再次回归Kryo架构。就连一直是公版粉丝的三星Exynos也在全新的Exynos 8890上采用了独立架构模式。看来微电子和半导体领域的差异化竞争也很激烈。虽然可以预测麒麟950的处理器性能优势将在未来3到6个月内逐渐消失,但总体来看,无论是CPU性能还是热效率,麒麟950都是目前智能手机SoC中的佼佼者。这是毫无疑问的。

3没有火力全开的GPU?前面我们说过,随着A72架构的诞生,ARM也带来了两个新特性,一个是麒麟950未能使用的CCI-500,另一个是全新的Mali-T880 GPU显示核心。在这次沟通会上,华为毫不避讳地表示,之前自己的产品在GPU性能上并不出色。值得很多经常讲秒秒宇宙的行业厂商学习。事实上,Mali-T880是ARM去年年底推出的Mali-T800系列GPU的最新产品,也是目前ARM最高端的GPU显示核心。根据ARM官方给出的数据,Mali-T880可以达到1700Mtri/S和13.6 gpix/s的像素填充速度..这两个数据是ARM顶级GPU核心T760的1.3倍。不过值得注意的是,这个数据是基于16核,850MHz频率的Mali-T880mp16测试的。是的,你没有看错。Mali-T880可以做到MP16。

这一次麒麟950没有采用ARM官方疯狂的Mali-T880 MP16,而是奉行高频少核的策略,采用了主频900MHz的Mali-T880 MP4四核GPU显示模块。主要是为了减少晶体管数量、SoC封装面积和功耗。相比之下,三星全新的Exynos 8890采用了Mali-T880 MP12的设计。麒麟950的沟通会上也给出了几个测试数据。结合现有旗舰SoC,我们还画了一张表,看看Mali-T880 MP4@900MHz的实力。

从表格中我们可以看到,麒麟950的显示性能相比之前的麒麟935有了很大的进步,也在联发科旗舰SoC的性能之上。但相比骁龙810和三星Exynos7420,性能处于持平状态。如果高通和三星给出的数据相差不是太大,麒麟950的显示性能应该不如骁龙820的Adreno530和Exynos8890的Mali-T880 MP12。但考虑到后两种机型近期不太可能量产销售,GPU也面临着和CPU一样的情况——优势只能维持3到6个月左右。

在显示性能部分,笔者想说,单纯通过测试软件评分来比较麒麟950、高通820和三星Exynos8890是片面的。GPU性能不是一个意外事件,而是和CPU操作一样的连续事件。如何保证GPU长时间高频率运行,才能最终提升游戏和应用体验。在这一点上,高频少核的战略优势很明显。GPU可以在更长的时间内保持在功耗阈值内,因此它可以在更高的频率下运行更多的时间。以上都是笔者基于该理论推测的结果。到底是不是真的,还需要拿到真机后才能检验。

同时,沟通会还提到了华为在应用层面对GPU的优化。增加了智能Boost、最优能耗比调度、Android框架的定制化改进、性能敏感场景的预处理、Xsync、SKIA算法硬化和ART优化编译,统称为启发式智能调度算法。简单来说就是提高应用的启动速度,提高日常操作的流畅度。不知道大家有没有注意到,在两年前安卓还不是很流畅的时候,搭载同样硬件的Windows Phone 7手机能够在流畅度上超越安卓,就归功于智能预处理。华为也给出了相关数据:128常用软件中,麒麟950的平均启动速度超过iPhone6s使用的A9处理器。

4自研图像ISP事实上,华为手机在图像算法行业处于领先水平。之前的功能比如超级微距,双摄像头,流光快门等。也让用户真正体验到不同于其他家的拍照体验。不过从画质上来说,华为产品在目前的旗舰智能手机中确实排不上号。原因有很多,比如片面追求超薄导致镜头厚度压缩,降低了画质和对焦速度等等。这些都是市场化的偏差。华为海思能做的就是自主研发,集成ISP。麒麟950还搭载了华为自主研发的全新集成图像ISP核心。

其实图像ISP集成或者外挂的话题已经持续好几年了。随着集成ISP更强大的性能和更低的功耗,它逐渐取代外部ISP。目前,高通在集成图像ISP领域应该处于领先地位,不仅是在像素吞吐量方面,在显示特性、虚拟现实和增强现实领域也是如此。麒麟950的图像ISP华为官方也给出了相关数据:双核14 bit+960 MP/s的像素渲染速度。

你可能对这组数据没那么敏感。笔者简单解释一下,14bit指的是色彩深度,即能显示色彩的细微变化。目前单反相机也使用14bit的色深。而960MP/s指的是像素渲染速度。以4K 60FPS为例,ISP一秒至少需要处理3840*2160*60像素。通过对比高通骁龙现有的ISP 810可以看出,麒麟950和810基本处于同一水平。可以说麒麟950的集成ISP起点还是很高的。沟通会上,华为海思还介绍了麒麟950的ISP团队。当然,目前麒麟950的图像ISP主要是提高图像质量,增强4K视频的录制和播放能力,还没有涉及到虚拟现实、增强现实等图像处理领域。

5性能脱离图表的i5协处理器如今,更多的厂商和消费者都在关注智能手机性能的推出,简单的能量守恒定律也告诉我们,高性能必然导致高发热和高能耗。也就是说,当厂商突破功耗底线后,基本可以通过堆叠实现高性能。相反,如何用更少的电做更多的事,才是真正考验一个半导体公司和智能手机厂商实力的地方。在麒麟950沟通会上,华为海思也提到,在950上,更多考虑的是1%电量可以做什么,随之而来的是加入了全新的i5协处理器。

麒麟950上的i5协处理器基于Cortex-M7架构。相比麒麟935上的i3协处理器的Cortex-M3架构,它有FPU和Cache,最重要的一点是可以将待机功耗从90mA降低到6.5mA,举个简单的例子,一个1080P的屏幕最低亮度待机功耗约为90mA。待机功耗6.5mA,3500mAh电池可运行500小时。同时,高性能的Cortex-M7还充当了传感器Hub的功能,可以实时处理各个传感器的信息。再比如,6.5mA的功耗可以在不知不觉中记录你一天的路线图,可以监控你的行走速度等等。,为智慧健康提供越来越精准的数据。可以说麒麟950目前在协处理器性能和功耗方面都是业界领先的。

6现代传统优势不再?前面说过,调制解调器一直是华为的核心竞争力。此前,麒麟920也是首款商用CAT 6 LTE的智能手机芯片。在麒麟950上,一般认为华为海思会集成更强大的调制解调器模块,使其符合目前业界领先的下行CAT12/上行CAT13规格。令人惊讶的是,麒麟950并没有对调制解调器进行创新。有人说华为的传统网络优势已经被超越。是这样吗?在体验会上,上海思也对此进行了解读。

首先,在与麒麟950同期举办的2015全球移动宽带论坛上,华为展示了最新一代终端芯片解决方案Balong 750。Balong 750是业界首款支持CAT12(DL)/CAT13(UL),支持2C载波聚合和4*4 MU-MIMO技术,或支持4CCA的通信芯片。换句话说,Balong 750是唯一支持4CCA的基带芯片。所以麒麟在网络优势上还是领先业界的。但与此同时,华为海思也注意到,CAT6将在很长一段时间内成为运营商的主流规范,而对于载波聚合,大约20个频段的两两组合或两两组合需要单独测试,占用更多的手机空间。加入CAT12规范只会增加成本,增加未来很长一段时间手机设计的难度。所以麒麟950还是延续了之前的Modem模块。(PS的包装区。Balong750也是业界领先的。)

7总结自麒麟950发布以来,短短10天,关于麒麟950真实性能的讨论从未停止。至于它的计算性能,我们前面也总结过:麒麟950走的公开设计路径,意味着处理器性能优势更多的取决于生产周期。虽然麒麟950的计算性能很有可能在可预见的未来3到6个月被超越,但哪个半导体厂商的产品性能优势能持续6个月以上?无论麒麟950是否采用了公测设计,是否会在短时间内被其他厂商抄袭,毫无疑问,麒麟950的计算性能已经在2015达到了巅峰。?

对比它的计算性能,笔者想说,虽然它在ISP、GPU、Modem上也有提升,也可以看到华为一贯的中庸严谨的作风,但不可否认的是,在这些方面,麒麟950明显没有CPU计算性能提升的多。比如在ISP方面,虽然业界可以采用独立ISP的厂商毛峰焦玲,但是对于图像ISP的自主研发还是需要了解和积累的。显然一口吃不成大胖子,所以笔者也想借此机会给一些认为麒麟950秒,天,秒的发动机泼冷水。麒麟950有很多亮点,但也不是没有缺点。?

对于SOC背后隐藏的东西,华为没有说太多,比如VR,这是高通和三星的主要特色。对这些小特性的深入研究,也能给产品带来不同的差异化竞争力。如何利用现有的性能优势,创造更多行业领先的创新,是华为迫切需要解决的问题。华为海思也说过:微创新永远不可能成为一个技术驱动型厂商的核心竞争力。如何将自身优势最大化,创造引领行业的创新,是海思下一步要考虑的问题。我们在期待麒麟950最终产品问世的同时,也期待后续产品能带来不一样的东西。

8麒麟950 LPDDR3/4二合一的另一个小特点:麒麟950是目前为数不多的支持LPDDR3/4二合一内存控制器的SOC芯片。这也意味着麒麟950也将更多用于小内存1080P分辨率屏幕的中端机型。未来不仅有4000元档位的Mate 8,还有2000元甚至1500元档位的小钢炮产品。

全面进入VoLTE时代,带来“悦耳的声音”体验:众所周知,三大运营商都在逐步测试和尝试VoLTE技术的商用。VoLTE,顾名思义,是一种也可以在4G网络上承载的语音服务。不同于之前的CSFB,不会有语音网络回落找网络的尴尬,但也有比SGLTE功耗更低的优势。华为成为首批中国移动Volte认证厂商。华为还在自己的设备中加入了“殷悦”技术。传统GSM语音范围频谱扩展100%,采样率提高100%。也就是说通话的声音更加连续,声音层次感更加丰富。这项技术主要依靠4G更广的频谱,未来很可能会推广到更多的厂商。

9体验会很精彩Q &;问答环节的回顾,麒麟950体验会后的采访环节也是新闻不断。华为Fellow艾薇、华为终端有限公司手机产品线副总裁李小龙、台积电商业发展基金主任韦济世博士也回答了现场媒体的诸多敏感问题。在文章的最后,作者会对精彩的Q&进行总结;答.

问:华为会继续公版设计吗,比如华为会考虑优化高通和三星目前采用的公版架构的方式吗?

答:智能手机SOC仍将坚持公版设计,但也会布局优化的公版架构。

问:麒麟芯片后续布局如何?

答:所谓的麒麟960已经在研发中,麒麟970已经开始项目研究。(后续命名不一定是麒麟960/970。)

问:台积电16nm FinFET+工艺是否成熟,是否会出现产能不足的情况?

答:目前台积电16nm FinFET+工艺生产线有30多家客户,到16年底将超过100家客户。产量已经满足大规模生产的要求。而且16nm FinFET+工艺在很多方面与28nm、20nm的传统工艺相似。台积电在这两代工艺上都有相当的经验和产能,所以16nm FinFET+工艺不会耽误产品的整体产能。

问:相比三星的14nm FinFET工艺,台积电的16nm FinFET+有什么优势?目前苹果的A9/A9X处理器都是用这两个做代工。三星贴牌产品和台积电在性能和续航上的差异是什么原因造成的?

答:我们无法评价竞争对手的工艺,但还需要强调的是,台积电在研发16nm FinFET+工艺时发现,设计规则从28nm时的约10000改为约40000,还需要克服不稳定的硅纯度和样品污染带来的金属互连的不确定威胁。这也是台积电对其16纳米工艺充满信心的原因。

问:有传言称高通将在骁龙820上采用三星14nm FinFET工艺。台积电对这一传统客户的选择有什么看法?

答:无法评价高通选择了谁作为代工,但需要强调的是,高通仍然是台积电的重要客户,高通也越来越重视低端SOC的市场份额,这些芯片也在使用28nm台积电工艺。

问:关于即将发布的华为Mate 8,我有什么可以分享的?

答:我不能在这里分享Mate 8的所有信息,但我提醒您,本月26日将在上海举行新品发布会,希望您届时关注。