4月1号,作为中国最大的芯片IP设计与服务供应商,安谋科技一直坚持自研IP技术、Arm IP相配合,为本土半导体产业提供丰富的产品组合和解决方案。
目前,安谋科技在国内的授权客户已经超过370家,累计芯片出货量突破300亿颗,拉动下游年产值过万亿人民币。
安谋科技的自研产品线包括“周易”NPU、“星辰”CPU、“山海”SPU、“玲珑”ISP、“玲珑”VPU,在中国本土授权客户已超过160家,累计出货量突破2亿颗。
“周易”NPU已经在物联网、智能终端、汽车等市场均有实际落地,形成了一套完整的工具链及技术服务,可适配100多种算法。
现在,安谋科技又带来了自研的新一代AI处理器——“周易”X2 NPU。
“周易”X2 NPU不仅大幅提升算力、精度、灵活性等,还针对众多应用场景进行了专门优化,并且同步公布了开源计划。
【基于V3架构 性能全面提升】
“周易”X2 NPU采用了安谋科技自研的第三代“周易”架构,支持多核集群(Cluster),每四个核心一组,可以多个集群并联堆叠,最高支持320TOPS(每秒320万亿次运算)算力子系统。
同时,它还具备实时的硬件任务管理,可实现最高千万次/秒的任务调度,硬件任务调度延只需100ns,可充分利用多核心计算资源,释放各个计算单元的效能潜力。
算力大幅提升的同时,“周易”X2 NPU还支持更高的精度和灵活性。
精度方面支持int4/int8/int12/int16/int32,fp16/bf16/fp32等多精度整数、浮点融合计算,从而大大提升计算效率、计算密度。
灵活性方面不但支持自定义算子,可满足各种模型部署需求,还面向各类应用场景提供定制化AI解决方案,进一步满足智能驾驶、手机影像AI处理、人机交互等场景的差异化需求。
应用场景方面,“周易”X2 NPU针对车载智能座舱、ADAS(高级辅助自动驾驶)、边缘计算、台式机、智能手机、平板电脑等做了大量性能优化。
比如大幅提升手机拍照、录像时的高分辨率图像处理能力,比如提升Transformer等常用车载应用的性能,比如采用i-Tiling技术从而将带宽需求从40GB/s大幅减少到4GB/s。
为了帮助开发者更方便、快速地进行算法移植和调试,“周易”X2 NPU还提供了一套完善的人工智能软件开发平台,可以更好地满足开发者对性能调优、系统部署的需求。
作为Bit精度的软件仿真平台,它支持主流的人工智能框架,比如TensorFlow、Caffe、ONNX、PyTorch等模型,操作系统支持Android、Linux、RTOS、QNX等。
支持多种开放接口,支持用户模型和自定义算子等开发和调试。
支持丰富的调试工具,支持多种层次的开发和调试,满足高级开发者。
支持TVM、Arm NN的SoC异构计算,从而有效使用CPU、GPU、NPU等计算资源。
目前,安谋科技已经向客户正式交付“周易”X2 NPU,今年内就会有多款搭载“周易”X2 NPU的芯片产品面世。
【软件开源加速 携手共建生态】
就在最近,安谋科技还发起了“周易”NPU软件开源计划,通过开放源码满足客户更自主、更灵活的算法移植需求,与开发者、合作伙伴共同建设国内NPU产业生态。
率先对外开放是包括NPU中间表示层规范、模型解析器、模型优化器、驱动等,并提供免费的软件工具链,包括软件模拟器、调试器、C编译器。
目前,安谋科技已开源“周易”NPU软件工具Compass的前端,并在开源计划的第一阶段开放以下资源:
- Compass解析器:解析器源代码和中间层表示规范
- NPU Linux驱动:更容易在现有SoC上部署,并符合GPLv2协议
- Compass集成:提供“周易”NPU网络构造工具端到端验证环境
- 模型仓库:—已验证的开源NN模型,便于测试和快速上手
安谋科技已在代码托管平台Gitee、GitHub上建立“周易”NPU开源项目的开源库,后续还将逐步开放更多资源,例如模型优化器、模型量化、算子实现等的源代码。
“周易”NPU软件开源计划已吸引第一批合作伙伴“入驻”,其中不乏来自AIoT、智能汽车、智能操作系统等领域的明星企业。
值得一提的是,湖北芯擎科技宣布,旗下新一代智能座舱芯片“龍鷹一号”实现量产出货,搭载安谋科技自研“周易”NPU、Arm IP,在高性能算力、AI性能方面具有诸多创新。
“龍鷹一号”是首款国产车规级7nm智能座舱芯片,兼具高算力和高安全性,采用多核异构超大规模SoC设计,集成87层电路,拥有88颗亿晶体管。
它不但拥有CPU、GPU、可编程NPU内核,还拥有强大的VPU、ISP、DPU、DSP集群,并内置符合国密算法的信息安全引擎、符合ASIL-D标准的安全岛设计。
其中,安谋科技自研的“周易”NPU为其提供AI助力,可适配100多种算子、100多种模型,支持自定义算子开发,还通过微架构优化,在运行部分神经网络模型时,相同算力配置下AI性能提升一倍,更有安全扩展,能够有效保护芯片上的用户数据和AI算法,同时面向各类应用场景提供定制化AI解决方案。