寒武纪官网网址:https://www.cambricon.com/
北京
北京市海淀区知春路七号致真大厦D座11、13、16层
上海
上海市浦东新区祖冲之路2290弄1号1103-09、1804-06、2102B
上海市浦东新区海港大道1555号T1塔楼9层901-903
深圳
广东省深圳市南山区南头街道桃园路8号田厦金牛广场A座3404-3410
合肥
安徽省合肥市高新区习友路3333号中国声谷A1栋22层
西安
陕西省西安市沣东新城镐京大道与汉池一路交界口沣悦云创中心3号写字楼26层
陕西省西安市雁塔区沣惠南路34号新长安广场二期C座2401-2402
昆山
江苏省昆山市玉山镇元丰路232号机器人产业园孵化器大楼6楼
南京
江苏省南京市江宁区创研路266号A5栋606、607、610、611
思元370系列
MLU370-S4/S8智能加速卡
MLU370-X4智能加速卡
MLU370-X8智能加速卡
思元290
MLU290-M5智能加速卡
思元270系列
MLU270-S4智能加速卡
MLU270-F4智能加速卡
玄思1000智能加速器整机
智能边缘计算模组
思元220系列
MLU220-SOM智能模组
MLU220-M.2边缘端智能加速卡
终端智能处理器IP
Cambricon-1M
Cambricon-1H
软件开发平台
Cambricon NeuWare
MagicMind
寒武纪
寒武纪成立于2016年,专注于人工智能芯片产品的研发与技术创新,
致力于打造人工智能领域的核心处理器芯片,让机器更好地理解和服务人类。
寒武纪提供云边端一体、软硬件协同、训练推理融合、具备统一生态的系列化智能芯片产品和平台化基础系统软件。寒武纪产品广泛应用于服务器厂商和产业公司,面向互联网、金融、交通、能源、电力和制造等领域的复杂 AI 应用场景提供充裕算力,推动人工智能赋能产业升级。
中科寒武纪科技股份有限公司简介
一、公司概况
1.1 发展历程
中科寒武纪科技股份有限公司于 2016 年 3 月 15 日正式成立,其名字 Cambricon 由 Cambrian(寒武纪)和 Silicon(硅)巧妙组合而成,寓意着公司在半导体领域如同寒武纪生命大爆发一般,开创出全新的智能芯片时代。公司创立之初,便汇聚了一批来自中科院计算所等科研机构的***人才,他们怀揣着对人工智能芯片技术的执着追求与创新精神,为公司的发展奠定了坚实的技术基础。
2017 年,寒武纪推出了具有里程碑意义的首款产品 —— 寒武纪 1A,这是一款专为边缘计算设计的 AI 芯片。该产品凭借其在低功耗与高性能计算方面的出色表现,迅速在科技领域引起广泛关注,不仅证明了寒武纪在芯片设计领域的技术实力,更为公司赢得了宝贵的市场认可和资金支持。截至 2018 年底,寒武纪成功完成 D 轮融资,融资金额高达约 1 亿美元,吸引了阿里巴巴集团、小米科技等知名企业的参与,这些战略投资者的加入,为寒武纪的后续发展注入了强大动力,助力公司进一步加大研发投入,拓展业务版图。
2020 年 7 月,寒武纪成功登陆上海证券交易所科创板,首次公开发行股票募集资金约 25.82 亿元。此次上市标志着寒武纪迈入了新的发展阶段,在资本市场的助力下,公司得以进一步提升品牌影响力,加快技术创新与产品迭代的步伐,为推动国产 AI 芯片产业的发展发挥更大的***作用。
上市后的寒武纪持续在技术研发与产品创新方面发力。2021 年,公司营业收入达到 1.5 亿元,同比增长 70%,这一显著增长得益于其与华为、阿里云等科技巨头的紧密合作,寒武纪的芯片产品被广泛应用于合作伙伴的 AI 解决方案中,市场份额稳步扩大。2022 年,尽管面临全球半导体市场的诸多挑战,寒武纪依然坚定地投入约 5 亿元用于研发,占当年总营收的近 33%。如此高额的研发投入,充分彰显了公司对技术创新的高度重视,也为后续新产品的推出和技术突破奠定了坚实基础。
2023 年,寒武纪发布了思元 270(MLU270)芯片,这款芯片专为高性能 AI 计算工作负载设计,具备高达 80 TOPS(每秒万亿次操作)的强大处理能力,同时在能源效率方面取得了显著提升,相比前代产品,能够以更低的功耗实现更高的计算性能,为数据中心、云计算等领域的 AI 应用提供了更为高效、节能的解决方案。
进入 2024 年,随着 AI 技术的迅猛发展和市场需求的持续增长,寒武纪积***把握机遇,不断优化产品结构,拓展市场渠道。公司的营业收入实现了进一步增长,达到 11.74 亿元,亏损幅度收窄至 4.57 亿元,展现出良好的发展态势。同时,寒武纪在技术创新方面也取得了多项重要成果,其研发的新一代芯片架构在性能和能效比上实现了重大突破,为公司未来的产品布局和市场竞争提供了有力支撑。
2025 年,寒武纪迎来了更为强劲的发展势头。一季度营收飙升至 11.11 亿,同比增长高达 42 倍,成功实现扭亏为盈。这一优异成绩的取得,得益于公司在产品研发、市场拓展以及行业生态建设等方面的全面发力。在产品端,寒武纪持续推出性能***的新产品,满足不同客户群体的多样化需求;在市场方面,公司积***与各行业头部企业展开深度合作,不断扩大市场份额;在行业生态建设上,寒武纪大力推动软件平台和开发工具的优化升级,吸引了更多开发者和合作伙伴加入其生态系统,进一步巩固了公司在 AI 芯片领域的***地位。同年,公司预计发布思元 690 芯片,该芯片将应用于训推一体场景,有望再次***行业技术发展潮流,为公司的持续增长注入新的强大动力。
1.2 股权结构与公司治理
寒武纪的股权结构较为多元化,截至 [***日期],公司的主要股东包括 [列举主要股东及其持股比例]。这些股东涵盖了投资机构、科技企业以及公司核心团队成员等,多元化的股权结构为公司带来了丰富的资源和战略支持。投资机构凭借其专业的投资眼光和广泛的行业资源,为公司的发展提供了资金保障和战略指导;科技企业股东则通过与寒武纪的业务协同,助力公司产品在不同应用场景中的推广与落地;而公司核心团队成员作为重要股东,对公司的长期发展战略和技术创新方向有着深刻的理解和坚定的执行力,确保公司始终保持在技术前沿和市场竞争的优势地位。
在公司治理方面,寒武纪建立了完善的现代企业制度,拥有健全的董事会、监事会以及管理层架构。董事会由多位行业资深专家、投资界专业人士和公司内部核心高管组成,他们凭借丰富的经验和***的专业能力,为公司的重大战略决策提供了全面、科学的指导。董事会下设多个专门委员会,如战略委员会、审计委员会、薪酬与考核委员会等,各委员会各司其职,相互协作,确保公司的决策机制科学高效,风险管控严格到位,激励机制合理有效。
监事会则严格履行监督职责,对公司的财务状况、内部控制以及管理层的履职情况进行全面监督,保障公司的运营合规合法,维护股东的合法权益。管理层团队由一批在半导体、人工智能等领域具有丰富实践经验的专业人士组成,他们负责公司日常运营的具体执行,积***落实董事会制定的战略规划,推动公司各项业务的稳步发展。在公司治理过程中,寒武纪始终秉持透明、公正、高效的原则,不断优化治理结构,提升治理水平,为公司的长期稳定发展奠定了坚实基础。
二、技术研发
2.1 核心技术团队
寒武纪拥有一支堪称豪华的核心技术团队,团队成员大多来自中科院计算所、清华大学、北京大学等国内***科研机构和高校,以及英伟达(NVIDIA)、英特尔(Intel)等国际知名半导体企业,具备深厚的学术背景和丰富的行业实践经验。团队核心成员在人工智能芯片领域的平均从业年限超过 10 年,对行业发展趋势有着敏锐的洞察力和精准的判断力。
***人兼 CEO 陈天石,毕业于中国科学技术大学计算机科学与技术学院,后在中国科学院计算技术研究所获得博士学位。在创立寒武纪之前,陈天石长期专注于人工智能芯片技术的研究,在相关领域取得了一系列具有国际影响力的科研成果。他带领团队成功研发了寒武纪系列智能芯片,凭借其在技术创新和企业管理方面的***才能,成为推动国产 AI 芯片产业发展的领军人物。
***技术官(CTO)[CTO 姓名],曾在英伟达担任***技术专家,拥有超过 15 年的 GPU 研发经验。他在图形处理、并行计算以及人工智能算法优化等方面造诣深厚,加入寒武纪后,主导了公司芯片架构的设计与优化工作,将国际先进的技术理念与国内市场需求相结合,为寒武纪芯片产品的高性能、低功耗特性提供了强有力的技术保障。
此外,公司的技术团队还涵盖了芯片设计、算法优化、软件开发、系统集成等多个领域的专业人才。他们在各自的专业领域深耕细作,相互协作,形成了强大的技术创新合力。例如,芯片设计团队专注于芯片架构设计、电路设计、版图设计等关键环节,运用先进的设计工具和技术,不断提升芯片的性能和集成度;算法优化团队则致力于针对不同的人工智能算法,对芯片进行针对性的优化,充分发挥芯片的计算能力,提高算法的执行效率;软件开发团队负责开发与芯片配套的软件平台和开发工具,为开发者提供便捷、高效的编程环境,推动芯片在不同应用场景中的广泛应用;系统集成团队则将芯片与其他硬件设备、软件系统进行有机整合,为客户提供完整的解决方案,确保产品的稳定性和可靠性。
2.2 研发投入与成果
自成立以来,寒武纪始终将技术研发视为公司发展的核心驱动力,持续保持高额的研发投入。从 2016 年至 2024 年,公司累计研发投入超过 [X] 亿元,占同期营业收入的比重高达 [X]%。在 2022 年,尽管全球半导体市场面临诸多挑战,公司依然坚定地投入约 5 亿元用于研发,占当年总营收的近 33%;2023 年,研发投入进一步增长至 [具体金额] 亿元,占营收比重为 [X]%。如此高额且持续增长的研发投入,在国内同行业中处于***水平,充分彰显了公司对技术创新的高度重视和坚定决心。
在强大的研发投入支持下,寒武纪取得了丰硕的研发成果。在芯片架构设计方面,公司自主研发了高效的 MLU Core 架构,该架构针对人工智能算法的计算特性和访存特性进行了深度优化,采用了独特的指令集、流水线设计以及运算部件和访存部件,能够在大幅提升计算性能的同时,有效降低芯片功耗。基于 MLU Core 架构,寒武纪先后推出了一系列性能***的智能芯片产品,如寒武纪 1A、1H、1M 系列终端智能处理器 IP,思元 100、270、290、370、590 系列云端智能加速卡芯片,以及思元 220 边缘智能加速卡芯片等,这些产品在市场上获得了广泛认可,被众多行业客户应用于实际业务场景中。
在软件平台方面,寒武纪开发了统一的平台级基础系统软件 Cambricon Neuware,该软件栈涵盖了软件开发工具链、人工智能计算库、通信库、推理引擎等多个关键组件,为开发者提供了一站式的开发解决方案。其中,Cambricon BANG 异构计算平台的核心组件 —— 面向 MLU 硬件的编译器工具链,支持通过 C/C++ 的扩展语言 Cambricon BANG C 和基于 Python 的扩展语言 Cambricon BANGPy 对 MLU 硬件进行编程,***大地提高了开发效率和灵活性。同时,寒武纪还积***与主流人工智能框架进行深度适配,如 PyTorch、TensorFlow 等,使得开发者能够轻松地将现有的 AI 模型迁移到寒武纪的芯片平台上运行,进一步推动了公司产品在人工智能领域的广泛应用。
截至 2024 年底,寒武纪已累计申请专利超过 [X] 项,其中发明专利占比超过 [X]%,涵盖了芯片设计、算法优化、软件平台等多个关键技术领域。公司还参与制定了多项人工智能芯片领域的国家和行业标准,为推动行业的规范化发展做出了重要贡献。此外,寒武纪的技术成果多次获得***和省部级科技奖项,如 [列举重要奖项名称],这些荣誉不仅是对公司技术实力的高度认可,也进一步提升了公司在行业内的知名度和影响力。
2.3 技术创新与行业影响力
寒武纪在技术创新方面始终走在行业前列,不断推出具有创新性的技术和产品,***人工智能芯片行业的发展潮流。例如,在芯片制程工艺方面,公司积***跟进先进制程技术,与全球***的晶圆代工厂保持紧密合作,确保公司芯片产品能够采用***先进的制程工艺,提升芯片的性能和集成度。在思元 370 芯片中,寒武纪采用了台积电 7nm 制程工艺,使得芯片在有限的面积内集成了更多的晶体管,从而实现了更高的计算性能和更低的功耗。
在芯片架构创新方面,寒武纪提出了 “训推一体” 的芯片架构理念,打破了传统训练芯片和推理芯片在架构设计上的界限,使得同一颗芯片能够同时高效地支持人工智能模型的训练和推理任务。这一创新架构不仅降低了客户的硬件采购成本和系统复杂度,还提高了芯片的通用性和灵活性,为人工智能技术的广泛应用提供了更为便捷、高效的解决方案。基于 “训推一体” 架构的思元 370、590 等芯片产品,在市场上取得了巨大成功,被众多数据中心、云计算企业以及科研机构广泛采用。
此外,寒武纪在人工智能算法优化、芯片与软件协同设计等方面也取得了一系列创新性成果。公司的算法团队深入研究各类人工智能算法,针对不同算法的特点对芯片进行针对性优化,充分发挥芯片的计算***,提高算法的执行效率。同时,寒武纪注重芯片与软件的协同设计,通过优化软件平台与芯片硬件之间的交互接口和数据传输机制,实现了软硬件的深度融合,进一步提升了系统的整体性能。
寒武纪的技术创新成果不仅在国内得到了广泛应用和认可,在国际上也产生了重要影响。公司多次受邀在国际***学术会议和行业论坛上发表演讲,分享其在人工智能芯片领域的***研究成果和技术创新经验,与国际同行展开深入交流与合作。寒武纪的产品和技术还被国际知名科技媒体广泛报道,如《自然》(Nature)、《科学》(Science)、《连线》(Wired)等,进一步提升了公司在国际上的知名度和影响力。作为国产 AI 芯片的领军企业,寒武纪的技术创新实践为推动全球人工智能芯片技术的发展做出了积***贡献,也为国内其他企业在技术创新方面树立了榜样。
三、产品体系
3.1 云端智能加速卡系列
寒武纪的云端智能加速卡系列产品是其核心业务之一,该系列产品基于公司自主研发的思元系列芯片,为数据中心、云计算等领域的人工智能应用提供了强大的计算支持。目前,寒武纪已推出了思元 100、思元 270、思元 290、思元 370、思元 590 等多款云端智能加速卡产品,涵盖了不同性能级别和应用场景,能够满足客户多样化的需求。
思元 100 智能加速卡是寒武纪推出的首款云端智能加速卡产品,基于寒武纪自主研发的***代人工智能芯片架构,采用 16nm 制程工艺。该加速卡主要面向深度学习推理应用场景,在自然语言处理、计算机视觉等领域表现出色。思元 100 加速卡支持多种主流深度学习框架,如 TensorFlow、PyTorch 等,能够为用户提供高效、便捷的推理服务。在性能方面,思元 100 加速卡在 INT8 精度下的计算性能达到 16 TOPS,内存带宽为 51.2GB/s,能够满足大部分中小企业在深度学习推理方面的需求。
思元 270 智能加速卡是寒武纪在云端智能加速卡领域的又一重要产品,基于第二代人工智能芯片架构,采用 7nm 制程工艺。该加速卡不仅在推理性能上有了显著提升,还具备一定的训练能力,实现了从单一推理向训推一体的跨越。在推理方面,思元 270 加速卡在 INT8 精度下的计算性能高达 80 TOPS,相比思元 100 提升了 5 倍之多;在训练方面,该加速卡在 FP16 精度下的计算性能达到 25.6 TFLOPS,能够支持一些小型深度学习模型的训练任务。此外,思元 270 加速卡还在内存带宽、功耗等方面进行了优化,内存带宽提升至 128GB/s,整卡功耗仅为 110W,在提供强大计算性能的同时,***了较高的能源效率。
思元 290 智能加速卡则是寒武纪针对大规模深度学习训练任务推出的高端产品,同样基于 7nm 制程工艺和第二代人工智能芯片架构。该加速卡采用了先进的 HBM2 高带宽内存技术,内存容量高达 32GB,内存带宽达到 1.2TB/s,为大规模数据处理和复杂模型训练提供了充足的内存支持。在计算性能方面,思元 290 加速卡在 FP16 精度下的计算性能高达 512 TFLOPS,能够高效地支持超大规模深度学习模型的训练任务,如大规模图像识别、语音识别、自然语言处理等领域的训练应用。同时,思元 290 加速卡还支持多卡互联,通过寒武纪自主研发的 MLU-Link 高速互联技术,可实现多卡之间的高速数据传输和协同计算,进一步提升集群计算性能,满足数据中心等大规模应用场景的需求。
思元 370 智能加速卡是寒武纪推出的新一代训推一体智能加速卡,基于第三代人工智能芯片架构 MLUarch03,采用 7nm 制程工艺。该加速卡在性能、能效比以及功能特性等方面都实现了全面升级。在计算性能上,思元 370 加速卡在多种数据格式下均表现出色,FP32 峰值性能为 16TFlops,FP16、BF16 峰值性能均为 48TFlops,INT16 峰值性能为 64Tops,INT8 峰值性能为 128Tops,INT4 峰值性能为 256Tops,能够满足不同类型人工智能应用对计算精度的多样化需求。在内存方面,思元 370 加速卡集成了 24GB LPDDR5 内存,内存带宽达到 307.2GB/s,为数据的快速读写提供了保障。此外,思元 370 加速卡还在视频编解码能力上进行了大幅提升,***高可支持至 8K 视频编解码,能够同时处理 132 路 HEVC 全高清视频解码或 24 路 HEVC 全高清视频编码,以及 4000 Frames/s 的全高清图片解码和 3000 Frames/s 的全高清图片编码,在视频分析、图像识别等领域具有明显优势。
思元 590 智能加速卡是寒武纪目前性能***为强大的云端智能加速卡产品,基于先进的芯片架构和制程工艺打造而成。该加速卡主要面向超大规模人工智能模型训练和复杂的科学计算等高端应用场景,在计算性能、内存容量和带宽等方面均达到了行业***水平。具体性能参数方面,思元 590 加速卡在 FP32 精度下的计算性能高达 [X] TFLOPS,FP16、BF16 精度下的计算性能更是分别突破 [X] TFLO



