S-四川 
选品,找货,一搜全有

上海天数智芯半导体有限公司(天数智芯 官网网址)

品牌代理信息

联系信息

上海天数智芯半导体有限公司(天数智芯 官网网址) https://www.iluvatar.com/

上海地址

上海闵行区陈行公路2168号3幢

上海浦东新区碧波路 / 弄690号张江微电子港6号楼501-10室

 

北京市

海淀区海淀西大街36号昊海楼

西安市

长安区航天基地神舟三路十一科技西北大厦

南京市

建邺区奥体大街68号新城科技园国际研发总部园2幢

深圳市

南山区粤海街道海天二路赛西科技大厦

上海天数智芯半导体有限公司(简称“天数智芯”)是中国***的通用GPU 高端芯片及***算力系统提供商。天数智芯致力于开发自主可控、国际***的高性能通用GPU产品,探索通用GPU赶超发展道路,加快建设自主产业生态,为全产业提供高端算力解决方案。未来,天数智芯将坚持中国特色的自主自强创新发展道路,打造更可信、更高效、更绿色的世界一流算力引擎,赋能千行百业数字化转型,促进我国数字经济高质量发展。

03月南京子公司成立
03月”天垓100芯片”及”天垓100加速卡”正式发
04月”天垓100″系列产品累计订单接近2亿人民


03月完成C轮融资
05月 “智铠100芯片”成功点亮
07月”智铠100芯片”启动流片
08月公司正式入驻浦江智慧园区
09月北京子公司成立
08月 DeepSpark开源社区成立及百大应用开放
平台正式上线
12月
“智铠100系列加速卡”正式发布
09月”天垓100加速卡”正式进入量产环节
09月第十六届”中国芯”优秀技术创新产品奖
10月中国集成电路创新创业大赛一等奖
12月2021年全国颠覆性技术创新大赛优胜项目

随着科技发展的推动和市场需求的拉动,社会已从工业社
会、信息社会进入到一个以智能技术为核心的数字化社会。正
像能源、钢铁是工业社会的基础性资源,网络连接是信息社会
的基础性资源一样,计算能力成为了数字社会***基础性资源,
而决定这种能力的***核心的技术就是起到引擎作用的芯片拍支
术。天数致力于打造出具有强大的数字和图形计算能力的高高端
芯片,成为算力体系中***核心的引擎,并力求把天数建设为有
一流的技术、一流的产品、一流的服务和一流的管理的***
科技企业。

上海天数智芯半导体股份有限公司:通用 GPU 领域的创新***者

一、天数智芯的发展历程

1.1 创立背景与初心

在全球数字化浪潮汹涌澎湃的 2015 年,上海天数智芯半导体股份有限公司(以下简称 “天数智芯”)应运而生,注册地位于上海市闵行区,法定代表人为盖鲁江。彼时,人工智能、大数据、云计算等新兴技术蓬勃发展,对算力的需求呈现出爆发式增长。而通用 GPU 作为能够提供强大并行计算能力的关键芯片,成为了满足这些需求的核心要素。天数智芯的创立,承载着为智能社会提供强大算力引擎的使命,致力于打破国外在高端算力领域的技术垄断,推动我国自主可控的高性能通用 GPU 产业发展,以 “成为智能社会的赋能者” 为目标,踏上了充满挑战与机遇的征程。

1.2 早期探索与技术积累阶段(2015 – 2017 年)

成立初期,天数智芯广纳贤才,吸引了一批来自全球***芯片企业和科研机构的行业精英,组建了一支具备深厚技术功底和创新精神的团队。团队成员们在通用 GPU 技术领域展开了深入的研究与探索,对国际主流 GPU 架构和技术发展趋势进行了全面剖析,为后续自主研发奠定了坚实的理论基础。同时,公司积***与高校、科研院所展开产学研合作,参与相关领域的基础研究项目,不断积累技术经验,提升自身在芯片设计、算法优化等方面的能力。在这一阶段,虽然公司尚未推出实质性的产品,但通过不懈的努力,在技术研发、人才储备、合作网络构建等方面取得了重要进展,为后续的产品开发和业务拓展埋下了希望的种子。

1.3 产品研发突破阶段(2018 – 2020 年)

2018 年,天数智芯正式启动 7 纳米通用并行(GPGPU)云端计算芯片设计项目,这是公司发展历程中的一个重要里程碑。项目团队全身心投入到紧张的研发工作中,面临着技术难题多、研发周期长、资金压力大等诸多挑战。在芯片架构设计上,团队大胆创新,摒弃了传统的跟随策略,采用了全新的架构理念,以实现更高的算力性能和能效比。经过无数个日夜的艰苦攻关,在 2020 年 12 月,公司自主研发的通用 GPU 训练产品 “天垓 100” 成功点亮,这一成果标志着国内***款全自研、GPU 架构下的云端训练芯片正式问世,实现了我国通用 GPU 产品从 0 到 1 的重大突破。天垓 100 的系统架构、指令集、核心算子、软件栈均为自主研发,这不仅意味着我国在高端芯片领域拥有了自主可控的核心技术,更从根本上保障了客户使用安全和信息安全。

1.4 产品量产与市场拓展阶段(2021 年 – 至今)

2021 年,天数智芯迎来了新的发展阶段。3 月,天垓 100 正式发布,随即在 7 月,第二代 GPU 智铠 100 进入流片阶段,并于 9 月实现天垓 100 的量产。产品的量产为公司进入市场竞争提供了有力的武器。天数智芯积***拓展市场渠道,与教育、互联网、金融、自动驾驶、医疗及安防等多个行业的企业展开合作,将天垓 100 加速卡应用于实际业务场景中。凭借其灵活的编辑能力、***的性能以及富有吸引力的性价比,天垓 100 迅速在市场上获得了认可,支撑了超过 200 个不同种类的模型训练,服务客户数量不断增加。2022 年 12 月,公司又正式发布通用 GPU 推理产品 “智铠 100”,自此天数智芯正式成为国内***同时拥有 GPU 架构下云边协同、训推组合的完整通用算力系统全方案提供商。随着产品体系的不断完善,天数智芯在市场上的影响力持续扩大,市场份额逐年攀升,收入规模也实现了快速增长,逐步成长为通用 GPU 领域的领军企业。

二、核心技术实力

2.1 芯片架构设计

天数智芯在芯片架构设计方面展现出了***的创新能力。以天垓 100 为例,其采用了独特的并行计算架构,能够充分发挥 GPU 的并行处理优势。通过精心设计的计算核心布局和数据传输通道,实现了高效的数据并行和任务并行处理。与传统架构相比,该架构在处理大规模矩阵运算、深度学习算法中的卷积和全连接等操作时,能够显著提升计算效率。同时,天数智芯还在架构中融入了可重构计算技术,使得芯片能够根据不同的应用场景和算法需求,灵活调整计算资源的分配,进一步提高了芯片的通用性和适应性。在智铠 100 的架构设计上,针对推理应用的特点进行了优化,增强了对低精度数据的处理能力,在***推理精度的前提下,大幅提升了推理速度,降低了能耗。

2.2 指令集研发

自主研发的指令集是天数智芯技术实力的重要体现。公司的指令集设计充分考虑了人工智能和通用计算领域的多样化需求,具有丰富的指令类型和高效的编码方式。与国际主流指令集相比,天数智芯的指令集在针对深度学习算法的特定操作上,能够实现更简洁、高效的指令表达,减少指令执行周期,从而提高计算性能。例如,在处理卷积神经网络中的卷积操作时,通过专门设计的卷积指令,能够将原本需要多个常规指令组合才能完成的操作,简化为一条指令,大大提高了指令执行效率。同时,该指令集还具备良好的扩展性,能够方便地支持未来新出现的算法和应用需求,为公司产品的持续创新和性能提升提供了坚实的基础。

2.3 核心算子优化

核心算子是 GPU 实现高性能计算的关键。天数智芯投入大量资源对核心算子进行优化,针对深度学习中常用的卷积、池化、矩阵乘法等算子,采用了先进的算法优化技术和硬件加速策略。在卷积算子优化方面,通过运用快速傅里叶变换(FFT)算法和分块计算技术,将卷积计算的复杂度大幅降低,同时结合芯片的硬件架构特点,对数据访存和计算过程进行了深度优化,使得卷积运算速度得到显著提升。对于矩阵乘法算子,采用了基于缓存优化的算法,合理利用芯片内部的多级缓存资源,减少数据在内存和缓存之间的传输次数,提高了数据访问效率,进而提升了矩阵乘法的计算性能。这些核心算子的优化成果,使得天数智芯的 GPU 产品在深度学习训练和推理任务中,能够以更高的效率运行各类模型,为客户提供强大的算力支持。

2.4 软件栈构建

软件栈是连接硬件与上层应用的桥梁,对于 GPU 的易用性和应用生态建设至关重要。天数智芯打造了高性能异构计算平台 —— 天数智芯软件栈。该软件栈支持 x86 和 ARM 等多种主流架构,集成了多种主流的深度学习编程框架,如 TensorFlow、PyTorch 等,为开发者提供了熟悉的开发环境。同时,软件栈还提供了基于 C/C++ 的编程接口拓展和高性能函数库,开发者可以利用这些接口和函数库,更加便捷地开发针对天数智芯 GPU 的应用程序,赋予模型训练及推理更优异的性能表现。此外,软件栈还配备了一系列调试和调优工具,能够帮助开发者快速定位和解决应用开发过程中出现的问题,满足不同层次的应用开发及调试需求,***大地降低了开发者的使用门槛,促进了天数智芯 GPU 产品在各个领域的广泛应用。

三、产品体系

3.1 云端训练产品 —— 天垓系列

3.1.1 天垓 100

天垓 100 作为天数智芯的首款云端训练芯片,具有里程碑意义。其在性能方面表现***,具备强大的算力输出能力。在 FP32(单精度浮点运算)精度下,能够提供高达 [X] TFLOPS(每秒万亿次浮点运算)的算力,在深度学习训练任务中,如大规模神经网络的训练,能够快速处理海量的数据,大大缩短训练时间。在通用性方面,天垓 100 广泛支持传统机器学习、数学运算、加解密及数字信号处理等领域。它可以灵活地适配不同类型的算法和模型,无论是常见的卷积神经网络(CNN)、循环神经网络(RNN)及其变体,还是其他复杂的机器学习模型,都能高效运行。在性价比方面,与国际同类产品相比,天垓 100 以更具竞争力的价格提供了相当的性能,为国内众多企业和科研机构提供了高性价比的算力选择,降低了他们在人工智能研发和应用方面的成本。

3.1.2 天垓系列的技术优势与应用案例

天垓系列产品在技术上具有多维度的优势。在生态兼容性方面,能够很好地适配主流 CPU 芯片和服务器厂商,支持国内外主流 AI 生态和多种深度学习框架,如前文提到的 TensorFlow、PyTorch 等,通过标准化的软硬件生态接口,为行业解决了产品使用难、开发平台迁移成本高的痛点,缩短了适配验证周期。在应用案例方面,在教育领域,某知名高校利用天垓 100 加速卡搭建了人工智能教学与科研平台,为师生提供了强大的算力支持,使得在图像识别、自然语言处理等课程实验和科研项目中,能够快速训练复杂的模型,取得了良好的教学和科研成果。在互联网领域,一家互联网科技公司使用天垓 100 对其***系统进行优化,通过对海量用户数据的快速处理和模型训练,提高了***算法的准确性和实时性,为用户提供了更加个性化的服务,显著提升了用户体验和平台的商业价值。

3.2 云端推理产品 —— 智铠系列

3.2.1 智铠 100

智铠 100 基于天数智芯第二代通用 GPU 架构,在推理性能方面表现出色。它支持 FP32、FP16、INT8 等多精度推理混合计算,能够根据不同的应用场景和对精度的要求,灵活选择合适的计算精度,在***推理准确性的同时,提高推理速度。例如,在对实时性要求较高的视频监控智能分析场景中,采用 INT8 精度进行推理,能够在***短的时间内对视频流中的目标进行检测和识别,满足实际应用的需求。在视频解码能力上,智铠 100 支持多种视频规格解码,无论是常见的 H.264、H.265 格式,还是其他高清、超高清视频格式,都能流畅解码,为视频相关的人工智能应用,如视频内容审核、视频智能剪辑等提供了有力支持。在软件支持方面,它支持国内外主流深度学习开发框架,拥有丰富编程接口拓展和高性能函数库,可以灵活支持各种算法模型,方便开发者进行应用开发和部署。

3.2.2 智铠系列的特性与应用领域

智铠系列产品具有应用覆盖广、计算性能高、应用成本低及落地支持强的特性。在安防领域,智铠 100 被广泛应用于智能监控摄像头后端的视频分析设备中,通过对监控视频的实时分析,实现对人员、车辆、异常行为等的精准识别和预警,大大提高了安防系统的智能化水平。在互联网领域,用于智能语音助手的推理服务,能够快速对用户的语音指令进行识别和理解,并返回准确的回答,提升了语音交互的流畅性和用户满意度。在金融领域,可应用于风险评估、欺诈检测等业务场景,通过对大量金融数据的快速推理分析,为金融机构提供决策支持,降低风险。在医疗领域,能够辅助医生进行医学影像的智能诊断,如对 X 光、CT、MRI 等影像进行快速分析,帮助医生发现潜在的病变,提高诊断效率和准确性。

3.3 算力系统解决方案

3.3.1 异构计算平台

天数智芯构建的异构计算平台整合了 CPU、GPU 等多种计算资源,充分发挥不同类型芯片的优势。在该平台中,CPU 负责处理逻辑性强、控制流复杂的任务,而 GPU 则专注于大规模并行计算任务。通过高效的任务调度和数据传输机制,实现了 CPU 和 GPU 之间的协同工作,提高了整个系统的计算效率。例如,在一个复杂的人工智能计算任务中,CPU 先对数据进行预处理和任务分配,然后将适合并行计算的部分交给 GPU 进行加速处理,***后由 CPU 对 GPU 的计算结果进行整合和后处理。该平台针对通用计算和深度学习应用的开发和部署提供了一套完整的解决方案,支持多种主流的深度学习编程框架和开发工具,方便开发者进行应用开发和优化。同时,平台还具备良好的可扩展性,能够根据用户的需求,灵活增加或减少计算节点,满足不同规模的计算任务需求。

3.3.2 算力集群

天数智芯的算力集群由多个天垓 100 或智铠 100 加速卡组成,通过高速网络连接,形成强大的算力池。在集群架构设计上,采用了分布式存储和计算技术,实现了数据的高效存储和并行计算。在大规模数据处理和深度学习训练任务中,算力集群能够发挥巨大的优势。例如,在训练一个超大规模的语言模型时,单个 GPU 的算力往往无法满足需求,而天数智芯的算力集群可以将模型训练任务分解到多个 GPU 上并行执行,大大缩短了训练时间。在集群管理方面,配备了专业的集群管理软件,能够实时监控集群中各个节点的运行状态,包括硬件资源使用情况、任务执行进度等,并根据实际情况进行智能调度和资源分配,确保集群的高效稳定运行。同时,该软件还具备故障检测和自动修复功能,当某个节点出现故障时,能够及时将任务转移到其他正常节点上继续执行,保障业务的连续性。

四、应用领域

4.1 人工智能领域

4.1.1 大模型训练与推理

在大模型训练方面,天数智芯基于天垓产品的自主算力集群已率先完成国内大模型预训练。以智源研究院 70 亿参数规模的 Aquila 语言基础模型训练为例,天垓 100 加速卡的算力集群在使用代码数据进行训练时,已稳定运行 19 天,且模型收敛效果符合预期。在训练过程中,1 个 Epoch 后 loss 值下降到 95% 以上,与国际主流的加速卡集群相比,天垓 100 加速卡集群的收敛效果、训练速度、线性加速比与其实力相当。在大模型推理方面,智铠产品表现出色。基于智铠的推理一体机已应用于法律、金融等行业客户大模型推理业务中,提供较国际主流产品更优的性能、性价比及能耗。例如,在金融风险评估大模型推理中,智铠推理一体机能够快速对海量金融数据进行推理分析,为金融机构提供准确的风险评估结果,且在运行过程中能耗更低,降低了金融机构的运营成本。

4.1.2 机器学习与深度学习应用案例

在机器学习领域,某企业利用天数智芯的 GPU 产品对客户行为数据进行分析和建模,通过训练机器学习模型,实现了对客户潜在需求的精准预测,从而优化了企业的营销策略,提高了客户转化率。在深度学习方面,在图像识别领域,一家安防企业使用天垓 100 加速卡训练的卷积神经网络模型,对监控视频中的目标物体进行识别,准确率高达 98% 以上,能够快速准确地识别出人员、车辆等物体,为安防监控提供了有力支持。在自然语言处理领域,某互联网公司利用智铠 100 对其智能客服系统进行优化,通过深度学习模型对用户的咨询文本进行理解和回答,大大提高了智能客服的响应速度和回答准确率,提升了用户体验。

4.2 超算中心

4.2.1 提供高性能算力支持

天数智芯的 GPU 产品为超算中心提供了强大的高性能算力支持。在科学计算、气象预测、材料模拟等对算力要求***高的领域,超算中心采用天数智芯的天垓系列加速卡,能够显著提升计算效率。例如,在气象预测中,需要对海量的气象数据进行复杂的数值模拟计算,天垓 100 加速卡的并行计算能力可以大幅缩短计算时间,使气象预报更加及时准确。在材料模拟领域,研究人员利用天垓加速卡对材料的微观结构和性能进行模拟计算,能够更快地筛选出具有特定性能的材料,加速新材料的研发进程。

4.2.2 助力科学研究与创新

超算中心配备天数智芯的 GPU 产品后,有力地推动了科学研究与创新。在物理科学领域,对于复杂的量子力学计算,天垓加速卡能够帮助科研人员更快地求解量子力学方程,探索微观世界的奥秘。在生物科学领域,在蛋白质结构预测等研究中,GPU 的强大算力可以加速对蛋白质三维结构的计算,有助于理解蛋白质的功能和作用机制,为药物研发提供重要支持。通过为科学研究提供高效的算力支持,天数智芯的产品在促进基础科学研究突破、推动科技创新方面发挥了重要作用。

4.3 互联网云计算

4.3.1 提升云服务性能

在互联网云计算领域,天数智芯的产品能够有效提升云服务性能。云服务提供商采用天数智芯的 GPU 产品后,在处理大规模数据存储、数据分析、云计算应用等任务时,速度得到显著提升。例如,在云存储服务中,对于海量数据的存储和检索操作,使用智铠 100 加速卡可以加快数据处理速度,提高用户数据访问的响应时间。在云计算应用方面,对于运行在云端的大型游戏、图形渲染等对计算性能要求较高的应用,天垓 100 加速卡能够为其提供强大的算力保障,使这些应用在云端运行更加流畅,提升用户体验。

 

产品信息

主机存储类 设备

天数智芯 : 厂商
GPU 卡 (算力卡)