图形工作站、集群应用方案
  • 网站首页
  • 商城
  • 产品
  • 行业计算
  • 科学工程计算
  • 化学&生物
  • 图形设计
  • 图像处理
  • 视景仿真
  • 人工智能
  • 影视后期
全球领先的高端图形工作站供应商

免费测试 热线 : 400-7056-800 【 为任何应用提供 最快计算设备 如不符,退货】【最新报价】【选购指南】【京东商城】



企业通用模版网站

  • 科研团队全能超算平台25v1
  • 超高分拼接 数字孪生
  • 科学计算MatLAB工作站24
  • 地质建模 油藏模拟工作站
  • 工业CT扫描 机器视觉计算
  • 电力系统关键应用配置24
  • 网站首页
  • 商城
  • 产品
  • 行业计算
  • 科学工程计算
  • 化学&生物
  • 图形设计
  • 图像处理
  • 视景仿真
  • 人工智能
  • 影视后期
  • 送无人机啦 8核6.4GHz  96核4.8GHz 加速改装 

  • 高性能集群 虚拟并行计算 芯片设计 光学仿真 

  • 蛋白质预测 生物信息 冷冻电镜 材料模拟

  • RSS订阅
  • 理科计算推荐
  • 仿真计算最快最完美25v1
  • 电磁仿真单机与集群25v1
  • 航拍实景建模单机集群
  • 遥感图像处理工作站集群
  • 4K/8K剪辑特效调色24v1
  • AI大模型工作站集群25v1
  • Abaqus硬件配置大全24v3
  • CST电磁仿真工作站25v1
  • 多物理场仿真单机与集群
  • 流体/空气动力学仿真25v1
  • 量子化学 分子动力模拟
  • 三维设计24v2  3D打印

 

您的位置:UltraLAB图形工作站方案网站 > 人工智能 > 深度学习 > 英特尔描绘HPC的多核与众核蓝图

英特尔描绘HPC的多核与众核蓝图

时间:2010-12-15 01:41:00   来源:UltraLAB图形工作站方案网站   人气:12426 作者:admin

在今年的国际超级计算机会议上有很多关于多核架构与亿亿次级计算的讨论——这两个主题似乎是密切关联的。但随着各种团体迅猛的朝着这个亿亿次级里程碑迈进,可以明确的是x86多核CPU的自然发展不会使业界离这个目标太远。众核GPGPU(通用GPU),另一方面也显现出是一种切实可行的实现亿亿级计算的途径。那么Intel的“少GPU”技术意味着什么呢?

  简言之,Intel对GPGPU的回应是它的新超多核心架构(MIC)。MIC是今年夏天在德国召开的国际超级计算机会议(ISC`10)上提出的,是Larrabee技术的再利用,该技术原先是Intel为高端显卡和虚拟化市场而开发的。当Intel发现努力的结果并不能带来与NVIDIA及AMD发布的GPU的竞争力时,于是就放弃了该计划,并将技术加以改造成为一种HPC加速器。

  英特尔高性能计算业务总经理Rajeeb Hazra在英特尔有15年的工作经验,今年7月他接替Richard Dracott担任HPC业务总经理的一职。在这之前,Hazra是超级计算架构与设计(SAP)部的主管,主要负责高端平台的架构设计,即petaflop和exaflop计算。他向我们深入介绍了Intel的高性能计算战略。

  他在超级计算部的经历是偶然的,考虑到Intel在服务器市场最大的挑战可能就是为高性能计算的重点部分交付产品。如今,从10大超级计算机到集群,再到下面的高性能客户机,Intel已成为HPC所有平台主要的处理器供应商。该计划还将延续下去。Hazra表示:“我们的目标是推进高性能计算市场的革新,从高端的超级计算到批量工作站,根本上推动所有类型高性能计算的发展。”

  Intel的MIC架构是其中最主要的部分。Hazra表示,MIC架构是未来10年或更长远的众核处理器设计的基础。但首先他们必须击中一个移动目标。在过去三年,通用GPU进入高性能计算领域的快速扩展已经给NVIDIA——以及较低程度的AMD——一个十分有利的开端。

  到10月份为止,世界上最快的超级计算机天河1号A,采用的是GPU-CPU的混合架构。该计算机在 Linpack测试中达到的速度为2.5 petaflops,超过半数以上的性能都是由GPU提供。另外还有其他少数由GPU提供强大支撑的TOP100入榜超级计算机,更多的则还在研发中。如果Intel对GPGPU没有切实可行的替代选择的话,它的芯片将会被降级到在未来很多超级计算机——更不用说主流集群和高性能工作站——中扮演支持的角色。

  尽管MIC是一个改良的x86产品并且与GPGPU是完全不同的体系结构,但它的目标也是解决同样的问题——也就是在高效能的封装中获得更高的浮点性能。MIC也计划可以像GPU那样的方式使用,也就是作为一个连接传统x86处理器的浮点加速器。一般的思路是这两种架构都使用高度并行和简单核心来使每瓦特释放能多的性能。

  对任何HPC平台来讲那都是有价值的特性,但是对于下一代数万亿次级别(multi-petaflop)的超级计算机来说将是决定性的。Hazra表明在过去10年中,TOP100超级计算机取得的性能提升主要是借助横向扩展模型,也就是增加更多的处理器和更多的结点。新的CPU架构稍稍改变了每瓦性能曲线的斜率,但是系统普遍变大了,因此会消耗更多的电量。

  这种情况不会持续很多年。消耗300兆瓦的电量来建立一个500petaflop的系统是不实际的。传统的观念是对于单独的机器来说,电力消耗上限应介于20-40兆瓦之间。所以你不能只是凌驾于现有至强或者皓龙处理器的性能曲线之上,期望为这些未来系统提供所需的性能。Hazra承认:“展望未来5到10年时,那些系统将会有一些重要的转折点。”

  Intel想要实现类似于GPGPU的每瓦性能,这将会在x86架构内展开。Hazra表示,这将允许应用程序从单线程代码转变到高度并行的代码,且不用改变基础模型。Intel将会为产品提供编译器和运行软件的支持,如果它取得商业成功,其他厂商将会毫无疑问的添加他们的产品。Intel也将会在Xeon及MIC的产品上提供一套通用的开发工具,两种架构的差别也囊括在了该工具中。目标是能够对任何x86的源码进行重新编译,并使其自动处理MIC指令。 #p#page_title#e#

  这种思想,很显然是为了最大程度提高程序员的生产效率——不仅是对新代码,也是对代表了几年甚至几十年投资的传统代码。在这方面Intel似乎有优势。虽然Xeon-MIC混合架构仍然是一个异构平台,它将会变得更加趋近同构,至少从一个指令方面来讲,要比Xeon-GPGPU平台要强。Hazra相信他们在Intel x86框架下所追求的路线将会允许他们提供一个更加平衡的异构系统。如果Intel能够真正地实现从多核Xeon到众核MIC的转型,并且将其中的麻烦和难题减至最少,那么他们将拥有一个引人注目的HPC加速器产品。Hazra表示:“我们相信,随着越来越多的应用和算法能够利用并行化技术,MIC架构将成为一个主力。”

  代号为“Knights Corner”的第一款MIC产品采用了Intel的22nm制程工艺生产。考虑到22nm晶圆极有可能用来开发批量出货的芯片,所以我们可能在2012年以前看不到第一款MIC产品问世。Knights Corner是由50个核心组成的芯片,但是Intel并没有提供任何评估性能度量标准。

  与此同时,Intel将继续发展其多核Xeon生产线,贯穿企业和“批量”HPC市场。并不是每个HPC应用都需要众核加速器,对于那些更加匹配粗粒并行或者专门面向单线程执行的代码组,Xeons芯片就是最佳的选择。

  Xeon生产线将会继续使用Intel用在其主流的x86处理器上、12个月为周期的tick-tock开发策略。不过根据Hazra所言,MIC步调会很慢,大约18-24月的样子,虽然在这样的情况下每个处理器更新要囊括更多架构上的变化。这种时间策略与NVIDIA和AMD固定的GPGPU提供速度紧密一致,并在很大程度上理应得到相对低容量的加速器。

  最大的未知数,就是Intel能否及时交付产品来逆转GPGPU。NVIDIA与AMD拥有三年的领先优势,当第一款商业MIC芯片问市之时,这个差距甚至还会扩大到五年。Intel不需要依靠这些众核产品的成功来取得再次成功,但是它在HPC上的抱负似乎却与其紧密相关。2010年将是值得关注的一年

关闭此页
上一篇:异构计算:Exascale时代的新模式
下一篇:HFSS电磁仿真应用与工作站配置方案

相关文章

  • 05/09Xeon6代+4块GPU--图灵超算工作站GT450M介绍
  • 05/09汽车风阻测试模拟分析、算法,及服务器/工作站计算设备硬件配置推荐
  • 04/26高频交易(HFT)应用分析、算法,服务器/工作站硬件配置推荐
  • 04/25衍生品定价与风险对冲应用分析、算法,及服务器工作站硬件配置
  • 04/25量化交易策略应用算法分析、服务器工作站硬件配置
  • 04/24金融风险管理应用算法分析、服务器/工作站硬件配置推荐
  • 04/19油藏模拟软件的算法分析以及图形工作站/服务器硬件配置推荐25v2
  • 04/17大型3D设计软件CATIA-算法分析与图形工作站硬件配置
  • 04/17Cadence EDA主要软件计算特点分析,服务器/工作站硬件配置推荐
  • 04/16Synopsys EDA主要软件计算特点分析,服务器/工作站硬件配置推荐

工程技术(工科)专业工作站/服务器硬件配置选型

    左侧广告图2

新闻排行榜

  • 1如何在本地运行 Llama 3 8B 和 Llama 3 70B及硬件配置推荐
  • 2NVIDIA GeForce GTX 280测试报告
  • 3比GTX280快10倍-Quadro VX200专业卡评测
  • 4深度学习训练与推理计算平台硬件配置完美选型2020v1
  • 5高性能仿真计算集群(结构、流体、多物理场耦合)配置推荐2024v1
  • 62019年最快最全深度学习训练硬件配置推荐
  • 7Llama-2 LLM的所有版本和硬件配置要求
  • 8支持7块RTX3090静音级深度学习工作站硬件配置方案2021v2
  • 9HFSS电磁仿真应用与工作站配置方案
  • 10解锁最大推理能力:深入研究80GB A100 GPU 上的Llama2–70B

最新信息

  • 性能直逼6710亿参数DeepSeek R1--- QwQ-32B推理模型本地硬件部署
  • 史上最神的AI静音工作站---算命、炒股、看病、程序设计、销售策划、仿真计算、3D设计、药物设计、基因测序、大数据分析
  • 用中文训练更快-满血版Deepseek R1本地部署服务器/工作站硬件配置精准分析与推荐
  • DeepSeek R1训练和推理一体式服务器/工作站硬件配置、部署具体步骤
  • DeepSeek V3推理和训练一体式服务器/工作站硬件配置、部署具体步骤
  • DeepSeek R1/V3应用-服务器/工作站/集群配置推荐
  • 生成式AI热门应用、算法及对计算机硬件配置要求
  • llama3.2本地系统+软件安装运行、主要应用、计算硬件要求、最新GPU服务器配置参考

应用导航:

工作站产品中心 京东商城 中关村商城 淘宝商城 超高分可视化商城 便携工作站商城 ANSYS CATIA Microsoft INTEL NVIDIA 网站统计

公司简介-业务咨询-招聘英才-资料下载-UM-

本网站所有原创文字和图片内容归西安坤隆计算机科技有限公司版权所有,未经许可不得转载
陕ICP备16019335号 陕公网安备61010302001314号
Copyright © 2008-2023 , All Rights Reserved

首页
热线
商城
分类
联系
顶部