高性能计算的概念
高性能计算(HPC,High Performance Computing) 的含义有很多,感觉最贴切的还是 Oracle中国中说的这句:
- 高性能计算 (HPC) 是指通过聚合计算能力来提供比传统计算机和服务器更强大的计算性能
这么说可能还是有点难懂,用王总的话来说,就是 集中火力干事业!
一台计算机,我们平时用用 WPS 写写文档,玩玩英雄联盟什么的小游戏可能还很流畅;但是如果想要玩玩 “3A”大作,在我的世界中开个光影,可能会略有卡顿。
这时,有台式机的可能会想换个3090,有雷电3的笔记本可能会想外置一个显卡。可是,这些似乎都不是明智之举,毕竟一张显卡的价格也不是很友好。
但是,如果我们把笔记本和台式机连接在一起,把两台设备的算力叠加在一起,这样不就解决了吗?
说干就干,打开了笔记本和台式机,从淘宝上下单了一条双USB3.0 线就开始干了起来。可是尝试了一番操作之后,发现似乎不太行。如果那么简单地话,显卡应该就烂大街了。
集群
集群的概念
集群(cluster) 就是一组计算机,通过某种方式作为一个整体,向用户提供更丰富的网络资源。
比如下图是甲骨文在开发者会议上使用1060台树莓派组成的超级计算机。使用树莓派集群,具有体积更小,功耗更低的优势。
集群的种类
说到高性能计算,就要说到计算机集群。计算机集群按照和功能主要分为以下几类:
- HA:高可用集群(High Available Cluster)
- LBC:负载均衡集群(Load Balance Cluster)
- HPC:高性能计算集群(High Performance Computing Cluster)
高可用集群
高可用集群(HA) 是指是指以减少服务中断时间为目的的服务器集群技术。
当集群中有某个节点失效的情况下,其上的任务会自动转移到其它正常的节点上。还指可以将集群中的某节点进行离线维护再上线,该过程并不影响整个集群的运行。从而保证用户的业务服务程序能够对外提供不间断的服务。
负载均衡集群
负载均衡集群是指将工作量分配到多台计算机以达到最佳的资源利用率、最大限度地提高吞吐量、缩短响应时间和避免过载的计算机集群系统。
高性能计算
略
高性能计算的优势
- 速度:HPC的低延迟网络结构能够在数分钟内完成大量计算。
- 成本:HPC快速,低成本,像公有云一样只需为所使用资源付费。
- 创新:HPC推动很多行业的发展,改善全球人的生活质量。
高性能计算的应用
超级计算机代表着高性能计算系统的最尖端水平。随着计算机的处理能力的不断提升,超级计算机所能做到的事情也越来越多。
- 机器学习:机器学习是指机器可以主动学习的系统,而不是被动的执行指令完成任务。像是医疗行业肿瘤检测,金融行业的一些预测等领域都有应用。
- 大数据分析:大数据分析是指对海量数据能够快速比较和关联的系统,在金融、科学、健康等多个领域都有应用。
- 高级建模和模拟:高级建模和模拟是指对一些行业进行物理模型构建,从而节省时间、人力等成本,在天气预测系统、药物研制等领域都有应用。