A China apresenta seu próprio supercomputador com processador de 384 núcleos. 13 trilhões de operações por segundo

A China revelou o seu mais recente supercomputador, equipado com um novo processador com 384 núcleos e capaz de realizar mais de 13 biliões de operações de ponto flutuante por segundo ( TFLOPS ).

A CPU Sunway SW26010 Pro é um chip de fabricação própria que visa aumentar as capacidades de supercomputação da China e reduzir sua dependência de tecnologia estrangeira. Porém, segundo especialistas, o processador ainda enfrenta problemas de desempenho de cache e memória.

Sunway SW26010 Pró

A CPU Sunway SW26010 Pro foi recentemente apresentada na conferência SC23, onde o Centro Nacional de Supercomputação em Wuxi, que opera o supercomputador, revelou mais detalhes sobre sua arquitetura e design.

De acordo com Chips and Cheese, a CPU é baseada em um conjunto de instruções RISC proprietário de 64 bits e possui seis grupos principais (CG) e uma unidade de processamento de protocolo (PPU). Cada CG inclui 64 Elementos de Processamento de Computação (CPE) e um Elemento de Processamento de Gerenciamento (MPE). Os CPEs possuem um mecanismo vetorial de 512 bits e um cache scratchpad de 256 KB, enquanto os MPEs possuem um mecanismo escalar e um cache L2 de 256 KB. Cada CPE também possui uma interface de memória DDR4-3200 de 128 bits e 16 GB de memória DDR4.

A CPU é uma versão atualizada do Sunway SW26010, usado no supercomputador Sunway TaihuLight, que foi classificado como o supercomputador mais rápido do mundo em 2016 e 2017. A nova CPU melhorou a velocidade do clock, o conjunto de instruções e a largura da largura de banda da memória em comparação com a geração anterior. , resultando em um aumento de quatro vezes no desempenho do FP64. A CPU Sunway SW26010 Pro pode atingir um desempenho máximo de FP64 de 13,8 TFLOPS, o que é impressionante em comparação com a CPU EPYC 9654 de 96 núcleos da AMD, que tem um desempenho máximo de FP64 de cerca de 5,4 TFLOPS.

No entanto, a CPU Sunway SW26010 Pro também tem suas desvantagens:

  • A CPU possui cache e hierarquia de memória limitados, o que pode afetar o desempenho de alguns aplicativos.
  • O cache do scratchpad dos CPEs deve ser maior para armazenar todos os dados exigidos pelo mecanismo vetorial, e a falta de um cache L2 adequado significa que os dados devem ser buscados frequentemente na memória principal. Isto diminui a velocidade prática;
  • o subsistema de memória da CPU também é insuficiente e deve ser aumentado para suportar a alta demanda de largura de banda dos 384 núcleos, cada um dos quais é capaz de 16 FP64 FLOPS/ciclo. Esses gargalos podem limitar a escalabilidade e a eficiência da CPU e do supercomputador.

A CPU Sunway SW26010 Pro é uma conquista notável para a indústria de supercomputação da China, que desenvolveu seus processadores e sistemas para competir com os líderes mundiais. A CPU demonstra a inovação e ambição da China no campo da computação de alto desempenho, que encontra aplicação em vários campos, como pesquisa científica, inteligência artificial e segurança nacional. No entanto, a CPU também mostra que a China ainda tem algumas lacunas no que diz respeito ao design de cache e memória, que são cruciais para alcançar desempenho ideal e eficiência energética. Portanto, é um passo necessário para


Telegrama
Graças ao nosso canal Telegram você pode ficar atualizado sobre a publicação de novos artigos sobre Cenários Econômicos.

⇒ Inscreva-se agora


Mentes

O artigo China apresenta seu próprio supercomputador com processador de 384 núcleos. 13 trilhões de operações por segundo vêm de cenários econômicos .


Esta é uma tradução automática de uma publicação publicada em Scenari Economici na URL https://scenarieconomici.it/la-cina-presenta-il-proprio-supercompure-con-processore-a-384-core-13-000-miliardi-di-operazioni-al-secondo/ em Sat, 25 Nov 2023 21:29:38 +0000.