OpenBLAS 0.3.27 lançado com suporte inicial a arquitetura C-SKY

E foi lançado o OpenBLAS 0.3.27 com suporte inicial a arquitetura C-SKY, e mais. Confira as novidades dessa importante atualização.

OpenBLAS é uma implementação de código aberto das APIs BLAS e LAPACK com muitas otimizações feitas à mão para tipos de processadores específicos. É desenvolvido no Laboratório de Software Paralelo e Ciência Computacional, ISCAS.

O OpenBLAS é conhecida por sua ampla variedade de otimizações de processador, pois adiciona implementações otimizadas de núcleos de álgebra linear para várias arquiteturas de processador, incluindo Intel Sandy Bridge e Loongson.

Ele afirma alcançar um desempenho comparável ao Intel MKL: isso é verdade principalmente na parte BLAS, enquanto a parte LAPACK fica para trás.

Em máquinas que suportam o conjunto de instruções AVX2, o OpenBLAS pode obter desempenho semelhante ao MKL, mas atualmente quase não há bibliotecas de código aberto comparáveis ​​ao MKL em CPUs com o conjunto de instruções AVX512.

Agora, uma nova versão do OpenBLAS já está disponível, OpenBLAS 0.3.27.

Novidades do OpenBLAS 0.3.27

OpenBLAS 0.3.27 lançado com suporte inicial a arquitetura C-SKY
OpenBLAS 0.3.27 lançado com suporte inicial a arquitetura C-SKY

OpenBLAS 0.3.27 traz suporte inicial para a arquitetura C-SKY, limita o número máximo de threads para GEMM/GETRF/POTRF para evitar threads subutilizados/ociosos, melhor desempenho de POTRF multithread para todas as plataformas, vários outros threads multithread aprimoramentos, gerenciamento mais rápido de threads OpenMP e muitos outros aprimoramentos comuns para esta excelente biblioteca BLAS.

OpenBLAS 0.3.27 traz mudanças tanto para AMD quanto para Intel nesta versão.

O OpenBLAS 0.3.27 também possui uma série de correções x86_64, incluindo a correção de opções do compilador LLVM para Intel Sapphire Rapids e melhorias de substitutos para Sapphire Rapids. Do lado da AMD, há desempenho GEMM aprimorado para alvos AMD Zen.

Além do trabalho x86_64 e C-SKY, a nova versão do OpenBLAS possui ajustes adicionais de ARM, incluindo suporte inicial para os núcleos do processador Cortex-A76 e suporte Neoverse-V2 nas compilações DYNAMIC_ARCH.

IBM POWER também possui otimizações de desempenho DGEMM e SGEMM, suporte de CPU X280 no espaço RISC-V, várias otimizações LoongArch de 64 bits, algumas correções MIPS e muito mais. Este é um lançamento bastante grande para a biblioteca OpenBLAS.

Para saber mais sobre essa versão do OpenBLAS, acesse a nota de lançamento.

Como instalar ou atualizar o OpenBLAS

Para instalar a versão mais recente do OpenBLAS, você precisa baixar o código fonte na página do projeto no GitHub e compilá-lo.

Sobre o Edivaldo Brito

Edivaldo Brito é analista de sistemas, gestor de TI, blogueiro e também um grande fã de sistemas operacionais, banco de dados, software livre, redes, programação, dispositivos móveis e tudo mais que envolve tecnologia.