OpenBLAS 0.3.22 lançado com mais otimizações, correções, e mais

E foi lançado o OpenBLAS 0.3.22 com mais otimizações, correções, e mais. Confira as novidades dessa importante atualização.

OpenBLAS é uma implementação de código aberto das APIs BLAS e LAPACK com muitas otimizações feitas à mão para tipos de processadores específicos. É desenvolvido no Laboratório de Software Paralelo e Ciência Computacional, ISCAS.

O OpenBLAS é conhecida por sua ampla variedade de otimizações de processador, pois adiciona implementações otimizadas de núcleos de álgebra linear para várias arquiteturas de processador, incluindo Intel Sandy Bridge e Loongson.

Ele afirma alcançar um desempenho comparável ao Intel MKL: isso é verdade principalmente na parte BLAS, enquanto a parte LAPACK fica para trás.

Em máquinas que suportam o conjunto de instruções AVX2, o OpenBLAS pode obter desempenho semelhante ao MKL, mas atualmente quase não há bibliotecas de código aberto comparáveis ​​ao MKL em CPUs com o conjunto de instruções AVX512.

Agora, uma nova versão do OpenBLAS já está disponível, OpenBLAS 0.3.22.

Novidades do OpenBLAS 0.3.22

OpenBLAS 0.3.22 lançado com mais otimizações, correções, e mais

O OpenBLAS 0.3.22 foi lançado esta semana e fornece as mais recentes otimizações de CPU, correções de compilação e outros novos recursos.

Dito isso, os destaques do OpenBLAS 0.3.22 são:

  • Suporte inicial para processamento com o conversor EmScripten JavaScript, embora apenas uma compilação de thread único por enquanto.
  • Várias alterações de ajuste/limiar multi-threaded.
  • Detecção automática para CPUs Intel Raptor Lake.
  • Compilação corrigida para processadores AMD Zen 4, como as séries Ryzen 7000 e EPYC 9004.
  • Várias otimizações de kernel x86_64 e outras melhorias.
  • Detecção automática de CPU Armv8 para processadores Cortex X3 e Cortex A715.
  • Desempenho GEMM aprimorado para núcleos Arm Neoverse V1.
  • Atualização do LAPACK incluído em relação à versão de referência v3.11, juntamente com várias correções e melhorias pós-lançamento.
  • Corrigir o suporte ao AMD Zen 4 e adicionar o suporte ao Intel Raptor Lake sozinho será do interesse de muitos usuários.

Para saber mais sobre essa versão do OpenBLAS, acesse a nota de lançamento.

Como instalar ou atualizar o OpenBLAS

Para instalar a versão mais recente do OpenBLAS, você precisa baixar o código fonte na página do projeto no GitHub e compilá-lo.

Deixe um comentário

Sair da versão mobile