Uma em cada 142 senhas é ‘123456’! Sim é verdade!

O estudante de engenharia de computação Ata Hakçıl analisou um arquivo de senhas vazadas e descobriu que uma em cada 142 senhas é ‘123456’.

Em um dos maiores estudos de reutilização de senhas desse tipo, uma análise de mais de um bilhão de credenciais vazadas descobriu que uma em cada 142 senhas é a sequência clássica “123456”.

Uma em cada 142 senhas é ‘123456’! Sim é verdade!

Uma em cada 142 senhas é '123456'! Sim é verdade!
Uma em cada 142 senhas é ‘123456’! Sim é verdade!

O estudo, realizado no mês passado pelo estudante de engenharia de computação Ata Hakçıl, analisou combinações de nome de usuário e senha que vazavam on-line após violações de dados em várias empresas.

Esses “despejos de dados” existem há mais de meia década e vêm se acumulando à medida que novas empresas são invadidas.

Os despejos de dados estão facilmente disponíveis on-line, em sites como GitHub ou GitLab, ou distribuídos gratuitamente através de fóruns de hackers e portais de compartilhamento de arquivos.

Ao longo dos anos, as empresas de tecnologia vêm coletando esses depósitos de dados. Por exemplo, Google, Microsoft e Apple, coletaram credenciais vazadas para criar sistemas de alerta internos que avisam os usuários quando eles estão usando uma senha “fraca” ou “comum”.

Além disso, o serviço on-line Fui enviado também funciona em cima desses dumps e credenciais de dados vazados.

No mês passado, Hakçıl, um estudante turco que estuda em uma universidade em Chipre, baixou e analisou mais de um bilhão de credenciais vazadas.

A principal descoberta foi que o conjunto de dados de mais de mais de 1.000.000.000.000 incluía apenas 168.919.919 senhas exclusivas, das quais mais de 7 milhões eram a sequência “123456”.

Isso significa que uma em cada 142 senhas incluídas no exemplo analisado por Hakçıl foi a senha mais fraca conhecida hoje – com a sequência “123456” sendo a senha mais comumente reutilizada on-line nos últimos cinco anos seguidos e contando.

Além disso, Hakçıl também descobriu que o tamanho médio da senha geralmente é de 9,48 caracteres, o que não é bom, mas também não é terrível, pois a maioria dos especialistas em segurança recomenda o uso de senhas o maior tempo possível e, geralmente, entre 16 e 16 anos. 24 caracteres ou mais.

Mas o tamanho da senha não foi o único problema que Hakçıl descobriu. O pesquisador turco disse que a complexidade da senha também era um problema, com apenas 12% das senhas contendo um caractere especial.

Na maioria dos casos, os usuários escolhem senhas simplistas, como usar apenas letras (29%) ou números (13%). Isso significava que cerca de 42% de todas as senhas incluídas no conjunto de 1 bilhão de dados estavam vulneráveis ​​a ataques rápidos de dicionário que permitiriam que os atores de ameaças obtivessem acesso a contas sem nenhum esforço ou dificuldade técnica.

Os resultados completos do estudo estão disponíveis no GitHub, com um breve resumo abaixo:

  • Das mais de 1.000.000.000 de linhas de despejos, 257.669.588 foram filtradas como dados corrompidos (sem sentido no formato impróprio) ou como contas de teste.
  • 1 bilhão de credenciais se resumem a 168.919.919 senhas e 393.386.953 nomes de usuário.
  • A senha mais comum é 123456. Ela cobre aproximadamente 0,722% de todas as senhas. (Cerca de 7 milhões de vezes por bilhão)
  • As 1000 senhas mais comuns cobrem 6,607% de todas as senhas.
  • Com 1 milhão de senhas mais comuns, a taxa de acertos é de 36,28% e a taxa de acertos de 10 milhões de senhas mais comuns é de 54,00%.
  • O tamanho médio da senha é de 9,4822 caracteres.
  • 12,04% das senhas contêm caracteres especiais.
  • 28,79% das senhas são apenas letras.
  • 26,16% das senhas são minúsculas.
  • 13,37% das senhas são apenas números.
  • 34,41% de todas as senhas terminam com dígitos, mas apenas 4,522% de todas as senhas começam com dígitos.

O que está sendo falado no blog

PinLinkedIn
Sobre o Edivaldo Brito

Edivaldo Brito é analista de sistemas, gestor de TI, blogueiro e também um grande fã de sistemas operacionais, banco de dados, software livre, redes, programação, dispositivos móveis e tudo mais que envolve tecnologia.