Cluster
Um conjunto de
setores do HD que são endereçados pelo sistema operacional como uma única
unidade lógica. Em outras palavras, um cluster é a menor parcela do HD que pode
ser acessada pelo sistema operacional. Cada cluster tem um endereço único, um arquivo
grande é dividido em vários clusters, mas um cluster não pode conter mais de um
arquivo, por menor que seja.
O tamanho de
cada cluster varia de acordo com o sistema de arquivos escolhido na formatação
do HD. Usando FAT 16 cada cluster tem até 32 KB, usando FAT 32 cada cluster
possui apenas 4 KB. Usando NTFS (o sistema de arquivos utilizado pelo Windows
NT e 2000) cada cluster possui entre 512 bytes e 4 KB, dependendo do tamanho da
partição. Quanto menores forem os clusters, menor será a quantidade de espaço
desperdiçada no HD, sobretudo ao gravar vários arquivos pequenos, já que mesmo
com apenas 1 byte de tamanho, qualquer arquivo ocupará um cluster inteiro.
Diferença
entre cluster e setor de um Disco Rígido (HD)
Algumas
pessoas quando falam sobre disco rígido, confundem-se quando formatam o HD
(hard disk). As vezes, ficam na dúvida se a formatação no disco foi física ou
lógica.
Bem,
a formatação física só acontece quando o HD sai de fábrica, onde durante o
processo de fabricação do disco rígido, acontece a formatação física do
dispositivo, onde é gravada, na placa lógica do equipamento, a tabela de
endereçamento das áreas de armazenamento do HD.
Ou
seja, existe um processo em que o disco é “mapeado” em setores, cada um com seu
endereço físico e então, é gravado na tabela esse endereçamento que mais tarde
será utilizado pelo Sistema Operacional para organizar as informações alí
gravadas.
Quando
se fala setor, trata-se da menor porção física de um HD, ou seja, é o endereço
mapeado no próprio disco rígido, com tamanho de 512 bytes cada.
O
cluster, é um conjunto de setores em que o Sistema Operacional reconhece e se
organiza para gravar as informações lógicas. Como o setor, o cluster também é o
menor tamanho que o SO (Sistema Operacional) reconhece, sendo assim, o cluster
é a menor unidade de informação lógica.
Quando
se formata logicamente o HD, estamos limpando e habilitando no disco rígido a
capacidade de se instalar um Sistema Operacional que vai reconhecer os
clusters, local onde o sistema de arquivos será gravado, bem como outras
informações.
Resumidamente:
Setor: a informação contida é sempre Positivo
ou Negativo, Magnetizado ou Desmagnetizado, zero ou um, etc.
Cluster: a informação lógica contida são
dados, informações possíveis de interpretação pelo Sistema Operacional.
Quando
é utilizado alguma ferramenta forense para checar as informações no Slack
Space, a ferramenta retorna com os dados classificando por cluster, e não por
setor.
TRILHAS, SETORES E
CILINDROS
Para organizar o processo de gravação e leitura
dos dados gravados no disco rígido, a superfície dos discos é dividida em
trilhas e setores.
As trilhas são círculos concêntricos, que começam no final do disco e vão se tornando menores conforme se aproximam do centro. Cada trilha recebe um número, que permite sua fácil localização. A trilha mais externa recebe o número 0 e as seguintes recebem os números 1, 2, 3, e assim por diante.
Para facilitar ainda mais o acesso aos dados, as trilhas se dividem em setores, que são pequenos pedaços onde são armazenados os dados, sendo que cada setor guarda 512 bytes de informações.
Um disco rígido atual possui entre 150 ou 300 setores em cada trilha (o número varia de acordo com a marca e modelo), possuindo em torno de 2000 ou 3000 trilhas. Para definir o limite entre uma trilha e outra, assim como onde termina um setor e onde começa o próximo, são usadas marcas de endereçamento, pequenas marcas com um sinal magnético que orientam a cabeça de leitura, permitindo à controladora do disco localizar os dados desejados.
Além das trilhas e setores, temos também as faces de disco. Um HD é formado internamente por vários discos empilhados, sendo o mais comum atualmente o uso de 2 ou 3 discos. Assim como num disquete, podemos usar os dois lados do disco para gravar dados, cada lado passa então a ser chamado de face. Em um disco rígido com 2 discos por exemplo, temos 4 faces.
Como uma face é isolada da outra, temos num disco rígido várias cabeças de leitura, uma para cada face. Apesar de possuirmos várias cabeças de leitura num disco rígido, elas não se movimentam independentemente, pois são todas presas à mesma peça metálica, chamada braço de leitura.........
O braço de leitura é uma peça triangular, geralmente feita de alumínio, que pode se mover horizontalmente.
Exemplificando, para acessar um dado contido na trilha 982 da face de disco 3 por exemplo, a controladora do disco ativa a cabeça de leitura responsável pelo disco 3 e a seguir ordena ao braço de leitura que se dirija à trilha correspondente. Não é possível que uma cabeça de leitura esteja na trilha 982, ao mesmo tempo que outra esteja na trilha 5631 por exemplo, justamente por seus movimentos não serem independentes. Já que todas as cabeças de leitura sempre estarão na mesma trilha de seus respectivos discos, deixamos de chamá-las de trilhas e passamos a usar o termo "cilindro". ..............
Um cilindro nada mais é do que o conjunto de trilhas com o mesmo número nos vários discos. Por exemplo, o cilindro 1 é formado pela trilha 1 de cada face de disco, o cilindro 2 é formado pela trilha 2 de cada face, e assim por diante.
Em essência, quando falamos em trilhas e cilindros, estamos usando nomes diferentes para falar sobre a mesma coisa.
As trilhas são círculos concêntricos, que começam no final do disco e vão se tornando menores conforme se aproximam do centro. Cada trilha recebe um número, que permite sua fácil localização. A trilha mais externa recebe o número 0 e as seguintes recebem os números 1, 2, 3, e assim por diante.
Para facilitar ainda mais o acesso aos dados, as trilhas se dividem em setores, que são pequenos pedaços onde são armazenados os dados, sendo que cada setor guarda 512 bytes de informações.
Um disco rígido atual possui entre 150 ou 300 setores em cada trilha (o número varia de acordo com a marca e modelo), possuindo em torno de 2000 ou 3000 trilhas. Para definir o limite entre uma trilha e outra, assim como onde termina um setor e onde começa o próximo, são usadas marcas de endereçamento, pequenas marcas com um sinal magnético que orientam a cabeça de leitura, permitindo à controladora do disco localizar os dados desejados.
Além das trilhas e setores, temos também as faces de disco. Um HD é formado internamente por vários discos empilhados, sendo o mais comum atualmente o uso de 2 ou 3 discos. Assim como num disquete, podemos usar os dois lados do disco para gravar dados, cada lado passa então a ser chamado de face. Em um disco rígido com 2 discos por exemplo, temos 4 faces.
Como uma face é isolada da outra, temos num disco rígido várias cabeças de leitura, uma para cada face. Apesar de possuirmos várias cabeças de leitura num disco rígido, elas não se movimentam independentemente, pois são todas presas à mesma peça metálica, chamada braço de leitura.........
O braço de leitura é uma peça triangular, geralmente feita de alumínio, que pode se mover horizontalmente.
Exemplificando, para acessar um dado contido na trilha 982 da face de disco 3 por exemplo, a controladora do disco ativa a cabeça de leitura responsável pelo disco 3 e a seguir ordena ao braço de leitura que se dirija à trilha correspondente. Não é possível que uma cabeça de leitura esteja na trilha 982, ao mesmo tempo que outra esteja na trilha 5631 por exemplo, justamente por seus movimentos não serem independentes. Já que todas as cabeças de leitura sempre estarão na mesma trilha de seus respectivos discos, deixamos de chamá-las de trilhas e passamos a usar o termo "cilindro". ..............
Um cilindro nada mais é do que o conjunto de trilhas com o mesmo número nos vários discos. Por exemplo, o cilindro 1 é formado pela trilha 1 de cada face de disco, o cilindro 2 é formado pela trilha 2 de cada face, e assim por diante.
Em essência, quando falamos em trilhas e cilindros, estamos usando nomes diferentes para falar sobre a mesma coisa.
Qual
é a diferença entre "tamanho" e "tamanho em disco" de um
arquivo?
As variações dependem
da extensão e do tipo de sistema de arquivos. (Fonte da imagem: Reprodução/Tecmundo)
Encontre um arquivo qualquer em seu
computador. Clique sobre ele com o botão direito do mouse, acesse a opção
“Propriedades” e verifique os campos “Tamanho” e “Tamanho em disco”. Se a
extensão selecionada não estiver corrompida, é bastante provável que uma
diferença entre ambos tamanhos salte logo aos seus olhos. Mas por que isso
acontece?
Grosso modo, “tamanho em disco” é justamente o
espaço ocupado por um arquivo em uma unidade de armazenamento qualquer (seja
ela um cartão de memória ou um HD). O “Tamanho” significa precisamente a
extensão de um dado — mas essa explicação deixa pouca coisa clara, não é? Então
que tal pensarmos em uma metáfora?
Cluster
e gaveta de joias
Para
que possamos entender as diferenças entre as variações de tamanho, comparar um HD
a qualquer outra unidade de armazenamento não parece ser algo tão absurdo,
certo? Pois então imagine uma gaveta de joias.
Agora, inclua em seu vocabulário o termo
“Cluster”, que pode ser entendido como a parcela determinada de armazenamento
de um HD que pode ser acessada por um sistema operacional – confira essa
definição traduzida sob a forma de uma simples comparação com a gaveta de
joias:
·
Unidade de armazenamento (HD) = gaveta de joias
·
Cluster = compartimentos internos da gaveta de joias
Entendida essa comparação, é hora então de esmiuçarmos cada um dos termos para entendermos de uma vez o porquê das diferenças entre o “tamanho em disco” e “tamanho” dos arquivos.
Não misture as joias!
Suponhamos que sua mãe odeie misturar seus
preciosos conjuntos de joias. O que fazer então quando colares, anéis e brincos
de um mesmo estilo não cabem todos em uma ou em duas das repartições da gaveta?
“Coloque o anel e o brinco faltantes em uma terceira repartição!”, sua mãe
diria – e nada mais poderia ser colocado junto com essas joias, pois os
brilhantes não podem ocupar o mesmo espaço de conjuntos diferentes.
Cada arquivo em seu Cluster!
Pense que um arquivo de 21 KB precisa ser
armazenado em seu HD (assim como um dos conjuntos de brilhantes de sua mãe, em
nossa metáfora). O “tamanho” dele é, por óbvio, 21 KB (esse será precisamente o
valor acusado em “tamanho” pelo sistema se você acessar as propriedades do
arquivo, inclusive). Mas cada cluster possui apenas 4 KB (sistema FAT 32) de
espaço livre (como se fossem as dimensões de cada compartimento da gaveta de
joias). Quantos clusters de 4 KB seriam ocupados por um arquivo de 21K?
Clusters podem ser
ocupados parcialmente, desperdiçando espaço. (Fonte da imagem: Reprodução/FCShop)
Faça as contas: 6 clusters de 4 KB, quando
multiplicados, resultam em 24 KB, certo? Significa que seu arquivo de 21 KB
ocuparia um “tamanho em disco” de 24 KB, pois são necessários 6 clusters de 4
KB para armazená-lo. 3 KB ainda ficariam sobrando neste sexto cluster. Assim
como sua mãe odeia misturar conjuntos de joias, seu sistema operacional também
se nega a ocupar um cluster (repartição da gaveta de joias) com dados de
arquivos diferentes. Neste exemplo, seu Windows exibiria as seguintes
informações em “Propriedades” do arquivo:
·
“Tamanho”: 21 KB
·
“Tamanho em disco”: 24 KB
Mas e se sua mãe decidir reformar as gavetas e
alterar as dimensões de cada uma das repartições? Saiba que é possível ajustar
também a capacidade de armazenamento de cada cluster e que o sistema de
arquivos varia de unidade para unidade.
Outra analogia: pense em baldes d`água
pense então em quatro baldes d`água, cada um
com capacidade total de armazenamento de 10 litros. Seu objetivo é depositar
nesses recipientes somente 35 litros. Então o que acontece? Três deles serão
ocupados completamente enquanto apenas a metade do quarto balde será usada,
certo?
O mesmo acontece se pensarmos em um arquivo:
ao armazenar um dado de 35 KB em clusters com capacidade de 10 KB cada, 5 KB
ficarão ainda sobrando em um quarto compartimento. Sendo assim, as diferenças
de tamanho seriam:
·
"Tamanho": 35 KB
·
"Tamanho em disco": 40 KB