Ao contrário dos desktops, que utilizam gabinetes do tipo torre, os servidores utilizam tradicionalmente gabinetes 1U, 2U, 3U, 4U ou 6U, que são instalados em racks. Os números que dão nomes aos formatos dos gabinetes indicam justamente o número de baias que eles ocupam nos racks. Os gabinetes 1U ocupam uma única baia, os 2U ocupam duas e os 4U ocupam quatro, sendo que um rack de tamanho padrão possui até 42 baias:

Rack com três gabinetes 1U e rack vazio
Os servidores no formato 1U são preferidos por empresas de hospedagem e para uso em datacenters, pois são bastante compactos (apenas 4.4 cm de altura), o que permite instalar um grande número de servidores por rack. As principais limitações do formato são as limitações com relação à ventilação (devido ao pequeno espaço interno), o que dificulta o uso de processadores com consumo elétrico elevado e a necessidade de usar coolers e fontes especiais, o que encarece os projetos. Além dos componentes básicos, sobra em geral espaço para instalar 2 ou 4 HDs de 3.5″ (de acordo com a disposição dos demais componentes) e uma única placa de expansão, instalada na horizontal, com a ajuda de um riser:

Servidor em gabinete 1U
Com tão pouco espaço interno, o uso de exaustores de 80 mm, como os usados nas fontes de alimentação fica fora de questão. A solução é utilizar exaustores de 40 mm de alta rotação, geralmente agrupados em pares, de forma a aumentar ainda mais a pressão do ar. Esse design maximiza o deslocamento de ar dentro do gabinete, compensando o espaço reduzido, mas faz com que os servidores sejam bastante barulhentos. Isso não é um grande problema em um datacenter, mas você não iria gostar de trabalhar bem ao lado de um.

Exaustores duplos de 40 mm em um gabinete 1U
Alguns servidores utilizam drives ópticos, como o servidor da penúltima foto, mas eles são mais a exceção do que a regra. Embora muitos servidores ainda sejam instalados seguindo o processo manual, dando boot usando a mídia de instalação e seguindo os passos do instalador, cada vez mais empresas (sobretudo empresas de hospedagem) optam por utilizar imagens pré-configuradas, instaladas através da rede. Nesse caso, o servidor dá boot via PXE e um servidor de boot remoto fornece a imagem binária com o sistema, o que resulta em uma brutal economia de tempo em datacenters com muitos servidores.
Continuando, temos os gabinetes 2U. Eles utilizam fontes e coolers “normais” e por isso acabam sendo um pouco mais baratos. O maior espaço interno torna o formato 2U mais adequado para servidores com dois ou mais processadores, ou que utilizam processadores de alto consumo. A altura ainda não é suficiente para instalar placas de expansão na vertical, como nos desktops, mas é possível usar um riser (como no caso dos 1U), ou utilizar placas half-height (as placas mais baixas, que possuem metade da altura das placas normais).

Servidor em gabinete 2U
Finalmente, temos os servidores maiores, que utilizam gabinetes 3U ou 4U. Existem ainda servidores 6U, mas eles são raros: normalmente este formato é usado por arrays de disco e gabinetes para blade servers (veja o tópico a seguir). Usar um gabinete 3U ou maior elimina completamente os problemas com espaço, permitindo utilizar placas de expansão na vertical e um grande número de HDs instalados em baias removíveis, mas faz com que o servidor ocupe mais espaço no rack, o que aumenta os custos ao hospedá-lo em um datacenter, onde paga-se uma taxa extra por baia utilizada.

Gabinete 3U
Os racks permitem instalar um grande volume de servidores, switchs, roteadores e outros equipamentos em uma área relativamente pequena, além de facilitar a administração, já que permitem organizar melhor o cabeamento (e reduzir o comprimento dos cabos) e podem ser rapidamente substituídos. No caso de um data-center, onde o espaço é limitado e o número de servidores instalados chega às dezenas de milhares, os racks são uma solução natural.
Naturalmente, colocar tantos servidores em um espaço físico tão pequeno torna necessário o uso de um sistema de ar condicionado, para manter a temperatura e a umidade do ambiente em níveis ideais. A temperatura mais baixa e a pouca entrada de ar externo ajudam a aumentar a confiabilidade dos servidores, já que temperaturas mais baixas ajudam a aumentar a vida útil da maioria dos componentes e menos poeira significa menos problemas relacionados aos coolers.
Outro formato que vem se tornando cada vez mais popular são os blade servers (a palavra blade vem de “lâmina”, indicando as dimensões reduzidas do formato), uma idéia engenhosa para aumentar ainda mais a densidade dos servidores e permitir o compartilhamento de componentes em comum, como fontes de alimentação e discos ópticos.
A idéia é que ao invés de ter 10 servidores 1U, com 10 fontes (ou 20, caso fossem utilizadas fontes redundantes), 20 cabos de rede (cada servidor usa tipicamente dois cabos, um para a rede e outro para gerenciamento ou redundância), além de cabos de força, cabos usados pelo KVM e assim por diante, você possa usar um único gabinete, com um número equivalente de blade servers:

Gabinete com 10 blade servers
Esse design permite simplificar bastante a arquitetura dos servidores. Ao invés de uma ou duas fontes para cada servidor, o gabinete utiliza duas ou quatro fontes de maior capacidade, além de um único switch, um único KVM e assim por diante, compartilhados entre todos os blades. Todos os conectores são agrupados em um backbone, no fundo do gabinete, de forma que os servidores são simplesmente encaixados, como cartuchos, que podem ser substituídos sem precisar desligar todo o conjunto. Atualmente, existem modelos com até 12 servidores em um único gabinete 4U (ou mesmo 3U), o que permite instalar 100, 120 ou até mesmo 150 blade servers em um único rack.
Cada blade é um servidor completo, com processador, memória, placa de rede e discos. Devido ao tamanho reduzido, os blade servers utilizam tipicamente processadores de baixo consumo e HDs de 2.5″. No início, era comum o uso de processadores da Transmeta e da VIA, mas eles acabaram sendo quase que completamente substituídos por processadores Core 2 Duo e versões atualizadas do Xeon (no caso dos Intel) ou processadores Athlon X2, Opteron ou Phenom (no caso dos AMD), que são muito mais rápidos, mas, ainda assim, relativamente econômicos. No caso dos HDs, os discos de 2.5″ são preferidos por que oferecem tempos de acesso mais baixos (embora percam com relação à taxa de transferência), além do consumo elétrico e dimensões reduzidas.
Apesar do custo unitário ser muitas vezes mais alto (sem falar no custo por megabyte), é possível instalar 4 HDs de 2.5″ em aproximadamente o mesmo espaço de um único HD de 3.5″. Naturalmente, 4 HDs de 2.5″ em RAID oferecem um desempenho muito superior ao de um único HD de 3.5″, de forma que eles acabam fazendo mais sentido quando é necessário oferecer o melhor desempenho de acesso a disco possível e o espaço é um fator limitante. Em muitos casos, os HDs locais podem ser substituídos por um array de discos compartilhado, como veremos mais adiante no tópico sobre SAN.

HP BL35p, um exemplo de blade server
Note que as principais vantagens dos blade servers são a possibilidade de instalar mais servidores no mesmo espaço físico e reduzir o volume de trabalho consumido pelo cabeamento e manutenção dos servidores. Os blade servers não são necessariamente mais baratos (pelo contrário), de forma que, em ambientes onde o espaço não é problema, usar servidores tradicionais, em gabinetes 1U ou 2U acaba fazendo mais sentido, já que eles são (quase sempre) mais baratos e oferecem melhores possibilidades de expansão.
Uma outra forma de aumentar a densidade dos servidores, sem precisar colocar mais máquinas no mesmo espaço físico é usar virtualização. Um único servidor, com vários processadores, muita memória e muito espaço de armazenamento pode ser então dividido em vários servidores virtuais, utilizando o VMware Server (que vimos no capítulo sobre virtualização), o VMware ESX Server (a versão mais parruda do VMware Server), o Xen ou outra solução similar. Devido ao compartilhamento de recursos, os servidores virtuais podem até mesmo oferecer um desempenho superior ao de vários servidores menores no mesmo espaço físico.
É importante lembrar que uma das melhores formas de reduzir o custo de administração de uma rede local é justamente concentrar os serviços em menos servidores. Se levarmos em consideração todos os custos envolvidos, incluindo energia elétrica, mão-de-obra e perdas relacionadas ao downtime dos servidores, usar um único servidor parrudo, com fonte redundante e outros apetrechos pode sair mais barato a longo prazo do que usar 5 servidores menores montados com componentes padrão, mesmo que o custo inicial seja mais alto.
Concluindo, servidores em gabinetes tipo torre também existem e respondem por quase 1/4 dos servidores vendidos, sem contar os servidores montados, que utilizam componentes e gabinetes de micros desktop. Além de serem os mais comuns em redes locais e em empresas com poucos servidores, onde a questão do espaço não é um problema, eles estão se tornando comuns também em muitos datacenters, quebrando um pouco a tradição dos racks.
Embora ocupem um pouco mais de espaço que um gabinete 2U, as torres oferecem como vantagem o fato de serem mais baratas, o que em muitos casos compensa o maior uso de espaço. Temos aqui fotos de uma das seções de um dos data centers da ThePlanet, onde são usadas torres:

KVM
Embora os servidores sejam quase sempre administrados remotamente, é comum que seja usado um KVM para permitir o acesso local aos servidores quando necessário. Um KVM é um chaveador, que permite que um único conjunto de teclado, mouse e monitor seja usado para controlar várias máquinas, chaveando entre elas conforme necessário.
Existem KVMs voltados especificamente ao uso em servidores, que oferecem um grande número de saídas, são instalados diretamente no rack com os servidores e já incluem um conjunto de tela, teclado e mouse instalados dentro de uma gaveta, de forma a facilitar o acesso e reduzir o espaço ocupado:

Além dos KVMs de acesso local, temos também os modelos que oferecem acesso via rede, chamados de KVM over IP. Eles convertem a imagem recebida no cabo de vídeo em um sinal digital (normalmente comprimido usando um dos algoritmos do VNC), que é então transmitido via rede, juntamente com os sinais do teclado e do mouse. Em outras palavras, um KVM over IP é um KVM que pode ser acessado via rede a partir de qualquer lugar do mundo.
Em muitos casos, é usado um cliente em Java, que permite acessar o servidor sem nem mesmo precisar instalar software algum:

Tela de acesso remoto do KVM
Você pode se perguntar qual é a vantagem de utilizar um KVM over IP, se é possível administrar o servidor remotamente via SSH ou VNC, com um desempenho inclusive melhor. A grande questão é que o KVM é ligado diretamente nos conectores do vídeo, teclado e mouse e por isso funciona mesmo quando o servidor está desconectado da rede. Ou seja, o KVM over IP é útil justamente quando alguma coisa dá errado e o servidor fica inacessível através da rede, sem falar nos casos em que você precisa acessar as opções do setup, examinar as mensagens de boot para tentar descobrir o que está errado, ou simplesmente reinstalar o sistema remotamente.
Muitos datacenters oferecem a opção de locar o uso de um KVM over IP por um período determinado em caso de emergência, uma opção que pode ajudar você a dormir um pouco mais tranquilo, sabendo que poderá acessar seu servidor “localmente” usando o KVM em caso de problemas inesperados, como neste exemplo, onde estou abrindo um ticket para uma locação de 24 horas:

Outra opção, um pouco fora de moda mais ainda muito usada é o bom e velho terminal serial, onde toda a saída de texto (incluindo as mensagens exibidas durante o boot e a tela do Setup) são direcionadas para uma porta serial e exibidas em um terminal remoto, oferecendo algo similar ao obtido com um KVM, mas, nesse caso, apenas para modo texto.
Um outro servidor da rede, equipado com uma placa multiserial, tem cabos seriais ligados a vários outros servidores, servindo como um gateway de acesso a eles. Hoje em dia os cabos seriais são feitos usando cabos de rede, aproveitando a boa qualidade e o baixo custo dos cabos.
Quando um deles deixa de responder através da rede, você ainda pode acessar o servidor com os consoles seriais (mesmo remotamente) e acessar o servidor através dele. Alguns administradores chegam a deixar um modem programado para receber conexões, como uma última linha de defesa para o caso do switch ou do roteador da rede cair e toda a estrutura administrada por ele dentro do datacenter ficar inacessível remotamente.
Processadores
Como comentei no início, a economia de custos faz com que os componentes usados nos servidores sejam cada vez mais parecidos com os usados nos desktops, o que naturalmente inclui os processadores. Embora existam processadores específicos para uso em servidores, como o Sun UltraSPARC T1 (Niagara), a grande maioria dos servidores são baseados em processadores “domésticos”, como o Core 2 Duo e o Athlon X2, ou mesmo em processadores de baixo custo, como o Celeron e o Sempron.
Apesar disso, tanto a Intel quanto a AMD investem valores consideráveis em suas linhas de processadores destinados a servidores: do lado da Intel temos a linha Xeon (pronuncia-se “zion”) e do lado da AMD temos o Opteron. Ambas as plataformas são baseadas nas mesmas arquiteturas utilizadas nos processadores domésticos (novamente a questão da economia de custos), mas oferecem alguns diferenciais importantes no caso dos servidores, como o uso de mais cache, suporte a multiprocessamento e a presença de mais núcleos, recursos que podem ser implementados sem grandes mudanças no projeto do processador. Em geral, novos projetos começam sua carreira como chips para servidores (onde os fabricantes podem trabalhar com margens de lucro maiores) e só depois de algum tempo é que chegam ao mercado doméstico. Com isso, as linhas de processadores para servidores estão quase sempre um passo à frente.
Embora mais caros, eles são úteis em situações onde você precisa de um servidor com o maior poder de processamento possível. Como um servidor é usado por longos períodos, o custo do processador é amortizado por um longo período, por isso o gasto adicional pode acabar não fazendo tanta diferença no final das contas.
Tanto o Xeon quanto o Opteron passaram por várias encarnações. De forma que dizer “um servidor com processador Intel Xeon” não é muito mais descritivo do que dizer “um PC com processador Intel”. Existiram tantas versões do Xeon que pode-se tratar tanto de um servidor ultra-high-end, com 4 processadores e 16 núcleos quanto de uma velharia com mais de 10 anos de idade
. Vamos então a um resumo dos modelos do Xeon e do Opteron:
Intel Xeon
O primeiro modelo do Xeon era baseado no antigo Pentium II com core Deschutes (de 0.25 micron) e foi lançado em 1998. Diferente do Pentium II, onde o cache L2 operava à metade da freqüência do processador, o Xeon utilizava cache full-speed, com versões de 512 KB, 1 MB e 2 MB. Na época, ainda não existiam processadores com vários núcleos, mas era possível espetar 4 Xeons em uma placa-mãe baseada no chipset i450NX.
Esta versão inicial foi substituída em 1999 por versões baseadas no Pentium III. A primeira versão (core Tanner) era baseada no core Katmai (o mesmo usado na versão inicial do Pentium III regular), mas se diferenciava por existir em versões com até 2 MB de cache L2. Acompanhando o lançamento do Pentium III Coppermine, a Intel lançou o Xeon com core Cascades, que adotou o uso de cache L2 on-die, novamente em versões com até 2 MB de cache.
Estas versões iniciais utilizavam um formato de cartucho, similar ao usado nos processadores Pentium II, porém bem maior devido à necessidade de acomodar os chips de cache adicionais. Estes processadores utilizavam o slot 2, uma versão modificada do slot 1 usado pelo Pentium II, que possuía 330 contatos:

Pentium III Xeon
Até então, a marca “Xeon” era usada em conjunto com o “Pentium”, de forma que o Xeon baseado no Pentium III se chamava “Pentium III Xeon”. Em 2001, com o lançamento dos primeiros modelos baseados na arquitetura NetBurst (do Pentium 4) os processadores passaram a ser chamados apenas de “Xeon”. Surgiram então as séries “Xeon UP” (uni-processor), “Xeon DP” (dual-processor) e o “Xeon MP” (multi-processor). Como os nomes sugerem a principal diferença entre as três séries é que a série UP não oferece suporte a multiprocessamento, a DP permite o uso de apenas dois processadores, enquanto a MP permite o uso de quatro processadores (ou até oito, com o uso de hardware especial).
Embora as arquiteturas usadas sejam fundamentalmente as mesmas, as séries DP e MP atendem a ramos bastante diferentes e por isso acabaram evoluindo de forma distinta. Os processadores da série DP são essencialmente versões adaptadas dos processadores para micros desktop, com o suporte a SMP ativo, enquanto os processadores da série MP incorporam recursos adicionais, como o uso de cache L3. O suporte a 4 ou 8 processadores também exige o uso de chipsets e placas específicas, o que causou o desenvolvimento de soquetes específicos para cada uma das duas linhas.