Inhoudstabel
Wat is een cluster en wat is de clustergrootte?
Wanneer we denken aan het opslagmedium van onze computer, denken we vaak meteen aan de opslagcapaciteit: hoeveel gigabytes of terabytes we beschikbaar hebben om gegevens op te slaan. Maar wist je dat het opslagmedium eigenlijk bestaat uit talloze kleinere opslaglocaties? Deze kleinere eenheden worden clusters genoemd. Je kunt het vergelijken met een ladenkast, zoals je hieronder ziet. Elke lade in de kast is een cluster, en elke lade heeft altijd dezelfde grootte, wat we de clustergrootte noemen. Net zoals je spullen opbergt in de lades van een kast, worden bestanden opgeslagen in clusters op je computer. Het kiezen van de juiste clustergrootte heeft invloed op de efficiëntie van het opslaan en ophalen van je gegevens.
Wat is de beste clustergrootte?
Stel je nu voor dat je veel kleine schroefjes hebt. Zo’n ladenkast is ideaal, omdat je de schroefjes netjes kunt sorteren. Maar, als je ineens veel meer schroefjes hebt van één soort, zou je kunnen denken: “Had ik niet beter een kast met grotere lades kunnen nemen?” Want nu moet je dezelfde schroefjes in verschillende lades stoppen, en dat is minder handig. Dit illustreert goed dat de beste clustergrootte diegene is die het beste past bij de grootte van je bestanden. Omdat niet al je bestanden dezelfde grootte hebben, is de ideale clustergrootte in werkelijkheid de gemiddelde grootte van de bestanden op je schijf.
Het effect van de clustergrootte op snelheid
Theorie
De clustergrootte heeft in theorie invloed op de snelheid van lezen en schrijven van bestanden. Een bestand dat in één cluster past, kan sneller worden gelezen of geschreven dan een bestand dat in meerdere clusters moet worden opgeslagen. Dit komt omdat de schijf voor elk cluster extra tijd nodig heeft om de juiste locatie te vinden en de data te lezen of te schrijven. Als een bestand groter is dan één cluster, moet de schijf meerdere clusters achter elkaar lezen of schrijven, wat meer tijd kost.
Praktijk
In de praktijk merken we echter vaak amper snelheidsverschil op. Dit komt omdat het aanspreken van bijkomende clusters meestal niet de bottleneck is zoals vroeger. Moderne opslagmedia zoals SSD’s hebben geen fysieke lees- of schrijfbewegingen zoals HDD’s, wat de snelheid aanzienlijk verbetert, zelfs als meerdere clusters worden aangesproken.
Fragmentatie en SSD’s
Bij het gebruik van kleine clusters kan er meer fragmentatie optreden, vooral als je veel kleine bestanden opslaat. Fragmentatie betekent dat gegevens over meerdere clusters verspreid raken, wat de efficiëntie van het bestandssysteem kan verminderen.
Op een HDD
Op een HDD (harde schijf) kan fragmentatie de prestaties aanzienlijk vertragen, omdat de lees- en schrijfhulpstukken fysiek door de schijf moeten bewegen om gegevens uit verschillende plekken te lezen.
Op een SSD
Op een SSD is fragmentatie geen probleem in de traditionele zin. Bestanden worden niet actief herschreven of gekopieerd om ze bij elkaar te houden, zoals bij een HDD. Dankzij logische adressering en technieken zoals wear leveling en TRIM kan een SSD gegevens op willekeurige locaties opslaan zonder prestatieverlies. Fragmentatie heeft hierdoor nauwelijks invloed op de snelheid.
Er kan echter wel meer slijtage optreden omdat omdat bestanden die verspreid zijn over meerdere clusters meer lees en schrijfacties vereisen.
Welke clustergrootte moet ik kiezen?
Als Windows het opslaggeheugen formatteert, kiest het automatisch de meest geschikte clustergrootte. Dit is op basis van een gemiddelde Windows-installatie en houdt rekening met de grootte van de bestanden van een gemiddelde pc-gebruiker.
Wanneer je echter een extern opslagmedium gebruikt, zoals een externe schijf of een USB-stick, kun je beter kleine clusters gebruiken.* Snelheidswinst met grotere clusters is er amper, en bovendien worden deze externe opslagmedia vaak maar sporadisch gebruikt. Het belangrijkste doel is om zo veel mogelijk plaats te benutten, en dat doe je met kleine clusters.
* Uit uitgebreide tests op zowel een laptop met HDD als een moderne laptop met SSD blijkt dat de clustergrootte geen duidelijke invloed heeft op de snelheid. De clustergrootte is simpelweg niet de bottleneck, waardoor er in de praktijk geen meetbare snelheidsverschillen optreden.
Conclusie
Kleine clusters besparen ruimte en zorgen ervoor dat je opslagmedia efficiënter worden gebruikt, vooral bij kleine bestanden. Echter, het gebruik van kleinere clusters kan leiden tot meer slijtage op SSD’s.
Grote clusters kunnen handig zijn voor het werken met grote bestanden, maar de snelheidswinst is in de meeste gevallen minimaal. Het effect op moderne systemen is vaak verwaarloosbaar, maar het kan minder slijtage veroorzaken omdat grotere bestanden in minder clusters worden opgeslagen en minder vaak herschreven hoeven te worden.
Voor externe opslagmedia, zoals USB-sticks, is het raadzaam om kleine clusters te gebruiken om zoveel mogelijk ruimte te besparen. Externe opslagmedia worden minder intensief gebruikt waardoor slijtage sowieso geen probleem is.