Förstå olika format för komprimering, kryptering och arkivering
I datatid är arkiv en enda fil som lagrar i sig olika filer och mappar. Det finns flera arkivformat tillgängliga och varje har sina egna fördelar och nackdelar. Vissa arkivformat kommer med komprimeringsstöd (vilket gör din filstorlek mindre) medan andra stöder kryptering. Ja, och du gissade det, vissa arkivformat stöder både komprimering och kryptering. Låt oss ta reda på mer om de komprimerings- och krypteringsalgoritmer som används och de olika arkivformaten.
Komprimeringsalgoritm
Komprimeringsalgoritmen är den metod som arkivet använder för att komprimera filerna och göra den totala filstorleken mindre.
1. LZMA / LZMA2
Lempel-Ziv-Markov (LZMA) -kedjalgoritmen är en förlustfri datakomprimeringsalgoritm. LZMA använder en ordbokskomprimeringsalgoritm som utnyttjar komplexa datastrukturer för att koda en bit åt gången.
LZMA2 är en behållare som innehåller både okomprimerad och LZMA-komprimerad data. Den stöder multi-threaded komprimering och dekompression av data. Det kan också komprimera data som inte är komprimerbar med andra komprimeringsalgoritmer.
2. Burrows-Wheeler Transform Algorithm (BWT)
BWT fungerar genom att permutera en sträng text i ordning och komprimera dem genom att ersätta de upprepade tecknen i symboler.
3. PPM
Prediktion genom partiell matchning (PPM) är en statistisk datakomprimeringsmetod som fungerar genom att använda uppsättning tidigare symboler i den okomprimerade symbolströmmen för att förutsäga nästa symbol i strömmen.
4. Deflate
Deflate är en populär datakomprimeringsalgoritm som använder en kombination av LZ77- och Huffman-kodningsalgoritmer för att komprimera data (kombinerar LZMA- och PPM-algoritmer för att producera mer komprimering). Eftersom deflate inte innehåller implementeringar begränsade av patent har det blivit mycket populärt och används ofta, särskilt i Linux.
Krypteringsalgoritm
Låt oss nu gå igenom några av de populära krypteringsmetoderna:
1. DES
Datakryptering Standard använder privata hemliga nycklar för att kryptera och dekryptera data. Den hemliga nyckeln väljs slumpmässigt från ett 56-64-bitars adressutrymme.
2. AES
Advanced Encryption Standard är en krypteringsalgoritm som används av de amerikanska myndigheterna för att säkra känslig data. Du kan kryptera data med 128, 192 och 256 bitar kryptering. AES använder en algoritm för symmetrisk nyckel vilket innebär att en gemensam nyckel används för kryptering och sedan dekryptering av data.
3. Blowfish
Blowfish-krypteringsalgoritmen krypterar arkiven med en 64-bitars blockstorlek och en variabelnyckellängd på 32 till 448 bitar.
Obs! Det finns flera andra krypteringsalgoritmer men de ovan nämnda tre är de mest använda.
Arkivformat
Det finns olika arkivformat tillgängliga. Nedan kommer vi att utvärdera varje arkivformat med tre parametrar - oavsett om det stöder komprimering och kryptering, vilket operativsystem och programvara som är tillgängligt för dess användning.
1. Tjära
Tape Archive (Tar) är ett av de äldsta arkivformaten. Ursprungligen användes det för att kombinera och skriva data till sekventiella bandstationer, men standardiserades senare som ett komprimeringsformat. Tjära används mestadels i Linux och stöder inte komprimering eller kryptering. Du kan också använda den på Windows med installation av ytterligare programvara. De flesta moderna arkiveringsverktyg stöder detta format. Undantagen inkluderar Diskarkiv och KGB Arkiv.
2. GZ
GZ eller GZip är ett av de mest populära komprimeringsformat som används i både Windows och Linux. GZip använde deflat-komprimeringsalgoritmen för att komprimera de arkiverade filerna. GZip stöder också flerdelsfilöverföringar vilket innebär att du kan skapa mindre delar av en stor GZip-fil för enkel delning och överföring. Eftersom GZip är ganska populär, har de flesta moderna arkiveringsverktyg stöd för komprimering och dekomprimering av filer med GZip-formatet inklusive 7-Zip, BetterZip, PKZip, WinZip och WinRAR.
3. BZ / BZ2
BZ är mycket lik GZ men använder Burrows-Wheelers Transform Algorithm, vilket resulterar i lite mer komprimering och mindre filstorlek. Även om komprimeringen är långsam, är dekompression ganska snabb. De flesta av programvaran som stöder GZ stöder också BZ.
4. Zip
Zip är förmodligen det mest kända och använda arkiveringsformatet. Zip använder deflate-algoritmen och stöder förlustfri komprimering. Den stöder också AES och DES-kryptering. De flesta moderna operativsystem levereras med inbyggt stöd för Zip-format, så du behöver inte en separat programvara för arkivering och arkivering av Zip-filer.
5. 7Z
7Z arkiveringsformat infördes med ett gratis och open source-verktyg som heter 7-Zip. Det är det mest avancerade generella komprimerings- och arkiveringsformatet som stöder de flesta av datakomprimerings- och krypteringsalgoritmerna, inklusive de som vi har diskuterat ovan. 7Z-format komprimerar filerna mer än något annat format, men är relativt långsammare vid bearbetningen. En annan begränsning är att 7-Zip-programvaran bara är tillgänglig för Windows. Det finns inget visuellt stöd för Mac eller Linux. 7Z stöder också arkivering av flera delar.
6. RAR
RAR är ett proprietärt arkiveringsformat. Medan det kan läsas och extraheras av andra verktyg som 7-Zip och WinZip, kan det bara skapas med WinRAR-verktyget. RAR var det mest populära formatet för arkivering av flera delar innan 7Z släpptes. Nu kan 7Z göra samma uppgift gratis som RAR gör genom att låta sina användare betala för WinRAR-programvaran. RAR stöder AES-kryptering.
Andra komprimerings- och arkiveringsformat
Här är några av de relativt mindre kända formaten:
XZ är ett förlustfritt datakomprimeringsformat som använder LZMA2-komprimeringsalgoritmen. Det kan anses vara en avskalad version av 7Z.
LHA, tidigare känt som LHarc, används främst för komprimering av installationsfiler och spel (mestadels används i Japan). Intressant är den japanska versionen av Windows 7 med det inbyggda stödet för LHA-arkiv.
ACE är ett proprietärt datakompressionsarkivformat som var en konkurrent till RAR-format i början av 2000.
StuffIt släpptes främst för Mac, men versioner för Windows, Linux och Solaris släpptes efteråt. Detta är ett proprietärt komprimeringsformat som används av StuffIt-verktyg.
Slutsats
I Linux är det vanligaste formatet gz (eller tar.gz), följt av bz, medan i Windows eller Mac är det vanligaste formatet Zip. För plattformskompatibilitet är Zip-format den som ska användas. Om du vill ha funktioner som säkerhet, hög komprimering och arkivering av flera delar, gå till 7Z-format. RAR liknar 7Z förutom att det kommer med en prislapp. Undvik det så mycket som möjligt.
Vilket filformat och verktyg använder du för komprimering?
Bildkrediter: Vår, M-94 Cipher Device Replica