Hitta och ta bort duplicerade filer i Linux
Det kan tyckas onödigt att oroa sig för dubbla filer när du har terabytes av lagring. Men om du bryr dig om filorganisation, vill du undvika dubbletter på ditt Linux-system. Du kan hitta och ta bort dubbla filer antingen via kommandoraden eller med en specialiserad skrivbordsapp.
Använd kommandot "Sök"
Om du inte är bekant med detta kraftfulla kommando kan du lära dig om det i vår guide. Genom att kombinera find
med andra viktiga Linux-kommandon, som xargs, kan vi få en lista över dubbla filer i en mapp (och alla dess undermappar). Kommandot jämför först filer efter storlek och kontrollerar sedan sina MD5-haschar, vilka är unika bitar av information om varje fil. För att söka efter dubbla filer, öppna konsolen, navigera till önskad mapp och skriv:
find -not -empty -type f -printf "% s \ n" | sort -rn | uniq -d | xargs -I {} -n1 hitta -typ f -size {} c -print0 | xargs -0 md5sum | sortera | uniq -w32 --all-upprepad = separat
Denna en-liner gör följande:
find -not -empty -type f -printf "%s\n"
- letar efter vanliga filer som inte är tomma och skriver ut deras storlek. Om du bryr dig om filorganisation kan du enkelt hitta och ta bort dubbla filer antingen via kommandoraden eller med en specialiserad skrivbordsapp.
sort -rn
- sorterar filstorlekarna i omvänd ordning.
uniq -d | xargs -I{} -n1 find -type f -size {}c -print0
uniq -d | xargs -I{} -n1 find -type f -size {}c -print0
- skriver ut endast dubbla linjer. I det här fallet namn på dubbla filer.
xargs -0 md5sum | sort |
- sorterar MD5-hasharna i skannade filer.
uniq -w32 --all-repeated=separate
- jämför de första 32 tecknen i MD5-hash och skriver ut de som är dubbletter.
Observera att det här kommandot inte automatiskt tar bort dubbletter - det matar bara ut en lista, och du kan radera filer manuellt om du vill. Om du föredrar att hantera dina filer i en applikation som erbjuder flera alternativ på en gång kan nästa lösning passa dig.
Anställ dupeGuru
DupeGuru är en plattformsapplikation som kommer i tre utgåvor: Standard (SE), Musik och Bild. Det är utformat för att hitta dubbla filer baserat på flera kriterier (filnamn, filstorlek, MD5 hashes) och använder fuzzy-matchning för att upptäcka liknande filer. Windows och OS X-användare kan ladda ner installationsfilerna från den officiella webbplatsen, och Ubuntu-användare kan dra dupeGuru från förvaret:
sudo add-apt-repository ppa: hsoft / ppa sudo apt-uppdatera sudo apt-get install dupeguru
För att söka efter dubbletter lägger du först några mappar genom att trycka på "+" -knappen. Att ställa in en mappstatus till "Referens" betyder att andra mappar innehåll jämförs med det. Innan du klickar på "Scan", markera dialogrutan "Visa -> Inställningar" för att säkerställa att allt är korrekt inställt.
Om du bryr dig om filorganisation kan du enkelt hitta och ta bort dubbla filer antingen via kommandoraden eller med en specialiserad skrivbordsapp.
"Skanningstyp" varierar mellan dupeGuru-utgåvor; I Standard kan du jämföra filer och mappar med innehåll och filnamn. Bildutgåva erbjuder jämförelse med EXIF tidsstämpel och "Bildblock" - ett tidskrävande alternativ som delar varje bild i ett rutnät och beräknar medelfärgen för varje sida. I Music edition kan du analysera "Fält", "Taggar" och "Ljudinnehåll." Vissa inställningar beror på skanningstypen: "Word-viktning" och "Matcha liknande ord" fungerar bara när du söker efter filnamn. Omvänt gäller inte "Filterhårdhet" när du utför en "Innehåll" -sökning.
DupeGuru kan ignorera små filer och länkar (genvägar) till en fil och låter dig använda reguljära uttryck för att ytterligare anpassa din fråga. Du kan också spara sökresultat för att fungera senare. Apple fans kommer att älska det faktum att dupeGuru stöder iPhoto och Aperture-bibliotek och kan hantera iTunes-bibliotek.
När dupeGuru hittar dubbletter öppnas ett nytt fönster med referensfiler färgade i blått och deras dubbletter listade nedan. Verktygsfältet visar grundläggande information, och du kan se mer om varje fil om du markerar den och klickar på knappen "Detaljer".
Du kan hantera dubbla filer direkt från dupeGuru - menyn "Åtgärder" visar allt du kan göra. Välj filer genom att markera kryssrutan eller klicka på deras namn; Du kan välja alla eller flera filer med tangentbordsgenvägar (håll Shift / Ctrl och klicka på önskade filer). Om du är intresserad av skillnader mellan dubbla filer, växlar du Delta-värden. Resultaten kan prioriteras (så filerna listade som dupes blir referenser) och sorteras enligt olika kriterier som ändringsdatum och storlek. Den officiella dupeGuru användarhandboken är användbar och tydlig skrivet, så du kan lita på den om du någonsin fastnar.
Naturligtvis skulle det vara mer praktiskt om dupeGuru inte delades upp i tre utgåvor - de flesta användare älskar ju enstaka lösningar. Ändå, om du inte vill använda kommandot find, ger dupeGuru ett snyggt och snabbt sätt att utrota dupes från ditt filsystem. Kan du rekommendera några andra verktyg för att ta bort dubbla filer? Föredrar du kommandoraden för den här uppgiften? Berätta för oss i kommentarerna.