Just denna vecka började Spotify testa "förlustfria" ljudfiler. Men vad är "förlustlöst" ljud, exakt, och hur fungerar digital ljudkomprimering?

Hur fungerar ljudkomprimering?

Målet med ljudkomprimering är att minska antalet bitar som krävs för att exakt reproducera ett analogt ljud. Den första processen vi tittar på heter "lossy". Lossy compression är en enkelriktad teknik som slänger bort icke kritiska data för att spara utrymme. Dessa tekniker är de vanligaste metoderna för att komprimera ljudfiler, som visas i MP3, AAC och WMA-filer. Det finns två ställen som lossy codecs ser ut att spara bitar: bithastighet och psykoakustik.

Bithastighet

Bithastighet mäter mängden bitar som används för att koda en enda sekund av ljud. Om vi ​​till exempel använder 8 kilobit per sekund (kbps) kodning av låg kvalitet, är vår algoritm begränsad till att endast använda 8 kilobits data för att beskriva varje sekund av ljud. Det är som att försöka beskriva ett fullfärgsfotografi med bara några hundra pixlar. Du kan få de breda stregerna rätt, men överlag ser du på en allvarligt försämrad bild. Om vi ​​använder en högre bithastighet som 192 kbps, har vi gott om utrymme för att täcka nyanserade detaljer. För att återgå till vårt fotografiska exempel har vi nu tillräckligt många pixlar för att beskriva olika ljus, mörker och färger i en bild. En hög bithastighet bestämmer inte kvaliteten på en inspelning på egen hand, men en låg bithastighet kan allvarligt begränsa utskriftskvaliteten.

psykoakustik

Psykoakustik är vetenskapen om hur hjärnan förstår ljud. Genom att manipulera kända egenskaper i det sätt människor uppfattar ljud kan komprimeringsalgoritmer snygga ta bort detaljer som de flesta mänskliga öron inte kommer att sakna. Målet är att "avrunda" information som inte kommer att ändra den upplevda ljudkvaliteten hos ett spår, vilket medför att man bara tar bort obetydlig information.

Till exempel kanske du vet att det typiska intervallet av mänsklig hörsel är mellan 20 Hz och 20 kHz. Självklart kan ljud utanför det intervallet tas bort. Vidare är det mest detaljerade intervallet av mänsklig hörsel mellan 100Hz och 4kHz, och att ta bort tysta ljud utanför dessa frekvensområden gör minimal skada på kvaliteten på en inspelning. Vi kan göra ett liknande trick med starkt kontrasterande ljud. Om ett mycket högt ljud och ett mycket lugnt ljud spelar samtidigt, är det tysta ljudet mycket svårare att uppfatta än det skulle vara på egen hand. Kodare utnyttjar denna "ljudmaskering" för att ta bort det tysta ljudet och spara bitar i processen.

Frekvens kan också påverka hur väl vi uppfattar ljud. Till exempel tenderar en persistent, lågfrekvent trumslag att drunkna ut de mer delikat, högre frekvensen övertoner av melodiska instrument. Och ljudmaskering är särskilt effektiv över 15 kHz, där mänsklig hörsel typiskt är mindre känslig för att börja med.

Vanliga ljudkomprimeringssystem som MP3 utnyttjar komplett utbud av komprimeringsmöjligheter samtidigt som de försöker hålla sig så trogen på den ursprungliga inspelningen som möjligt. Självklart, vissa människor tycker om att ta bort dessa frekvenser gör allvarliga skador på inspelningen. Därför finns förlustfria kompressionsstandarder.

Vad är "Lossless" Audio?

Förlustfri ljudkomprimering är att minska filstorleken, samtidigt som originalljudet blir orörd. Dessa codecs använder inte någon av de permanenta komprimeringsteknikerna ovan, utan istället fokuserar på helt reversibla datakomprimeringsmetoder. De använder förlustfria komprimeringstekniker som lånas från filkomprimeringsalgoritmer som ZIP för att ta bort överflödiga data samtidigt som integriteten hos den underliggande informationen bevaras. Två populära lossless audio codecs - FLAC och Apple Lossless (ALAC) - båda använder system baserat på ZIP-komprimering.

Att fokusera på datakomprimering innebär bara att man behåller många av de detaljer som MP3 och andra förluststandarder skulle utplåna. Om du har skarpa öron och en högkvalitativ lyssningsinställning kan skillnaden vara palpabel.

Lossless kompression är inte bara bra för att lyssna, men det är också ett bra lagringsverktyg. Precis som att du inte vill ha en 72dpi JPG för att vara den enda digitala kopian av Ansel Adams fotografier, vill vi inte bara 128kbps MP3-filer av "Kind of Blue". Lösliga standarder som FLAC gör att vi kan lagra ljud effektivt utan att kasta bort potentiellt värdefulla uppgifter. De gör också remastering och omfördelning av ljudet lättare, eftersom start med kompromissade mästare betyder en högre kvalitetsprodukt.

Slutsats: Kan du berätta skillnaden?

Lossless ljudformat möjliggör bättre ljudinspelningar. Men ibland är skillnaderna mellan en högkvalitativ MP3 och en förlustfri fil nästan omärkbar, särskilt för det otränade örat. Om du vill se om dina hörlurar (och öron) är angelägna att berätta för skillnaden, har NPR ett roligt test. bara kom ihåg att billiga hörlurar och bärbara högtalare inte kommer att kunna reproducera de subtila skillnaderna mellan förlustfri ljud och MP3-filer. För en mer allvarlig analys av codecs, kolla in SoundExperts kodgivare betyg.