Sabtu, 18 Desember 2010

Kompressi file

Data tidak hanya disajikan dalam bentuk teks, tetapi juga dapat 
berupa gambar, audio (bunyi, suara, musik) dan video. Keempat macam data
tersebut sering disebut dengan multimedia.

Pada umumnya representasi data digital membutuhkan memori yang besar, 
disisi lain kebanyakan data misalnya citra (image) mengandung duplikasi.
Duplikasi ini dapat berarti dua hal. Pertama, besar kemungkinan suatu 
pixel dengan pixel lain tetangganya memiliki intensitas yang sama, 
sehingga penyimpanan setiap pixel memboroskan tempat. Kedua, citra 
banyak mengandung bagian (region) yang sama, sehingga bagian yang sama 
ini tidak perlu dikodekan berulang kali. Saat ini, kebanyakan aplikasi 
menginginkan representasi dengan memori yang lebih sedikit. Pemampatan 
data atau kompresi data (data compression) bertujuan meminimalkan 
kebutuhan memori untuk merepresentasikan data digital. Prinsip 
umum yang digunakan pada proses kompresi adalah mengurangi duplikasi 
data sehingga memori untuk merepresentasikan menjadi lebih sedikit 
daripada representasi data digital semula.

Data digital yang telah dikompresi dapat dikembalikan ke bentuk data 
digital semula (dekompresi) dimana hal ini tergantung pada aplikasi 
software yang mendukung kompresi tersebut. Ketika suatu aplikasi mampu 
‘menghilangkan’ atau mengkompresi data yang tidak dibutuhkan maka 
aplikasi tersebut juga mampu mengembalikan data yang dihilangkan 
tersebut sehingga menjadi data digital semula (dekompresi) namun 
terdapat juga suatu aplikasi yang dapat mengkompresi namun ketika 
dekompresi dapat menggunakan aplikasi lain contohnya aplikasi winzip 
dengan aplikasi winrar.

Contoh software sound forge yang digunakan untuk mengkompresi data 
digital namun hasil yang didapat malah ukuran yang dihasilkan lebih 
besar`daripada ukuran data digital semula dimana hal ini dapat terjadi 
karena terdapat informasi-informasi yang tidak dikenali software ini 
sehingga terjadi penambahan informasi oleh software ini sehingga ukuran 
menjadi lebih besar. Bila dibandingkan dengan software permainan atau 
games terdapat informasi yang lebih banyak dikompresi karena terdapat 
informasi yang bisa dikompresi.

Image atau citra yang ditransmisikan sepanjang world wide web merupakan salah satu contoh mengapa kompresi data diperlukan.

Ada empat pendekatan yang digunakan pada kompresi suatu data, yaitu:

1. Pendekatan statistik
Kompresi didasarkan pada frekuensi kemunculan derajat keabuan pixel didalam seluruh bagian.

Contoh metode : Huffman Coding.

2. Pendekatan ruang
Kompresi didasarkan pada hubungan spasial antara pixel-pixel di
dalam suatu kelompok yang memiliki derajat keabuan yang sama dalam 
suatu daerah gambar atau data.

Contoh metode : Run-Length Encoding.

3. Pendekatan kuantisasi
Kompresi dilakukan dengan mengurangi jumlah derajat keabuan yang tersedia.

Contoh metode : kompresi kuantisasi (CS&Q).

4. Pendekatan fraktal
Kompresi dilakukan pada kenyataan bahwa kemiripan bagian-bagian
didalam data atau citra atau gambar dapat dieksploitasi dengan suatu 
matriks transformasi.

Contoh metode : Fractal Image Compression.

Metode pemampatan data atau kompresi data dapat dikelompokan dalam dua kelompok besar, yaitu:

I. Metode lossless

Lossless data kompresi adalah kelas dari algoritma data kompresi yang 
memungkinkan data yang asli dapat disusun kembali dari data kompresi. 
Lossless data kompresi digunakan dalam berbagai aplikasi seperti format 
ZIP dan GZIP. Lossless juga sering digunakan sebagai komponen dalam 
teknologi kompresi data lossy. Kompresi Lossless digunakan ketika 
sesuatu yang penting pada kondisi asli. Beberapa format gambar sperti 
PNG atau GIF hanya menggunakan kompresi lossless, sedangkan yang lainnya
sperti TIFF dan MNG dapat menggunakan metode lossy atau lossless.

Metode lossless menghasilkan data yang identik dengan data aslinya, hal 
ini dibutuhkan untuk banyak tipe data, contohnya: executable code, word 
processing files, tabulated numbers,dan sebagainya. Misalnya pada citra 
atau gambar dimana metode ini akan menghasilkan hasil yang tepat sama 
dengan citra semula, pixel per pixel sehingga tidak ada informasi yang 
hilang akibat kompresi. Namun ratio kompresi (Rasio kompresi yaitu, 
ukuran file yang dikompresi dibanding yang tak terkompresi dari file) 
dengan metode ini sangat rendah. Metode ini cocok untuk kompresi citra 
yang mengandung informasi penting yang tidak boleh rusak akibat 
kompresi, misalnya gambar hasil diagnosa medis. Contoh metode lossless 
adalah metode run-length, Huffman, delta dan LZW.

TEKNIK KOMPRESI LOSSLESS

Kebanyakan program kompresi lossless menggunakan dua jenis algoritma 
yang berbeda: yang satu menghasilkan model statistik untuk input data, 
dan yang lainnya memetakan data input ke rangkaian bit menggunakan model
ini dengan cara bahwa “probable” data akan menghasilkan output yang 
lebih pendek dari “improbable” data. algoritma encoding yang utama yang 
dipakai untuk menghasilkan rangkaian bit adalah Huffman coding dan 
Aritmatik Coding.

II. Metode lossy

Lossy kompresi adalah suatu metode untuk mengkompresi data dan 
men-dekompresinya, data yang diperoleh mungkin berbeda dari yang aslinya
tetapi cukup dekat perbedaaanya. Lossy kompresi ini paling sering 
digunakan untuk kompres data multimedia (Audio, gambar diam). 
Sebaliknya, kompresi lossless diperlukan untuk data teks dan file, 
seperti catatan bank, artikel teks dll.

Format kompresi lossy mengalami generation loss yaitu jika melakukan 
berulang kali kompresi dan dekompresi file akan menyebabkan kehilangan 
kualitas secara progresif. hal ini berbeda dengan kompresi data 
lossless. ketika pengguna yang menerima file terkompresi secara lossy 
(misalnya untuk mengurangi waktu download) file yang diambil dapat 
sedikit berbeda dari yang asli dilevel bit ketika tidak dapat dibedakan 
oleh mata dan telinga manusia untuk tujuan paling praktis.

Metode ini menghasilkan ratio kompresi yang lebih besar daripada metode 
lossless. Misal terdapat image asli berukuran 12,249 bytes, kemudian 
dilakukan kompresi dengan JPEG kualitas 30 dan berukuran 1,869 bytes 
berarti image tersebut 85% lebih kecil dan ratio kompresi 15%. Contoh 
metode lossy adalah metode CS&Q (coarser sampling and/or 
quantization), JPEG, dan MPEG.

Ada dua skema dasar lossy kompresi :

Lossy transform codec, sampel suara atau gambar yang 
diambil, di potong kesegmen kecil, diubah menjadi ruang basis yang baru,
dan kuantisasi. hasil nilai kuantisasi menjadi entropy coded

• Lossy predictive codec, sebelum dan/atau sesudahnya 
data di-decode digunakan untuk memprediksi sampel suara dan frame 
picture saat ini. kesalahan antara data prediksi dan data yang nyata, 
bersama-sama dengan informasi lain digunakan untuk mereproduksi 
prediksi, dan kemudian dikuantisasi dan kode.

Dalam beberapa sistem kedua teknik digabungkan, dengan mengubah codec 
yang digunakan untuk mengkompresi kesalahan sinyal yang dihasilkan dari 
tahapan prediksi.

LOSSY Vs LOSSLESS

• Keuntungan dari metode lossy atas lossless adalah dalam bebeapa 
kasus metode lossy dapat menghasilkan file kompresi yang lebih kecil 
dibandingkan dengan metode lossless yang ada, ketika masih memenuhi 
persyaratan aplikasi.

• Metode lossy sering digunakan untuk mengkompresi suara, gambar dan 
video. karena data tersebut dimaksudkan kepada human interpretation 
dimana pikiran dapat dengan mudah “mengisi bagian-bagian yang kosong” 
atau melihat kesalahan masa lalu sangat kecil atau 
inkonsistensi-idealnya lossy adalah kompresi transparan, yg dapat 
diverifikasi dengan tes ABX. Sedangkan lossless digunakan untuk 
mengkompresi data untuk diterima ditujuan dalam kondisi asli seperti 
dokumen teks.

• Lossy akan mengalami generation loss pada data sedangkan pada lossless
tidak terjadi karena data yang hasil dekompresi sama dengan data asli.


Tidak ada komentar:

Posting Komentar