MommyQueen: Kompressi file

Data tidak hanya disajikan dalam bentuk teks, tetapi juga dapat
berupa gambar, audio (bunyi, suara, musik) dan video. Keempat macam data
tersebut sering disebut dengan multimedia.

Pada umumnya representasi data digital membutuhkan memori yang besar,
disisi lain kebanyakan data misalnya citra (image) mengandung duplikasi.
Duplikasi ini dapat berarti dua hal. Pertama, besar kemungkinan suatu
pixel dengan pixel lain tetangganya memiliki intensitas yang sama,
sehingga penyimpanan setiap pixel memboroskan tempat. Kedua, citra
banyak mengandung bagian (region) yang sama, sehingga bagian yang sama
ini tidak perlu dikodekan berulang kali. Saat ini, kebanyakan aplikasi
menginginkan representasi dengan memori yang lebih sedikit. Pemampatan
data atau kompresi data (data compression) bertujuan meminimalkan
kebutuhan memori untuk merepresentasikan data digital. Prinsip
umum yang digunakan pada proses kompresi adalah mengurangi duplikasi
data sehingga memori untuk merepresentasikan menjadi lebih sedikit
daripada representasi data digital semula.

Data digital yang telah dikompresi dapat dikembalikan ke bentuk data
digital semula (dekompresi) dimana hal ini tergantung pada aplikasi
software yang mendukung kompresi tersebut. Ketika suatu aplikasi mampu
‘menghilangkan’ atau mengkompresi data yang tidak dibutuhkan maka
aplikasi tersebut juga mampu mengembalikan data yang dihilangkan
tersebut sehingga menjadi data digital semula (dekompresi) namun
terdapat juga suatu aplikasi yang dapat mengkompresi namun ketika
dekompresi dapat menggunakan aplikasi lain contohnya aplikasi winzip
dengan aplikasi winrar.

Contoh software sound forge yang digunakan untuk mengkompresi data
digital namun hasil yang didapat malah ukuran yang dihasilkan lebih
besar`daripada ukuran data digital semula dimana hal ini dapat terjadi
karena terdapat informasi-informasi yang tidak dikenali software ini
sehingga terjadi penambahan informasi oleh software ini sehingga ukuran
menjadi lebih besar. Bila dibandingkan dengan software permainan atau
games terdapat informasi yang lebih banyak dikompresi karena terdapat
informasi yang bisa dikompresi.

Image atau citra yang ditransmisikan sepanjang world wide web merupakan salah satu contoh mengapa kompresi data diperlukan.

Ada empat pendekatan yang digunakan pada kompresi suatu data, yaitu:

1. Pendekatan statistik
Kompresi didasarkan pada frekuensi kemunculan derajat keabuan pixel didalam seluruh bagian.

Contoh metode : Huffman Coding.

2. Pendekatan ruang
Kompresi didasarkan pada hubungan spasial antara pixel-pixel di
dalam suatu kelompok yang memiliki derajat keabuan yang sama dalam
suatu daerah gambar atau data.

Contoh metode : Run-Length Encoding.

3. Pendekatan kuantisasi
Kompresi dilakukan dengan mengurangi jumlah derajat keabuan yang tersedia.

Contoh metode : kompresi kuantisasi (CS&Q).

4. Pendekatan fraktal
Kompresi dilakukan pada kenyataan bahwa kemiripan bagian-bagian
didalam data atau citra atau gambar dapat dieksploitasi dengan suatu
matriks transformasi.

Contoh metode : Fractal Image Compression.

Metode pemampatan data atau kompresi data dapat dikelompokan dalam dua kelompok besar, yaitu:

I. Metode lossless

Lossless data kompresi adalah kelas dari algoritma data kompresi yang
memungkinkan data yang asli dapat disusun kembali dari data kompresi.
Lossless data kompresi digunakan dalam berbagai aplikasi seperti format
ZIP dan GZIP. Lossless juga sering digunakan sebagai komponen dalam
teknologi kompresi data lossy. Kompresi Lossless digunakan ketika
sesuatu yang penting pada kondisi asli. Beberapa format gambar sperti
PNG atau GIF hanya menggunakan kompresi lossless, sedangkan yang lainnya
sperti TIFF dan MNG dapat menggunakan metode lossy atau lossless.

Metode lossless menghasilkan data yang identik dengan data aslinya, hal
ini dibutuhkan untuk banyak tipe data, contohnya: executable code, word
processing files, tabulated numbers,dan sebagainya. Misalnya pada citra
atau gambar dimana metode ini akan menghasilkan hasil yang tepat sama
dengan citra semula, pixel per pixel sehingga tidak ada informasi yang
hilang akibat kompresi. Namun ratio kompresi (Rasio kompresi yaitu,
ukuran file yang dikompresi dibanding yang tak terkompresi dari file)
dengan metode ini sangat rendah. Metode ini cocok untuk kompresi citra
yang mengandung informasi penting yang tidak boleh rusak akibat
kompresi, misalnya gambar hasil diagnosa medis. Contoh metode lossless
adalah metode run-length, Huffman, delta dan LZW.

TEKNIK KOMPRESI LOSSLESS

Kebanyakan program kompresi lossless menggunakan dua jenis algoritma
yang berbeda: yang satu menghasilkan model statistik untuk input data,
dan yang lainnya memetakan data input ke rangkaian bit menggunakan model
ini dengan cara bahwa “probable” data akan menghasilkan output yang
lebih pendek dari “improbable” data. algoritma encoding yang utama yang
dipakai untuk menghasilkan rangkaian bit adalah Huffman coding dan
Aritmatik Coding.

II. Metode lossy

Lossy kompresi adalah suatu metode untuk mengkompresi data dan
men-dekompresinya, data yang diperoleh mungkin berbeda dari yang aslinya
tetapi cukup dekat perbedaaanya. Lossy kompresi ini paling sering
digunakan untuk kompres data multimedia (Audio, gambar diam).
Sebaliknya, kompresi lossless diperlukan untuk data teks dan file,
seperti catatan bank, artikel teks dll.

Format kompresi lossy mengalami generation loss yaitu jika melakukan
berulang kali kompresi dan dekompresi file akan menyebabkan kehilangan
kualitas secara progresif. hal ini berbeda dengan kompresi data
lossless. ketika pengguna yang menerima file terkompresi secara lossy
(misalnya untuk mengurangi waktu download) file yang diambil dapat
sedikit berbeda dari yang asli dilevel bit ketika tidak dapat dibedakan
oleh mata dan telinga manusia untuk tujuan paling praktis.

Metode ini menghasilkan ratio kompresi yang lebih besar daripada metode
lossless. Misal terdapat image asli berukuran 12,249 bytes, kemudian
dilakukan kompresi dengan JPEG kualitas 30 dan berukuran 1,869 bytes
berarti image tersebut 85% lebih kecil dan ratio kompresi 15%. Contoh
metode lossy adalah metode CS&Q (coarser sampling and/or
quantization), JPEG, dan MPEG.

Ada dua skema dasar lossy kompresi :

• Lossy transform codec, sampel suara atau gambar yang
diambil, di potong kesegmen kecil, diubah menjadi ruang basis yang baru,
dan kuantisasi. hasil nilai kuantisasi menjadi entropy coded

• Lossy predictive codec, sebelum dan/atau sesudahnya
data di-decode digunakan untuk memprediksi sampel suara dan frame
picture saat ini. kesalahan antara data prediksi dan data yang nyata,
bersama-sama dengan informasi lain digunakan untuk mereproduksi
prediksi, dan kemudian dikuantisasi dan kode.

Dalam beberapa sistem kedua teknik digabungkan, dengan mengubah codec
yang digunakan untuk mengkompresi kesalahan sinyal yang dihasilkan dari
tahapan prediksi.

LOSSY Vs LOSSLESS

• Keuntungan dari metode lossy atas lossless adalah dalam bebeapa
kasus metode lossy dapat menghasilkan file kompresi yang lebih kecil
dibandingkan dengan metode lossless yang ada, ketika masih memenuhi
persyaratan aplikasi.

• Metode lossy sering digunakan untuk mengkompresi suara, gambar dan
video. karena data tersebut dimaksudkan kepada human interpretation
dimana pikiran dapat dengan mudah “mengisi bagian-bagian yang kosong”
atau melihat kesalahan masa lalu sangat kecil atau
inkonsistensi-idealnya lossy adalah kompresi transparan, yg dapat
diverifikasi dengan tes ABX. Sedangkan lossless digunakan untuk
mengkompresi data untuk diterima ditujuan dalam kondisi asli seperti
dokumen teks.

• Lossy akan mengalami generation loss pada data sedangkan pada lossless
tidak terjadi karena data yang hasil dekompresi sama dengan data asli.

sumber : http://nurilla7.wordpress.com/2008/11/05/kompresi-data-lossy-dan-lossless/

MommyQueen

Sabtu, 18 Desember 2010

Kompressi file

Tidak ada komentar:

Posting Komentar

Pengikut