Pengantar
Audio data datang dalam berbagai bentuk kadang-kadang membingungkan. Jumlah cara mendasar di mana suara dapat diwakili sebenarnya cukup kecil. Berbagai jenis file audio adalah karena fakta bahwa ada cukup beberapa pendekatan untuk data audio mengompresi dan sejumlah cara yang berbeda dari kemasan data. Kami pertama-tama menjelaskan bagaimana data audio sendiri diwakili, maka bagaimana itu dibungkus ke file. Orang sering berbicara tentang format audio sembarangan tanpa membedakan antara format data dan format file, tetapi sangat penting untuk menjaga perbedaan ini dalam pikiran banyak format file dapat berisi tanggal direpresentasikan di lebih dari satu cara dan sebagian besar representasi data dapat dikemas di lebih dari satu format file. Mengatakan bahwa file suara adalah ". Wav" file mengatakan apa-apa tentang format data audio. Demikian pula, mengatakan bahwa file berisi data PCM mengatakan apa-apa tentang format file.
Suara terdiri dari variasi terdengar dalam tekanan udara. Mikrofon mengubah variasi tekanan udara menjadi tegangan yang bervariasi. Untuk mewakili suara digital, kita harus mengkonversi tegangan ini bervariasi menjadi serangkaian angka yang mewakili amplitudonya. Proses ini dikenal sebagai-ke-digital konversi analog. Data Audio terdiri dari angka tersebut dikatakan dalam kode format modulasi pulsa, disingkat PCM Audio data sering disimpan dalam format lain, biasanya dalam rangka untuk kompres itu, namun hampir selalu dimulai dalam format PCM.
Tingkat pengambilan sampel adalah jumlah kali per detik bahwa amplitudo dari sinyal diukur dan memiliki dimensi sampel per detik. Semakin tinggi sampling rate, semakin akurat sinyal sampel akan mewakili sinyal asli.. Pilihan laju sampling ditentukan oleh Nyquist Sampling Theorem Teorema ini menyatakan bahwa jika frekuensi maksimum di mana sinyal asli mengandung energi adalah F, maka jika sampel pada tingkat yang ketat lebih besar dari 2F sampel per detik, maka akan mungkin untuk merekonstruksi sinyal asli sempurna dari sinyal sampel. Dengan kata lain, sinyal sampel akan berisi semua informasi dalam sinyal asli.
Penting untuk dicatat bahwa laju sampling harus benar-benar lebih besar dari 2FSampling pada tingkat tepat 2F dapat mengakibatkan kesalahan. Sebagai contoh, anggaplah bahwa sinyal asli adalah gelombang sinus frekuensi F. Jika kita sampel pada frekuensi 2F, dengan sampel pertama pada waktu 0, semua contoh kami akan memiliki nilai 0. Gelombang sinus yang asli tidak bisa direkonstruksi dari seperti sinyal sampel. Hal ini mudah dilihat dalam ilustrasi berikut. All. Semua menunjukkan empat 1Hz gelombang sinus. Dua di sebelah kiri memiliki fase 0. Dua di sebelah kanan memiliki fase π. Kedua atas memiliki amplitudo 1.0. Dua bawah memiliki amplitudo 2.0. Jika kita sampel di dua sampel per detik dengan offset 0, semua contoh kami akan 0 pada semua empat kasus. Sinyal sampel tidak akan berisi informasi yang diperlukan untuk memutuskan mana dari empat sinyal asli untuk merekonstruksi.
Selanjutnya, teorema Nyquist didasarkan pada asumsi bahwa sinyal asli panjang tak terhingga. Jika tidak, sampling di lebih dari laju Nyquist dari 2F belum tentu mengizinkan reconsruction sempurna. Jika tingkat sampling hanya sedikit lebih besar dari tingkat Nyquist, kenaikan mungkin tidak menggeser titik sampling di atas cukup jauh untuk membuat nilai terkuantisasi berbeda. Perhatikan lagi contoh kita dari gelombang sinus. Let us suppose that its frequency is 1000 Hz. Mari kita anggap bahwa frekuensi adalah 1000 Hz. Jika kita sampel pada tingkat 2000 sampel per detik kita mungkin berakhir dengan setiap sampel sama dengan 0. Misalkan kita sampel pada tingkat tahun 2001 sampel per detik, yang secara teknis satsifies kriteria Nyquist. Jika sinyal cukup panjang, bahkan jika sampel pertama berada pada nol, beberapa sampel akan menjadi jarak yang signifikan dari nol dan akan ada informasi yang cukup untuk merekonstruksi sinyal. Tetapi jika sinyal cukup pendek, akan diambil sampel pada titik-titik dimana nilai yang begitu dekat dengan nol yang mungkin tidak dibedakan dari nol ketika terkuantisasi. Akibatnya, untuk sinyal pendek perlu menggunakan sampling rate secara signifikan lebih tinggi daripada frekuensi Nyquist.
Di sini kita menggambarkan jenis file audio yang paling umum. diskusi di sini juga akan memberikan pembaca gambaran umum baik dari organisasi file audio.
File suara yang terdiri dari hanya data audio PCM disebut file suara mentah. Beberapa i perangkat audio o /, perangkat lama terutama ditujukan untuk penelitian daripada pasar komersial, menghasilkan file-file tersebut. Mereka tidak lagi sering terlihat.
Sejak file suara baku tidak memiliki header di mana untuk menyimpan informasi, perlu untuk mengetahui tingkat sampling, resolusi, signedness, dan jumlah saluran. Beberapa parameter kadang-kadang dikodekan dalam nama file, tetapi tidak ada konvensi umum yang benar-benar. Sufiks Filename kadang-kadang digunakan untuk menyampaikan resolusi dan signedness. Sebagai contoh, akhiran. Sb ini mungkin mengindikasikan bahwa sampel yang terdiri dari satu byte, yaitu, memiliki resolusi 8 bit, dan ditandatangani. Akhiran sistem. Uw ini menunjukkan bahwa setiap sampel diwakili oleh kata-byte dua, yaitu, memiliki resolusi 16 bit, dan ditandatangani.
File AU adalah contoh yang baik dari tipe file sederhana yang terdiri dari sebuah header yang diikuti oleh data. Sebenarnya ada dua jenis file AU. akhiran ini. au awalnya digunakan oleh Sun untuk file audio headerless mengandung μ-hukum kompresi audio sampel di 8.000 sampel per detik. Selanjutnya, format yang ada diadopsi. Format SND pada komputer NeXT adalah sama sebagai format AU. File AU terdiri dari sebuah header dengan format berikut diikuti dengan sepotong data audio tunggal. Nilai numerik di header harus disimpan dalam-endian format besar.
AIFF format yang secara luas digunakan pada komputer Apple dan, sebagai hasilnya, dalam pengolahan software audio profesional. Seperti, RIFF / GELOMBANG, AIFF ("Audio Interchange File Format") merupakan turunan dari Interchange Format Files format yang dikembangkan oleh Electronic Arts. Ia lebih sederhana dari RIFF / format WAVE di tersebut memang ditujukan hanya untuk data audio dan mendukung berbagai format yang lebih kecil data audio.
Sebuah file AIFF suara minimal itu terdiri dari header dan sepotong suara. Selain suara potongan, berbagai potongan lain yang mungkin, termasuk penanda posisi dalam data gelombang, MIDI perintah synthesizer, dan komentar.
Data audio dalam file AIFF selalu terkompresi PCM. Header berisi informasi tentang jumlah saluran, sampling rate, dan resolusi. Data audio, seperti semua data integer dalam format ini, disimpan dalam-endian format besar.
File MP3 ditandai terutama oleh pemahaman mereka, seperti dijelaskan diatas . Namun, tidak seperti beberapa jenis lain data terkompresi, yang dapat dikemas dalam berbagai cara, data dikompresi MP3 biasanya dikemas dalam cara tertentu. Hal ini tentu saja mungkin untuk embed data dalam format MP3, yaitu, lengkap dengan header frame, dalam satu jenis paket. For example, a WAVE file may contain MP3 data. Sebagai contoh, sebuah file WAVE mungkin berisi data MP3. Dalam hal ini, chunk data terdiri dari suara MP3 terkompresi ditambah header frame. Kenyataan bahwa data terdiri dari data MPEG ditunjukkan oleh nilai 80 untuk kode format data.
Sebuah file MP3 terdiri dari satu set frame data. Header bisa diikuti oleh dua byte data Cyclic Redundancy Check (untuk mendeteksi kesalahan / koreksi), ditandai dengan penetapan 16 bit header. Sisa dari frame berisi data audio. Dalam sebuah file MP3 murni, tidak ada header file secara keseluruhan, meskipun mungkin ada satu jika data MP3 yang tertanam di dalam paket yang lain.
Ogg Vorbis adalah format audio baru dimaksudkan terutama untuk musik,. Hal ini kira-kira sebanding MP3 ke format tetapi non-proprietary dan open source. Ogg Vorbis terdiri dari algoritma kompresi dan format file. Algoritma kompresi adalah algoritma kompresi persepsi , seperti ATRACdan MP3 . It is reported to sound better than MP3 at lower bit rates. Hal ini dilaporkan suara yang lebih baik daripada MP3 pada tingkat bit yang lebih rendah.
The file format is a little different from the others we have discussed. An ogg file or bitstream must begin with three header packets: Format file adalah sedikit berbeda dari yang lain telah kita bahas paket. Ogg Sebuah file atau bitstream harus dimulai dengan header tiga:
- an identification header; header identifikasi;
- a comment header; header komentar;
- a setup header; header setup;
0 komentar:
Posting Komentar