jAudio 2

Source: http://jmir.sourceforge.net/index_jAudio.html

Versiya yangilandi

JAudio yangilangan versiyasi tomonidan chop etilgan Daniel McEnnis tomonidan https://github.com/dmcennis/jaudioGIT. SourceForge-da jMIR-da paketlangan ushbu avvalgi versiyadan alohida ishlab chiqilgan va bir qator foydali yaxshilanishlarni.

Umumiy nuqtai

jAudio – audio fayllardan xususiyatlarni chiqarish, shuningdek, yangi xususiyatlarni ishlab chiqish va almashish uchun mo’ljallangan dasturiy ta’minot to’plami. Ushbu ishlab chiqarilgan xususiyatlar, ko’pincha, musiqa ma’lumotlarini qidirish (MIR) bo’yicha ko’plab sohalarda, masalan, kompyuterni o’rganish doirasi ACE.

Barcha jMIR tarkibiy qismlarini ishlab chiqishda ta’kidlangan xususiyatni takomillashtirishga qaratilgan ushbu yondashuv, xususan, yuqori darajali va musiqiy jihatdan mazmunli xususiyatlarni yaratish uchun past darajadagi xususiyatlarni birlashtirishi mumkin bo’lgan ovozli xususiyatlarni ajratish uchun juda muhimdir. JAudio ning bu kabi xususiyatni rivojlanishiga yordam beradigan bir qancha jihatlari mavjud. Masalan, jAudio yangi funktsiyalar qo’shilsa yadro kodini o’zgartirishi yoki qayta tiklanishiga yo’l qo’yadigan modulli plagin interfeysidan foydalanadi. Bir plagin papkasida yangi kompilyatsiya qilingan xususiyatni joylashtirish kerak va u XML konfiguratsiya faylida unga masofaviy URL manzillari bilan bir qatorda mahalliy fayl yo’llariga murojaat qilish uchun havola qo’shing.

Barcha jMIR xususiyati extractors bilan bo’lganidek, jAudio shuningdek, barcha xususiyatlarni boshqa barcha ajratilgan xususiyatlarning qiymatlari bilan dinamik ravishda ta’minlaydi va barcha xususiyat bog’liqliklarini dinamik ravishda avtomatik ravishda hisoblab chiqadi, shuning uchun xususiyatni ajratib olish muvofiq ravishda rejalashtirilishi mumkin. jAudio-da, funksiyalarga sodda massivlar sifatida audio-misollarni taqdim etadi, shuning uchun tadqiqotchilar Java-ning biroz chuqur audio interfeysi bilan yoki buferlash yoki ovoz formati konvertatsiyasi kabi past darajadagi muammolar bilan to’g’ridan-to’g’ri ishlashga hojat yo’q.

Avtomatik “metafiziya” chiqarish – jAudio ning yana bir afzalligi. Metafrlar – bir yoki bir nechta xususiyatlardan olinadigan shablondan olingan xususiyatlar. JAudio-da amalga oshirilgan metafratlarning namunalari quyidagicha: Running Mean, Running Standard Deviation va Trigoney. Metafretsiyalarning qanday ishlashini ko’rsatish uchun, “tonal energiya” deb nomlangan xususiyatni tadbiq etgan va uni jAudio uchun plagin sifatida qo’shgan tadqiqotchi deb hisoblang. Foydalanuvchilar avtomatik ravishda ushbu yangi xususiyat uchun har bir metafizikani chiqarib tashlash yoki yo’q qilmaslik vaqtida avtomatik ravishda tanlovga ega bo’lishadi, masalan, xususiyatni oynadan deraza (derivativga) qanday o’zgarganligi kabi miqdorlarni hisoblash uchun biron bir kodni amalga oshirishga ehtiyoj sezadigan tonal energiyani ishlab chiquvchi bo’lmasdan. Bundan tashqari, metafiziyalarni bir-biriga zanjirband qilish mumkin (masalan, ishlaydigan vositachili lotin) va ishlab chiquvchilar qo’shimcha metafiziyalarni amalga oshirishga erkin bo’lib, keyin ularni o’zgartirmasdan mavjud xususiyatlarga avtomatik ravishda qo’llashlari mumkin.

“Aggregatorlar” jAudio tomonidan taqdim etilgan qo’shimcha funktsiyalardir. Aggregatorlar – alohida vektorlar ketma-ketligini bitta vektor yoki kichikroq bir qator vektorga aylantirish vazifasi. jAudio ikkita asosiy agregator turini ko’rib chiqadi. Birinchi, sodda turdagi har qanday xususiyatlarning deraza qadriyatlariga tatbiq etiladigan funktsiyalardan iborat. Masalan, barcha oynalar ustidagi har qanday xususiyatning barcha qiymatlarini bitta o’rtacha qiymatga va bitta standart og’ish qiymatiga loyihalashi mumkin bo’lgan Standart shovqin yoki O’rtacha agregatorlar kiradi. Bunday aggregatorlar juda katta hajmdagi xususiyatlar bilan ishlashda va “o’lchovli lanatasi” bilan kelishishga urinishda juda foydali bo’lishi mumkin.

Aggregatorning ikkinchi turi turli xil xususiyatlarga qo’llanilishi mumkin. Misol uchun, Moments Aggregator maydoni turli xil kirish xususiyatlarining bir qatorini oladi, ularning ikki o’lchovli tasvir matrisi sifatida vektorlarning birlashgan ketma-ketligini ko’rib chiqadi va bu matris uchun ikki o’lchovli momentni hisoblab chiqadi. Bunday agregatorlar, turli funktsiyalarni bir-biridan farq qiladigan darajada past o’lchamli tarzda namoyon etish uchun foydalidir, chunki bular juda musiqiy ahamiyatga ega bo’lishi mumkin, lekin ko’pincha MIR tizimlarida e’tiborga olinmaydi. jAudio shuningdek, Multiple Feature Histogram nomli ushbu turdagi boshqa agregatni ham ijro etadi. JAudio foydalanuvchilari o’zlarining maxsus aggregatorlarini qo’llashlari va mavjud aggregatorlar uchun xohlagancha maqsadga etishlari mumkin.

jAudio-ning joriy taqsimoti 28 ta amalga oshirilgan asosiy xususiyatlardan iborat bo’lib, metafiziklar va agregatorlar, albatta, bu raqamni kengaytirish uchun ishlatilishi mumkin. Ushbu funktsiyalarning ba’zilari isbotlangan samaradorlikning standart funktsiyalari bo’lib, boshqalari esa innovatsiondir va tajriba uchun tadqiqot jamoasiga taqdim etiladi.

jAudio umumiy maqsadlarda foydalanish uchun GUI, jAudio dasturini o’z ilovalarida joylashtirishga qiziqadiganlar uchun va buyruq chizig’i interfeysi bilan kodlashni osonlashtirish uchun mo’ljallangan. Foydalanuvchilar qaysi xususiyatlarni, metafiziklarni va yig’uvchilarni disk raskadrovka uchun tanlashi mumkin va shuningdek, oyna o’lchami, oyna örtüşmesi, pastga taqlid va amplituda normalizatsiya kabi umumiy parametrlarni o’rnatishi mumkin. Ayrim xususiyatlar, shuningdek, muayyan qo’shimcha parametrlarni o’rnatishga ham imkon beradi. Sozlamalar qayta ishlatilishi uchun konfiguratsiya fayllari saqlanishi mumkin.

jAudio audio sintez, rekord audio bir necha turdagi bajarish va yangi xususiyatlar sinovlaridan engillashtirish uchun audio uchun MIDI fayllarni o’tkazishingiz mumkin. Shunga o’xshash sabablarga ko’ra, dasturiy ta’minot, shuningdek, har ikki chastota va vaqt domenlar audio signallari ko’rsatishi mumkin. jAudio MP3, WAV, AIFF, aifc, radiusi va SND fayllar ajralish mumkin. Xususiyati qiymatlari ham saqlanishi mumkin ACE XML yoki WEKA ARFF fayllar va foydalanuvchilar Barcha oynalarni ustidan birlashtiriladi qadriyatlar, faqat har bir oyna uchun qazib yoki xususiyatlarni saqlash variant bor.

Ekran tasvirini (bir vaqtning o’zida ikkita menyuni ko’rsatish uchun sun’iy ravishda o’zgartirilgan)

Tegishli nashrlar

McKay, C. 2010. Automatic music classification with jMIRPh.D. Thesis. McGill University, Canada.

McKay, C., J. A. Burgoyne, J. Hockman, J. B. L. Smith, G. Vigliensoni, and I. Fujinaga. 2010. Evaluating the genre classification performance of lyrical features relative to audio, symbolic and cultural featuresProceedings of the International Society for Music Information Retrieval Conference. 213–8.

McKay, C., and I. Fujinaga. 2010. Improving automatic music classification performance by extracting features from different types of dataProceedings of the ACM SIGMM International Conference on Multimedia Information Retrieval. 257–66.

McKay, C., and I. Fujinaga. 2008. Combining features extracted from audio, symbolic and cultural sourcesProceedings of the International Conference on Music Information Retrieval. 597–602.

McEnnis, D., C. McKay, and I. Fujinaga. 2006. jAudio: Additions and improvementsProceedings of the International Conference on Music Information Retrieval. 385–6.

McEnnis, D., C. McKay, and I. Fujinaga. 2006. Overview of OMENProceedings of the International Conference on Music Information Retrieval. 7–12.

McEnnis, D., C. McKay, I. Fujinaga, and P. Depalle. 2005. jAudio: A feature extraction libraryProceedings of the International Conference on Music Information Retrieval. 600–3.

Savollar va izohlar

Daniel McEnnis: [email protected]
Cory McKay: [email protected]


SOURCEFORGE DAN KO’CHIRIB

ESLATMA: jAudio ham o’z o’zidir alohida SourceForge loyiha sayti CVS bo’limida manba kodini o’z ichiga oladi.