WEBVIEW: TAIGA-dan foydalangan holda Internet miqyosida dastur

Source: http://cs.brown.edu/~spr/research/webview.html

Umumiy nuqtai

WebView – bu Internet qanday foydalanilayotganligini ingl. U hozirda ko’rib chiqilayotgan veb-saytlarni kuzatish va ushbu ma’lumotni toifalarga qarab mazmunli (va qiziqarli) displeyga to’plash uchun mo’ljallangan. Shu bilan birga, bu TAIGA dasturiy tizimining imkoniyatlarini namoyish etadi.

Ushbu vizualizatsiyani qiziqarli va samarali qilish uchun biz undan foydalanadigan odamlarga ega bo’lishimiz kerak. Shunday qilib, dasturiy ta’minotni yuklab olish, o’rnatish va ishga tushirishni maslahat beramiz.

Displey

Foydalanuvchilarning nuqtai nazari bo’yicha, veb-ko’rish oddiy odamlar tomonidan ko’rib chiqilayotgan narsalarni namoyish etadigan oddiy skriptdir. Namuna displeyi quyida ko’rsatilgan:

Displey konsentrik halqalardan iborat bo’lib, ularning har biri bir daqiqadan bir necha kungacha bo’lgan vaqt oralig’ini anglatadi. Har bir uzuk veb-sahifalarning bitta toifasini aks ettiruvchi mintaqalarga bo’lingan. (Hozirda biz OpenDirectory tasnifidan foydalanmoqdamiz, ammo har qanday tasniflash ishlaydi). Kategoriyalar alifbo tartibida joylashtirilgan, soat millari soat yo’nalishi bo’yicha soat 3ga teskari yo’nalishda joylashtirilgan (bu kamida matematiklar uchun ma’qul). Ranglar o’zboshimchalik bilan, lekin qo’shni toifalar orasidagi farqni maksimal darajada oshirish uchun tanlanadi. Har bir kategoriya zonasida ushbu toifada ko’rilayotgan sahifalar to’g’risidagi ma’lumotlarni kodlaydigan to’lqinli chiziq mavjud. Displey har daqiqada yoki shunga o’xshash tarzda yangilanadi.

Displey foydalanuvchiga bir nechta ma’lumot turlarini taqdim etadi. Har bir kategoriya uchun yoy oralig’i vaqt oralig’ida ushbu toifadagi sahifalar soni (brauzer tomonidan so’ralgan sahifalar) soniga mutanosibdir. Mintaqaning rangi kategoriyani anglatadi; ranglarning to’yinganligi qarashlarning nisbiy sonini aks ettiradi. Shunday qilib, agar oraliq nisbatan kam ko’rinishga ega bo’lsa (bu erda qarindoshlik umumiy tarixga nisbatan vaqt qamrab olingan vaqtga bog’liq), unda mintaqa engilroq bo’ladi; agar oraliq juda ko’p bo’lsa, u qorong’i bo’ladi. To’lqinli chiziqning o’zi chiziqning chastotasidagi vaqt oralig’ida aniq URL-larning nisbiy sonini kodlashi mumkin. Shunday qilib, agar bitta toifadagi barcha sahifalar bitta urldan bo’lsa, chiziq tekis bo’lar edi; Agar ularning har biri aniq bo’lganida, chiziq to’lqinli bo’lar edi. Qator qalinligi ushbu toifadagi sahifalarni ko’rayotgan foydalanuvchilarning nisbiy sonini aks ettirish uchun ishlatiladi. Agar barcha ko’rib chiqish bitta foydalanuvchi tomonidan amalga oshirilgan bo’lsa, chiziq juda nozik bo’lar edi; agar u ko’plab foydalanuvchilarga to’g’ri kelsa, chiziq qalin bo’ladi.

Displey, shuningdek, bo’shliqlarning yorqinligi (xira ranggacha) va chiziqlar amplitudasida ma’lumotlarni kodlashi mumkin. Foydalanuvchi tegishli displey oynalari orqali turli xil displey xususiyatlarini o’zgartirish imkoniyatiga ega. Bunga har bir grafik xususiyat bilan bog’liq statistikani o’zgartirish, turli toifalar bilan bog’liq ranglarni o’zgartirish, toifalarni xaritalash va turli xil oraliqlarni o’zgartirish kiradi.

Axborot yig’ish

Internetda nima sodir bo’layotganligi to’g’risida ma’lumotni namoyish qilish uchun biz ma’lumotlarni to’plashimiz kerak. Shunday qilib, ushbu dastur josuslarga qarshi dastur. U sizning ko’rib chiqish tarixingizni kuzatib boradi va siz ko’rib chiqayotgan sahifalar haqida markaziy serverga xabar beradi, u erda toifalarga ajratilgan va kategoriyalar yozilgan. Biroq, dasturda hech qanday identifikatsiya qilinadigan yoki shaxsiy ma’lumot yo’q. “Foydalanuvchilar” noyob tasodifiy identifikator bilan namoyish etiladi, bu faqat foydalanuvchi hisoblarini olish uchun ishlatiladi. ID-lar o’zboshimchalik bilan berilgan va ularni manbaga qaytarib bo’lmaydi (men bilaman). Shpion dasturi faqat siz tomoshabinni ishlaganda va faqat ishlayotgan foydalanuvchi uchun ishlaydi. Agar nima bo’layotganiga ishonmasangiz, to’liq manba taqdim etiladi.

E’tibor bering, bizning vositamiz Windows, Linux va Mac OS/X-larda turli xil kombinatsiyalarda safari, mozilla, IE va Opera bilan ishlaydi. Agar siz loyiha ma’lumotlariga hissa qo’shmoqchi bo’lsangiz, lekin visualizer-ni ishga tushirishni xohlamasangiz, biz faqat tarix monitorini ishlatadigan skriptni taqdim etamiz.

Tasniflash

Tizim hech qachon URL manzillari yoki foydalanuvchi identifikatorlarini saqlamaydi. Buning o’rniga, u sahifa haqida bilib olganda, u tegishli toifani topadi va vaqti-vaqti bilan har bir bo’lim uchun sahifalar, foydalanuvchilar va URL-manzillar haqidagi ma’lumotlarni saqlaydi. Tizim o’z toifasini topish uchun sahifani yuklamaydi yoki unga kirmaydi. Buning o’rniga u faqatgina URL-dan foydalanib toifani topishga harakat qiladi.

Taiga asoslarini foydalanib, biz tasniflagichlar bir necha dasturlar beradi. Biz bugungi kunda uch turli kishilar bilan ta’minlash. Bizning birinchi Kategoriyalarga alohida sahifada qidirish uchun Google so’rab va Google natijasida bir qismi sifatida qaytaradi Open Directory tasniflash qarab, Google veb-xizmati ishlatiladi. Bu cheklangan ikkala Google istamaydi, chunki ular har doim nisbatan umumiy sahifalar uchun ham tasnif hisobot yo’q, chunki bizga bir kun Veb-xizmat 1000 dan ortiq marta qo’ng’iroq va. Muqobil MeURLin loyiha. Biz (ular veb-xizmati hali tashkil yo’q), ularning namoyish veb sahifaga muzokaralar sınıflandırıcıyı bor, va natija qazib olinadi. Bu (aniqlik o’zgaruvchan darajalilardan bilan) juda samarali hisoblanadi, lekin hali ham bizning maqsadlar uchun bir oz juda sekin. Bizning uchinchi klassifikatori tashkil boshida ochiq katalog bazasini o’qiydi va bir URL uchun tasnifi daraxti hosil qiladi. daraxt (15 daqiqa va xotira 2G oladi) qurilgan so’ng, qidirish juda tez. Barcha uch tasniflagichlar mavjud, va Taiga bir vaqtning o’zida eng yaxshi qaysi biri tanlash bepul bo’lsa-da, eng ehtimol bir hozir ikkinchisi hisoblanadi ishlatiladi.

Agar biron bir yaxshiroq klassifikator yoki ular sinab ko’rmoqchi bo’lsa, uni tezda tizimga qo’shib qo’yganimdan xursand bo’lardim. Taiga amalga oshirishga kutubxona, mijoz-server turi xizmati yoki veb-xizmat sifatida kirishga imkon beradi.

Ma’lumotni saqlash

Biz dastlabki ma’lumotlar omborini taqdim etish uchun TAIGA global fayl tizimi xususiyatlaridan foydalanmoqdamiz. Ma’lumot to’plash natijasida to’plangan natijalar vaqti-vaqti bilan joriy ma’lumotlar fayliga qo’shib boriladi. Ushbu fayl juda katta hajmga ega bo’lishi mumkinligi sababli, biz aslida fayllar bir-biridan ikkinchisiga bog’langan ma’lumotlar fayllari to’plamini saqlab turamiz. Berilgan boshlang’ich vaqti uchun joriy faylni aniqlash, ma’lumotlar fayllari haddan tashqari ko’payganligi sababli yangi fayllarni yaratish va fayllarni bir-biriga ulash uchun alohida server taqdim etiladi. Ushbu xizmat avtomatik ravishda Brown-da ishlaydigan kompyuterda ishga tushadi (agar u ishlamagan bo’lsa).

Tarmoq

Ushbu loyiha yuragi Taiga tizimi. Agar görselleştiriciyi paytida, siz ham mashinangizda Taiga yadrosi ishlayotgan bo’ladi. Taiga foydalanadi JXTA turli mag’zidan va xizmatlar o’rtasida axborot vositalari bilan ta’minlash uchun peer-to-peer paketini. Boshlang’ich ishga tushirish siz ehtimol bir JXTA konfiguratsiya muloqot oynasida (kamida hozir uchun) ko’rasiz. Narsalar ishlayotgan bo’lsa, faqat okay bosgan etarli bo’lishi kerak. Agar jxta bilan tanish bo’lsangiz, turli parametrlarini o’zgartirish uchun bepul his. JXTA foydalanib, WebView xavfsizlik devorlari ichida va arbitray mashinalari haqida ishlatish uchun ega bo’lishi kerak. Agar Taiga yadro bir jurnalini olish bo’lsangiz bu sizning mashina ustida ishlaydi, deb ham (Derazalardagi) atrof-muhit o’zgaruvchilar TAIGASHOW belgilash yoki tegishli log fayl to’liq nomi olib, atrof-muhit o’zgaruvchi TAIGALOG belgilangan.

Qog’ozlar

Ushbu loyiha haqida hali hech narsa yozilmagan. Biz siz bilan boshdan kechirgan har qanday tajribangizni qadrlaymiz va qachon va qachon (agar bo’lsa) hisobot yozish haqida barcha mulohazalarni olqishlaymiz.

Fikr-mulohaza

Ushbu dastur (juda) eksperimental hisoblanadi. Biz turli xil o’rnatishlarni amalga oshirishga harakat qildik, ammo tizimlarning cheklangan doirasi mavjud. Ham yadroda, ham dasturda va hammasini bir-biriga yopishtiradigan tarmoqlarda xatolarga yo’l qo’yadigan juda ko’p narsa bor. Biz narsalarni tuzatishni xohlaymiz, lekin buni amalga oshirish uchun nima ishlamasligini bilishimiz kerak (va nima qilish kerakligini). Biz barcha fikr-mulohazalar, xato hisobotlari, takliflar, sharhlar, so’rovlar va boshqalarni qabul qilamiz [email protected].

Dasturiy ta’minot

Agar siz Braun kompyuter faniga murojaat qilsangiz, dasturiy ta’minotning so’nggi versiyasini quyidagi manzildan olishingiz mumkin /home/spr/tryview (Y:\home\spr\tryview yoqilgan windows).

Agar siz Brown CS tarmog’idan tashqarida bo’lsangiz, dasturiy ta’minotni bizning ftp serverimizdan ikkalasidan ham olish mumkin (tar.gz) yoki (zip) format.

O’rnatish juda oson: dasturni yuklab oling va kengaytiring. Uni ishlatish ham oddiy: vizualizatorni olish uchun oddiygina ishga tushirish skriptini (yoki windows-dagi runview.bat) bajaring. (Faqat monitoring dasturini ishga tushirish uchun runspy skriptlaridan foydalaning).

Yana. Dasturni yuklab olish uchun:

YUKLASH webview.distrib.tar.gz

YUKLASH webview.distrib.zip