Hermetic so’z chastotani hisoblagichi

Source: https://www.hermetic.ch/wfc/wfc.htm

Faylda turli xil so’zlarning tezligini hisoblash

Hermetic Word Frequency Counter bir MS Word skanerlash docx ANSI, yoki UTF-8 orqali kodlangan, shu jumladan, HTML va XML fayllarni – faylni yoki matn yoki matn-kabi fayl va turli so’zlar hodisalar (ixtiyoriy, masalan, umumiy so’zlarni e’tiborsizlik sonini biridir va bu). Bu, shuningdek, shunday bir so’z-qidiruv dastur. Bu (bilan yoki defis yoki raqamlari holda masalan, so’z) so’z, deb hisoblaydi aynan nima belgilash mumkin. Topilgan so’zlar har bir so’z uchun ko’rsatilgan qator va chastota soni bilan, Qiziqarlilari Alifbo tartibida yoki chastotasi berilgan bo’lishi mumkin.

Asosiy (WFC) va ilg’or (WFC brauzerlari ko’rish, shu jumladan, qilsa hamma narsani qiladi WFCA: ikki, bu so’z soni dasturiy ta’minot versiyalari bor docx fayllar). Asosiy farqlar WFCA bitta operatsiya (bir nechta papka ichida) bir necha fayllar so’zlarni hisobga olishni, shuningdek, iboralar hisoblaydi Holbuki WFC, faqat bitta docx, matn va matn kabi fayllar so’zlarni hisobga olishni, deb hisoblanadi. Bir vaqtning o’zida, faqat bitta fayl so’zlarni hisoblash kerak bo’lsa, keyin WFC nima kerak bo’lishi mumkin. Agar ko’p fayllar bor yoki qo’shimcha variant va katta vazifani kerak bo’lsa, keyin siz WFCA kerak. Uchun ushbu linkni bosing WFCA sahifada.


Faylni ochish uchun, tugmasini bosing Kirish fayl tugmasi va istalgan papkaga va faylga o’ting. O’rnatganingizdan so’ng operatsiya parametrlarini, ustiga bosing soni so’zlar tugmasini bosing. Bu erda, odatda, bir screenshot umumiy so’zlar e’tiborsiz bilan, yuqori/pastki ishi ajralib, va so’zlar ko’ra tartibida, bir 540,80 Kb matn fayli uchun so’z hisoblash ko’rsatib, deb:

Bu erda, odatda, bir ekran tasvirini:

Hermetic Word Frequency Counter screenshot #2

Bu erda yana bir screenshot bir 187,62 Kb MS Word uchun so’z hisoblash ko’rsatib, deb docx umumiy so’zlar yuqori/pastki ishi mashhur emas, e’tiborsiz va so’zlar yana chastotasi tomonidan tartiblashtiriladi bilan fayl (çözdükten matn o’zi, 340,88 Kb hisoblanadi):

Hermetic Word Frequency Counter screenshot #3

Har ikki holatda ham jarayon kam 20 soniya davom etdi. Bilan o’sha topildi so’zlarni namoyon qilmang checkbox tekshiriladi. Bu so’ngra qayta ishlash tekshirilmagan bo’lsa TextBox yangi so’z topilgan qachon orom kerak, chunki juda ham sekin bo’ladi.


Nazariy bir Kirish fayl yoki unda so’z soni hajmiga chegarasi yo’q, lekin amalda (tufayli zarur ishlashCompatible with Windows 10 vaqti) haqida 10 matn fayllari ustida Mb (va XML kabi matn kabi fayllarni bir chegarasi bor va HTML fayllari). MS Word matn miqdori taxminan 10 Mb bir chegarasi ham bor docx (a da fayl docx u ko’p tasvirlar bo’lsa fayl, bu ham katta bo’lishi mumkin). A uchun docx fayl, hujjat organizmda faqat so’zlar emas, balki so’z izohlar yoki oxirgi eslatma yilda hisoblanadi.

Matn va (HTML va XML fayl, shu jumladan) matn-kabi fayllar uchun matn Ansi, yoki UTF-8 orqali

ANSI – kompyuteringizda standart kodlash bo’lgan yagona baytli matnli kodlashdir. UTF-8 – HTML va XML fayllarida tez-tez ishlatiladigan Unicode belgilarining o’zgaruvchan bayt uzunligi kodlash.

kodlangan mumkin. Bu kabi ikkilik fayllar to’g’ridan-to’g’ri harakat emas pdf va MS-Word doc (dan sifatida alohida fayllar docx fayllar); “matn” fayllari (qarang sifatida saqlanadi, agar bunday fayllar izlanadi mumkin  skaner fayllar).

Dastur fayli (yoki oddiy qilib aytganda, boshqa sababga ko’ra, barcha so’z) barcha so’zlar chastotalar biridir. Agar faqat bitta so’z uchragan hisoblash bo’lsangiz (yoki so’zlar majmui har bir so’zning, yoki har qanday so’zning berilgan naqsh taalukli) keyin bu, albatta, mumkin Advanced Version Ushbu dastur.

 

“Mansabdor shaxslar” va “chastota” qiymatlari har bir kiritilgan yoki ko’rsatilgan natijalar, chiqarib tashlandi mumkin.

Chiqish fayl faqat so’z iborat bo’lsa, hech qanday mansab yoki chastota soni qadriyatlar bilan, keyin siz ham bir ro’yxat (har bir liniyada bir so’z) deb yoki vergul bilan ajratilgan bo’lib, bu olishingiz mumkin. Bu tegishli tanlash orqali amalga oshiriladi ko'rsatish format tomchi-pastga menyusida.

Kirish fayl “<table>” shunchaki tabiiy til matn iborat shart emas, lekin bir HTML, XML, PHP yoki C/C++ fayl bo’lishi mumkin, yoki kabi teglar bilan tabiiy til aralashtirib mumkin.

Bunday “<center>” sifatida HTML fayllari, HTML teglar qayta ishlash paytida atlanır. XML qayta ishlash ichidagi barcha matn fayllar qachon “<” and “>” atlanır. PHP fayllar C uslubidagi izoh mumkin bo’lgan HTML fayllari sifatida qayta ishlanadi. Ichidagi PHP fayllarni, matnni qayta ishlash qachon “<?php” and “?>” Bo’ladi emas atlandı.


Sinov versiyasi: nusxasi Hermetic Word Frequency Counter o’rnatish dasturi erkin baholash maqsadida, bu veb-saytidan yuklab olish mumkin. Qo’shimcha ma’lumot uchun quyidagi linkni bosing:

Yuklab oling Hermetic Word Frequency Counter

Narx va buyurtma: to’liq funktsiyali dasturiy uchun bitta-foydalanuvchi litsenziya 3 oy, 1 yil muddatga yoki hech vaqt limiti (a ‘abadiy’ litsenziya) bilan foydalanish mumkin. Litsenziya har bir turi uchun narxlar da berilgan Xarid foydalanuvchi litsenziyasi. Faollashtirish kaliti sinov versiyasi doimiy to’liq funktsional qilish uchun zarur bo’lgan, va siz sotib darhol olingan (yoki yaqinda keyin) mumkin.

Orqaga to’lov: dasturiy qoniqarli amalga bo’lmasa, A qayta sotib so’ng 30 kun qadar zudlik bilan taqdim etiladi.

Yangilanishlar: bu dasturiy ta’minot uchun bir foydalanuvchi litsenziya sotib hech qanday qo’shimcha xarajatlar har qanday versiyasiga bir yangilash huquqiga ega.

Upgrading to the Advanced Version:

Agar sotib doimiy Hermetic Word Frequency Counter uchun foydalanuvchi litsenziya olish uchun bir abadiy foydalanuvchi litsenziya yangilashingiz mumkin Murakkab versiya $ 34.95 (taxminan € 27,95 yoki £ 24.45) to’lab. Quyida tugmalar birida rivojlanish bosing sotib olish uchun. Ahamiyat bering, bu uchun abadiy bir foydalanuvchi litsenziya faqat mavjud Hermetic Word Frequency Counter hisoblagich qildi allaqachon sotib olingan.