पाठ :: ब्लूम

टेक्स्ट :: ब्लूम शब्दों के एक सेट के ब्लूम हस्ताक्षर का मूल्यांकन कर सकते हैं।
अब डाउनलोड करो

पाठ :: ब्लूम रैंकिंग और सारांश

विज्ञापन

  • Rating:
  • लाइसेंस:
  • Perl Artistic License
  • कीमत:
  • FREE
  • प्रकाशक का नाम:
  • Andrea Spinelli and Walter Vannini
  • प्रकाशक वेब साइट:
  • http://search.cpan.org/~aspinelli/Text-Document-1.07/Bloom.pod

पाठ :: ब्लूम टैग


पाठ :: ब्लूम विवरण

पाठ :: ब्लूम शब्दों के एक सेट के ब्लूम हस्ताक्षर का मूल्यांकन कर सकते हैं। पाठ :: ब्लूम शब्दों के एक सेट के ब्लूम हस्ताक्षर का मूल्यांकन कर सकता है। Synopsis मेरा $ b = text :: ब्लूम-> नया (); $ बी-> गणना (क्यूडब्ल्यू (फू बार बाज)); मेरे $ sig = $ b-> writetostring (); $ B-> Writetofile ('Afile.Sig'); मेरा $ b2 = पाठ :: ब्लूम :: NewFromFile ('Afile.Sig'); मेरा $ B3 = टेक्स्ट :: ब्लूम-> नया (); $ बी 3-> गणना (क्यूडब्ल्यू (फू बार बार बारबाज़)); मेरा $ सिम = $ बी-> समानता ($ बी 2); मेरा $ b4 = पाठ :: ब्लूम :: NewFromString ($ SIG); पाठ :: ब्लूम ब्लूम फ़िल्टरिंग तकनीक को दस्तावेजों के सांख्यिकीय विश्लेषण के लिए लागू करता है। दस्तावेज़ में शर्तें बेस -36 रेडिक्स प्रतिनिधित्व का उपयोग करके मात्राबद्ध हैं; प्रत्येक शब्द इस प्रकार 0..p-1 की सीमा में एक पूर्णांक से मेल खाता है, जहां पी एक प्रमुख है, वर्तमान में 2 ^ 32 से कम सबसे बड़े प्राइम पर सेट होता है -1, जहां आकार पी से कम एक पूर्णांक है, वर्तमान में 2 ^ 17, हैश फ़ंक्शन के परिवार का उपयोग करके, एचएएसएचवी फ़ंक्शन द्वारा गणना की गई है। प्रत्येक हैशेड वैल्यू का उपयोग एक बड़े सा वेक्टर में इंडेक्स के रूप में किया जाता है। दस्तावेज़ में मौजूद शर्तों के अनुरूप बिट्स 1 पर सेट हैं; अन्य सभी बिट्स 0. निश्चित रूप से सेट हैं, टकराव अलग-अलग शर्तों से दो बार सेट होने का कारण बन सकता है। यह इस प्रकार है कि, यदि दस्तावेज़ में एन अलग-अलग शर्तें हैं, परिणामी बिट वेक्टर में अधिकांश एन * डी बिट्स पर सेट होते हैं। परिणामी बिट स्ट्रिंग दस्तावेज़ में शर्तों की उपस्थिति / अनुपस्थिति का एक बहुत ही कॉम्पैक्ट प्रतिनिधित्व है, और है इसलिए एक हस्ताक्षर के रूप में विशेषता है। इसके अलावा, यह शर्तों के पूर्व-सेट शब्दकोश पर निर्भर नहीं है। हस्ताक्षर का उपयोग किया जा सकता है: परीक्षण का उपयोग किया जा सकता है कि दस्तावेज़ में दिए गए नियमों का एक सेट क्या है, कंप्यूटिंग जो शर्तों का अंश दो दस्तावेजों के लिए सामान्य है। बिट प्रतिनिधित्व हो सकता है एक फ़ाइल से लिखा और पढ़ा। पाठ :: ब्लूम बिट स्ट्रीम के लिए एक शीर्षलेख को उचित बनाता है; इसके अलावा, जब भी पैकेज संपीड़ित होता है :: zlib उपलब्ध है, बिट वेक्टर संपीड़ित होता है, ताकि डिस्क स्थान की आवश्यकताओं को काफी हद तक कम किया जा सके, खासकर छोटे दस्तावेजों के लिए। हैश फ़ंक्शन स्पष्ट रूप से फ़िल्टर का एक महत्वपूर्ण घटक है; संदर्भ कार्यान्वयन तारों के एक रेडिक्स प्रतिनिधित्व का उपयोग करता है। इसलिए प्रत्येक शब्द को नियमित अभिव्यक्ति /+ / से मेल खाना चाहिए · पर्ल


पाठ :: ब्लूम संबंधित सॉफ्टवेयर

सॉर्टडिर

सॉर्टडीर एक ld_preload लाइब्रेरी है जो आपके अनुप्रयोगों को आपूर्ति करने से पहले निर्देशिका प्रविष्टियों को टाइप करता है। ...

126

डाउनलोड