लेमर प्रोजेक्ट

भाषा मॉडलिंग और सूचना पुनर्प्राप्ति आवेदन
अब डाउनलोड करो

लेमर प्रोजेक्ट रैंकिंग और सारांश

विज्ञापन

  • Rating:
  • लाइसेंस:
  • Freeware
  • कीमत:
  • FREE
  • प्रकाशक का नाम:
  • The Lemur Team
  • प्रकाशक वेब साइट:
  • http://www.lemurproject.org/
  • ऑपरेटिंग सिस्टम:
  • Mac OS X
  • फाइल का आकार:
  • 63.6 MB

लेमर प्रोजेक्ट टैग


लेमर प्रोजेक्ट विवरण

भाषा मॉडलिंग और सूचना पुनर्प्राप्ति आवेदन लेमर टूलकिट एक स्वतंत्र और खुला स्रोत भाषा मॉडलिंग और सूचना पुनर्प्राप्ति के क्षेत्र में अनुसंधान सुविधा के लिए बनाया अनुप्रयोग है। लेमर टूलकिट ऐसे तदर्थ और वितरित पुनर्प्राप्ति, पार भाषा आईआर, संक्षिप्तीकरण, फ़िल्टर करने और वर्गीकरण के रूप में प्रौद्योगिकियों भी शामिल है। यहाँ "लेमर परियोजना" के कुछ प्रमुख विशेषताएं हैं: · आधुनिकतम संरचित क्वेरी भाषा (inquery और इंद्री का प्रयोग करके) · एक्सएमएल के लिए समर्थन और संरचित दस्तावेज़ पुनर्प्राप्ति · अनुसंधान परीक्षण संग्रह की एक विस्तृत श्रृंखला के साथ आमतौर पर इस्तेमाल किया है (जैसे, TREC सीडी 1-5, wt10g, RCV1, gov, gov2) एक "आउट-ऑफ-द-बॉक्स" साइट खोज की क्षमता के साथ · सूचकांक अपने वेब पृष्ठों विंडोज, लिनक्स, और वेब के लिए · इंटरएक्टिव इंटरफेस · वितरित सूचना पुनर्प्राप्ति और दस्तावेज़ क्लस्टरिंग अनुप्रयोगों · क्रॉस-प्लेटफॉर्म, तेजी से और मॉड्यूलर कोड सी में लिखे ++ · सी ++, जावा और सी # एपीआई · नि: शुल्क और ओपन सोर्स सॉफ्टवेयर 6 साल के लिए · में उपयोग एक बड़ी और बढ़ती प्रयोक्ता समुदाय द्वारा अनुक्रमण: ·, छोटे मध्यम और बड़े पैमाने पर (टेराबाइट) संग्रह के लिए एकाधिक अनुक्रमण तरीकों · के लिए अंग्रेजी, चीनी और अरबी पाठ में निर्मित समर्थन · पोर्टर और Krovetz शब्द उत्पन्न · इंक्रीमेंटल अनुक्रमण · TREC पाठ के लिए बाहर का बॉक्स अनुक्रमण समर्थन, TREC वेब, सादा पाठ, HTML, XML, पीडीएफ, एम बॉक्स, माइक्रोसॉफ्ट वर्ड, और Microsoft PowerPoint · इनलाइन इंडेक्स और ऑफसेट पाठ एनोटेशन (जैसे, भाग-की-भाषण और नामित संस्थाओं) · इंडेक्स दस्तावेज़ गुण रिट्रीवल: · प्रमुख भाषा मॉडलिंग ऐसी इंद्री और KL-विचलन, साथ ही वेक्टर अंतरिक्ष, tf.idf, Okapi और inquery के रूप में दृष्टिकोण का समर्थन करता है · Relevance- और छद्म प्रासंगिकता प्रतिक्रिया · वाइल्डकार्ड अवधि विस्तार (इंद्री का प्रयोग करके) · पैसेज और XML तत्व पुनर्प्राप्ति · क्रॉस बहुभाषी पुनर्प्राप्ति · Dirichlet priors और मार्कोव चेन के माध्यम से कोमल करना · समर्थन मनमाना दस्तावेज़ महंतों (जैसे, पेज रैंक, यूआरएल गहराई) इस रिलीज में नया क्या है: · 2799440 TermInfo IndriTermInfoList द्वारा वापस नहीं पदों है · 2794361 harvestlinks फसल निर्देशिका बनाने के लिए विफल रहता है · 2788507 KrovetzStemmerTransformation एक बफर अतिप्रवाह कर सकते हैं · 2788504 AnchorTextAnnotator एक बफर अतिप्रवाह कर सकते हैं · 2787935 पृष्ठस्तर कोर उदासीनता अगर लिंक पथ बुरा है · 2784994 गलत लेख · 2783665 TextTokenizer समय से पहले ही उद्धृत टैग गुण समाप्त हो जाता है · 2782954 इन्द्री :: पार्स :: HTMLParser :: handleTag अतिप्रवाह कर सकते हैं एक बफर · 2772914 irevalGUI.jar पागल परिणाम देता है · 2772846 bin / ireval.jar गलत जार फ़ाइल (लेमर v48) है · एक से अधिक थ्रेड के साथ 2770916 documentLength बफर भ्रष्टाचार · 2747981 WARCDocumentIterator WARC फ़ाइल में दस्तावेजों याद करते हैं · 2747707 TextTokenizer कुछ उद्धृत टैग विशेषताओं को नहीं पहचानता है


लेमर प्रोजेक्ट संबंधित सॉफ्टवेयर

Qtada

QT C ++ पुस्तकालयों और संबंधित उपकरणों के लिए एक ADA2005 भाषा बाइंडिंग ...

239 2.5 MB

डाउनलोड

fast2armc

मुफ्त और ओपन सोर्स पायथन-आधारित एआरएमसी ट्रांसलेटर के लिए ...

175 80 KB

डाउनलोड

Divmod pyflakes

मुफ्त पायथन एप्लिकेशन जो आपको पाइथन कोड में त्रुटियों को खोजने में मदद करेगा ...

155 14 KB

डाउनलोड