تقنيات أدوات تحليل النص من شركة صخر مبنية على نتاج البحث والتطوير في مجالي المعالجة الطبيعية للغة العربية واللغويات. وقد تم تصميم النظام الأساسي لأدوات تحليل النص للعمل على محركات تستند إلى خوادم مع حزمة مطوري البرامج SDK. تعمل أدوات تحليل النص التالية على قواعد بيانات النص العربي المهيأة وغير المهيأة:
مستخلص الكلمات المفتاحية
يقوم باستخلاص الكلمات والتراكيب المفتاحية ذات الدلالات الخاصة المرتبطة بموضوع النص. بالإضافة إلى استخلاصه للأعلام الموجودة بالنص سواء كانت لأشخاص أو أماكن أو مؤسسات أو عبارات شائعة... إلخ. يوفر مستخلص الكلمات الأساسية الوقت عن طريق استخلاص أهم المعلومات الموجودة في البيانات الضخمة.
المصنف
محرك يقوم بتنظيم المعلومات القيمة بدقة وكفاءة على شكل شجرة موضوعات منطقية. وتتكون هذه الشجرة من أكثر من عشرة تصنيفات رئيسية تغطي أعم وأشمل المجالات مثل السياسة والاقتصاد والدين والرياضة.
الملخص
تتعرف هذه الأداة الهامة على أكثر الجمل ذات الصلة داخل النص وتعرضها على شكل ملخص للنص. مما يقلل بشكل كبير الوقت الذي نستغرقه في القراءة ومعالجة النصوص. يستخرج الملخص الجمل الأساسية من النص المدخل على أساس بعض القواعد الإحصائية واللغوية (مثال: أسلوب الكتابة، ووضع الجملة في النص، الكلمات الأساسية المتضمنة وأنواعها). البرنامج يتيح للمستخدم أيضا التحكم في النص الملخص مثل تحديد نسبة التلخيص أو عدد الجمل المخرجة .