Fetch Logo with Motif 1في كل دقيقة من كل يوم في حياتنا يتم نشر عدة ألاف خبر أو مقالة أو مداخلة سواء في بوابات الجرائد والأخبار أو المدونات أو مواقع التواصل الاجتماعي، ومما لا شك فيه أن هناك العديد من هذه الأخبار والمداخلات التي تمس اهتماماتك وتؤثر عليها، وأصبحت عملية متابعة هذا الحجم المتناهي في الضخامة تتطلب مساعدة برامج البحث حيث أن الطاقة الإنسانية مهما عظمت لا تستطيع أن تتابعها وحدها.

Relevant and irrelevant areasوتلجأ جميع المحركات البحثية إلى أسلوب لجمع البيانات يطلق عليه Crawling، وفيه يتم جمع ما في صفحات الإنترنت وفهرسته وإتاحته لمن يرغب في البحث، ويلجأ الأسلوب التقليدي لجمع البيانات إلى حصر جميع ما في الصفحة من نصوص لا يفرق فيها ما بين المقال نفسه وما يحيط به من إعلانات أو روابط Links لصفحات أخرى، ويوضح الشكل المرفق مثال لصفحة تقليدية على بوابة موقع التواصل الاجتماعي فيس بوك، ويظهر فيها أن المداخلات التي في هذه الصفحة لا تمثل إلا نسبة قليلة من مساحتها، أما الباقي وهو الغالبية العظمى من مساحة الصفحة فهو روابط لصفحات أو وظائف أخرى بالإضافة إلى إعلانات متنوعة.

لذلك فإن حصر جميع النصوص الموجودة في الصفحة دون تمييز بين الغث والسمين يؤدي إلى عدة مشاكل أهمها أن نتائج البحث سوف تكون مضللة إلى حد كبير وقد تقودك إلى صفحة لا تحتوي على ما تبحث عنه لأن بها إعلان مثلاً أو رابط يحتوي على بعض من كلمات النص الذي تبحث عنه، والمشكلة الأخرى وهي التي تواجه الشركات التي توفر محركات البحث هي أن حجم البيانات وما تتطلبه من سعات تخزين واتصال وإشغال لمعالجات البيانات يكون عدة أضعاف المطلوب لو استطاعت حصر الغث عن السمين.

المعضلة الأخرى التي تواجهها محركات البحث النصية هي القدرة على تمييز حقول المعلومات في داخل النصوص، فمقالة الجرائد مثلاً لها تاريخ وكاتب وعنوان وقد يكون بها ملخص بالإضافة إلى المقالة نفسها، وبكل تأكيد فإن كل حقل من هذه الحقول له دلالته التي ينبغي أخذه في الاعتبار لضمان دقة البحث.

Eyeلكل ما سبق ولعدة أهداف أخرى لا يتسع المقام لذكرها فقد قامت شركة أنظمة المعلومات العربية (إنفو أراب) بتطوير تقنيات البحث الدلالي تحت الاسم التجاري Fetch، وقد بدأت في هذا المسار منذ حوالي عشرة سنوات بإطلاق تقنية البحث الدلالي في أجهزة الحاسبات الشخصية باسم Fetch PC© وطورتها لعدة تقنيات أخرى منها Fetch Enterprise©إلى أن قامت في العام الماضي 2012 بطرح تقنيات Fetch Cloud© المعنية بالبحث الدلالي في جميع مصادر البوابات الإلكترونية.

وتتميز تقنيات Fetch Cloud© بالمميزات التالية…

متابعة نطاق عريض من المصادر التي تشمل الصحف والجرائد والمجلات والإذاعات وشبكات التلفزيون الإخبارية سواء المحلية أو الإقليمية أو العالمية، وكذلك المدونات ومواقع التواصل الاجتماعي فيس بوك وتويتر ويو تيوب وغيرهم.

تتيح لمستخدميها تحديد نطاق البحث والمتابعة في هذه المصادر بالإضافة والحذف والتعديل.

تستطيع تمييز الأجزاء والأقسام التي تتعلق بالموضوع Relevant sections وفصلها عن باقي الأجزاء Irrelevant sections من الصفحة الواحدة.

تستطيع تمييز الحقول الخاصة بكل مدخل من تاريخ وعنوان واسم مؤلف وناشر وصور وخبر ومقال ومداخلة …إلخ.

تستطيع تبويب الأخبار والمقالات والمدونات إلى الأبواب التي تنتمي إليها (مثال… سياسة، اقتصاد، رياضة، فن …إلخ).

تستطيع الوصول إلى المداخلات المرتبط بالخبر أو المقال سواء بشكل مباشر على الصفحة نفسها أو كتعليقات على مواقع التواصل الاجتماعي الأخرى وربط كل ذلك سوياً للحصول على نظرة عامة متكاملة عن الموضوع ومدى انتشاره أو تأثيره.

تستخدم تقنيات البحث الدلالي المتقدمة Fetch© التي تأخذ في اعتبارها عشرات المتغيرات التي قد تؤثر على دقة البحث وفاعليته ومنها الأخطاء الإملائية والتغييرات التي تلحق بالكلمات من جراء القواعد الصرفية كما تبحث بالكلمة ومرادفاتها العربية والإنجليزية ودلالتها.

تتيح كل ما سبق من معلومات بالعديد من الأشكال ومنها RSS, XML, JSON في شكل Web Services أو http requests وغيرهم.

لمزيد من المعلومات يمكنك تحميل التقديم الأولي للتقنيات باللغة الانجليزية

Advertisements