إجمالي مرات مشاهدة الصفحة

الثلاثاء، 2 سبتمبر 2014

أدوات البحث عن المعلومات الرقمية 2

أدوات البحث عن المعلومات الرقمية 2

 محركات البحث ( Search Engines) :

 مفهوم محرك البحث : 

هي أداة تبحث عن مصادر المعلومات على الإنترنت والمصادر ويقصد بها هنا المعلومات على المواقع ، وتخزين عناوينها على مرصد البيانات الخاص بها ، ثم تتيحها للمستفيدين كل حسب المصطلحات المستخدمة في البحث ، ومن ثم تمكن المستفيدون الوصول إلى مصادر المعلومات المختلفة على الإنترنت ، ويتم تجميع هذه المصادر وتصفحها إما بطريقة آلية Spidering or Crawling )  ) أو بطريقة يدوية . [1]
على خلاف الأدلة الموضوعية، فإن محركات البحث تشكل كشافات شاملة للإنترنت ، بالرغم من أن محركات البحث تهدف إلى تكشيف كل كلمة واردة في كل صفحة من صفحات الويب ، فإن ذلك يمثل مهمة مستحيلة ، فحتى أكبر محركات البحث لا تستطيع تكشيف سوى ما يقارب 60 - 80 بالمائة مما يتوافر من معلومات في الإنترنت ، وتتأثر عملية تكشيف المعلومات بالإنترنت بقوة الحوسبة المتوفرة ، وبالطبيعة المتغيرة للويب ، وببعض المسائل ذات العلاقة ببنية قاعدة البيانات لمحرك البحث وطريقة تصميم موقع الويب ، وتقوم برمجيات تسمى بالإنسان الآلي Robots)) وبالعناكب ( Spiders ) وبزواحف الويب ( WebCrawler ) وبالديدان ( Worms ) باستمرار بتجميع صفحات الويب و تكشيفها .[2]

مكونات محرك البحث :

1- العناكب الآلية:  وهي برامج حاسبية تجوب أنحاء الويب والمواقع المختلفة عبر الوصلات التشعبية من وصلة إلى أخرى فتجمع بعض المعلومات عن المواقع الجديدة بجميع صفحاته لإضافتها ،و كذلك تبحث عن المحدث من الصفحات ، والشيء المهم هنا هو أنه كلما زادت شعبية الموقع والوصلات التي تشير إليه أدى ذلك إلى سرعة فهرسته والتعرف عليه  .
2- قاعدة بيانات المحرك: حيث تشكل جميع البيانات المخزنة حول صفحات الويب قاعدة بيانات المحرك ، وتتضمن مجموعة البيانات الصفحات التي تم التعرف عليها من قبل العناكب و كذلك تستقبل المواقع المضافة عن طريق الناشرين أنفسهم .
3- الفهرس : حيث يفحص برنامج الفهرسة المعلومات المخزنة في قاعدة البيانات ، و ينشئ جداول تحتوي على قوائم مرتبة هجائيًا بالكلمات الرئيسة المهمة داخل الصفحات التي تم العثور عليها من العناكب (بعد تصفية الكلمات الشائعة) لكي تستخدم لمطابقة السجلات ، وتختلف محركات البحث عن بعضها في حجم الفهرس و سرعة تحديثه ،خاصة في ظل التزايد المتسارع في مواقع الإنترنت .
ولتحقيق التفاعل بين الباحث ومحرك البحث يبدأ ذلك الباحث يستخدم برنامج محرك الاسترجاع في محرك البحث المستخدم ، وهذا البرنامج أداة للتفاعل مع الباحث عبر الإنترنت حيث يتيح له أن يستعلم عن كلمات معينة داخل الفهرس فيجلب له قائمة بعناوين الصفحات التي تحتوي على الكلمات المستعلم عنها .[3]
ويقوم المستفيد بصياغة بحثه بطباعة الكلمات المفتاحية وعندها يقوم محرك البحث بالبحث عن الكلمات المفتاحية في قاعدة بياناته الضخمة ، ويتم استرجاع كل الوثائق التي تتضمن تلك المصطلحات وترتيبها في قائمة النتائج أو في ما أصبح يعرف بـِ ( hot list ) ، وغالباً ما يغرق المستفيد في النتائج وذلك لكثرة ما يوجد من معلومات بالإنترنت ، ولا تشكل القوائم التي تتضمن الآلاف من النتائج إجابة على سؤالك سوى تلك الموجودة في أعلى القائمة ، وتستخدم محركات البحث خوارزمية للترتيب ( Ranking Algorithm ) حتى تظهر الإصابات ذات العلاقة بموضوع البحث في أعلى القائمة ، وخوارزمية الترتيب هي عبارة عن معادلات رياضية تحدد الترتيب الذي يجب أن تعرض وفقه نتائج البحث. وعليه ، فإن الوثائق ذات العلاقة الأقوى بموضوع البحث تظهر في أعلى القائمة وأضعفها تظهر في أسفل القائمة .
ولكل محرك بحث ما يلي :
·     نظام للتجميع بغرض ملء قاعدة البيانات بالمعلومات .
·     نظام للتكشيف لتنظيم قاعدة البيانات .
·     خوارزمية للبحث تفي بمتطلبات بناء الجملة للبحث في قاعدة البيانات .
·     خوارزمية للترتيب لتنظيم قائمة النتائج .
إن وجود اختلاف وإن كان بسيطاً  في هذه البرامج الأربعة يؤثـر على النتائج المتحصل عليها وهذا هو السبب الذي يجعل النتائج تختلف اختلافاً كبيراً بين محركات البحث ، حتى وإن كانت تستخدم مصطلحات البحث نفسها ، وهذا سبب كاف ليجعلك تتجنب التعود على استخدام محرك بحث واحد . [4]

 أنواع محركات البحث :

تختلف محركات البحث في آلية عملها ومضمونها مما دعى ذلك الى تصنيفها حسب آلية عملها والمحتوى الذي تقدمه للمستخدم كالآتي :

1-  محركات بحث أجنبية Foreign search engines)  )
وهى تلك المحركات التي يمكنها التعامل مع لغات إضافية غير اللغة الإنجليزية كالفرنسية والأسبانية وغيرها .
أمثلة هذه المحركات : محرك ألتافيستا (AltaVista)   - محرك جوجل (Googol)محرك اكسايت (Excite)   

2- محركات البحث المتخصصة (Specialized search engines)
وهى تلك المحركات التي تتخصص في قطاع موضوعي معين كالعلوم - الهندسة – الطب – العلوم الإنسانية  وغيرها من القطاعات الموضوعية ، أمثلة للمواقع المتخصصة : (infinisource.com ) ,( ingenta.com ) (scirus.com) 

3- محركات البحث العربية
ظهر مؤخراً بعض محركات البحث التي تدعم البحث باللغة العربية وذلك لإعطاء الفرصة لأكبر عدد من الناس للاستفادة من محتوى الإنترنت الهائل .[5]
3- محركات البحث الكبرى ( Metasearch Engines ) :
من أهم المشكلات التي تتعلق بمحركات البحث وحتى بالأدلة الموضوعية أنها تكشف أجزاء مختلفة من المعلومات المتوافرة على الإنترنت ، فهكذا نجد أن صفحات الويب التي يغطيها محرك AltaVista والتي يبلغ عددها 150 مليون صفحة تختلف عن 115 مليون صفحة يقوم Hotbot  بتكشيفها ، ويرجع هذا التباين إلى اختلاف الطرق التي تتوخاها زواحفها (Crawlers) في التنقل داخل الإنترنت والبحث عن صفحات الويب ، ويمكن أن تستوضح هذا الأمر عندما تستخدم عدداً من محركات البحث لتنفيذ البحث نفسه فتحصل على نتائج مختلفة .
وإذا أردت أن تبحث في كامل الشبكة العنكبوتية العالمية أو تود الحصول على أكبر عدد ممكن من النتائج فصغ استفسارك لدى عدد من محركات البحث ، وفي هذه الحالة ستأتيك النتائج من Google و AltaVista و Hotbot وغيرها ، قارن النتائج المتحصل عليها من هذه الأدوات المختلفة وستحصل على نتائج تختلف في جزء منها وتتكرر في جزء آخر ، وإذا ما حددت ما هو مختلف ضمن هذه النتائج فستتكون لديك فكرة بخصوص ما يتوافر من معلومات حول موضوعك في الويب .
بإمكانك أن توفر على نفســك كــل هذا العناء باستخدامك لأحد محركات البحـث الكبرى (Meta Search Engines) .
كيف تعمل محركات البحث الكبرى ؟
تقوم هذه الفئة من أدوات البحث بدور الوسيط بين المستفيد ومحركات البحث ، فهي تستلم استفسارك ثم تمرره إلى عدد من محركات البحث التقليدية ، ثم تقوم بالإمساك بهذه النتائج وتسليمها إليك في قائمة واحدة .
ويرى بعض المختصين في المجال أن تنفيذ البحث باعتماد إحدى هذه الأدوات لا يفضي إلى نتائج جيدة إلا إذا كانت مصطلحات البحث من النوع البسيط ، وإذا كان المستفيد يرغب في تنفيذ بحث معقد ، فعليه أن يتجاهل محركات البحث الكبرى ، وعليه فإن السبب الأساس في عدم ملائمة محركات البحث الكبرى لتنفيذ بحث معقد يكمن في التباين الموجود بينها ، فمنها ما يقبل المنطق البولياني Boolean Logic)) ومنها ما لا يقبله أو يستخدمه بطريقة مختلفة ، وعليه فإن صيغة الاستفسار المقبولة من قبل محرك بحث قد تكون غير مقبولة ، أي غير مفهومة من قبل محرك بحث آخر .
وتختلف محركات البحث الكبرى نفسها فيما بينها ، فمنها ما يمكن أن نصفه بأدوات البحث العاديـة ، ومنها ما يمكن أن نسميه بأدوات البحث (الذكية). وتتلخص طريقة عمل الفئة الأولى في أنها تتلقى استفسار المستفيد وترسله إلى عدد من محركات البحث والأدلة الموضوعية ، أما محركات البحث الكبرى الذكية فإنها تحاول إعادة صياغة استفسار المستفيد بطرق مختلفة لكي تكون مفهومة ومقبولة من قبل أدوات بحث مختلفة ، كما أنها تحاول أن تدمج النتائج المتحصل عليها في قائمة واحدة بهدف تسهيل مهمة المستفيد بتوفير وقته وجهده .[6]
________________________________

المصادر


[1] منى عبد العزيز اسماعيل – مصدر سابق.
[2] عبد المجيد بوعزة . مصدر سابق ،  ص ص73-74
[3] منى عبد العزيز اسماعيل . - مصدر سابق.
[4] عبد المجيد بوعزة مصدر سابق ،  ص ص 74-75
[5] منى عبد العزيز اسماعيل . مصدر سابق.
[6] عبد المجيد بوعزة . مصدر سابق ،  ص ص 83-84

الأربعاء، 13 أغسطس 2014

أدوات البحث عن المعلومات الرقمية

أدوات البحث عن المعلومات الرقمية (1)

تنقسم أدوات البحث عن المعلومات الرقمية إلى ثلاث فئات أساسية، وهي :
1- الأدلة الموضوعية (Subject Directories ) .
2- محركات البحث ( Search Engines) .
3- محركات البحث الكبرى ( Metasearch Engines ) .[1]

1 -  الأدلة الموضوعية (Subject Directories) :

          يعد دليل الويب وسيلة أخرى للبحث عن المعلومات في شبكة الويب العالمية خلافًا لمحركات البحث ، فهو موقع به روابط منظمة ومرتبة ( تنظم عادة حسب موضوعات عامة وأخرى فرعية ) تؤدي إلى مصادر المعلومات ،وتنشأ هذه الأدلة من قبل بعض الجهات أو المؤسسات ،ثم يجري تحديد المصادر التي ستشير الروابط إليها  وتجمع وتراجع وتصنف لتوضع في أدلة الويب .

أنواع الأدلة :

عندما نتحدث عن أنواع الأدلة فإننا نقصد بذلك الجوانب الموضوعية التي تخدمها مثل هذه المواقع ، والملاحظ أن هناك علاقة بين نوع الدليل ونوع الخدمات التي يقدمها سواء أكان ذلك من حيث الكم أم المعالجة أم المقابل المادي للخدمة المقدمة للمستفيدين ، ويمكننا القول إن هذه الأدلة تندرج تحت نوعين أساسيين هما :

أ‌- الأدلة الأكاديمية أو المتخصصة :
 نوع من مواقع الويب التي تتميز بطابع مهني تخصصي،وعادة ، يشرف عليها خبراء محترفون لخدمة الباحثين و المهنيين ، وتتطلب الخدمة المعلوماتية المقدمة للمستفيدين منها مقابلاً مادياً ، وقلما نجد مثل هذا النوع من الأدلة يقدم خدمات للمستفيدين بدون مقابل .

ب‌- الأدلة التجارية العامة :  
وهي مواقع ويب تعرف لدى الكثير من مستخدمي الإنترنت بالمرافئ (Portals) ، وعادة ما تركز فهارسها على المعلومات العامة ولا تتعمق موضوعياً فيما تضمه من معلومات أو مواقع ضمن تشكيلات تلك الفهارس ، و يغلب عليها التنافس فيما بينها لكسب أكبر عدد من المستخدمين ، لأنها توظف ضمن محتوياتها جوانب إعلانية تسويقية وخدمات تجارية تهدف منها للربح دون أن يدفع مستخدمها قيمة للمعلومات التي تسديها له وتمثل الفهارس الخاصة بالموضوعات ضمن هذه الأدلة نقطة البداية الأولى للوصول إلى مواقع جيدة خاصة إذا لم يكن موضوع البحث دقيقًا أو نادرًا ، ولأنها تغطي جزءًا صغيرًا من الصفحات المتوافرة على الويب ، فهي وسيلة بحث فعالة للوصول إلى معلومات عامه شائعة ، أما إذا كان البحث عن معلومات محددة دقيقه فإنه ينصح باستخدام النوع الأول من الأدلة ( الأكاديمية / المتخصصة ) .

على الرغم من أن هذا النوع من الأدلة تخدم بعض الموضوعات فإنها تختلف فيما يتعلق بمحتوى ما يصنف لديها ونوعيته ، فموقع مثل ( Yahoo) لا يهتم كثيرًا بالمحتوى أما موقع (Look smart) فإنه يحرص على انتقاء المواقع المتميزة ، ويلاحظ أن بعض الأدلة تقدم لمستخدميها معلومات مهمة جدًا عن سياستها في الانتقاء بالإضافة إلى مؤهلات مفهرسيها ، لكن ذلك ليس في كل مواقع الأدلة .

- المزايا
سهولة الاستخدام للباحثين بالإضافة إلى أن النوع الأول من الأدلة على وجه الخصوص يطمئن الباحث إلى أن المعلومات المضمنة في المواقع المفهرسة قد تم مراجعتها عن طريق خبراء متخصصين وقد يكون هؤلاء من المتميزين في تلك الجوانب الموضوعية التي كلفوا بفهرستها .

- العيوب :
 يتطلب هذا النوع من المواقع المراجعة والتدقيق والفهرسة ،ويتطلب هذا وقتًا و جهدًا مما ينعكس على محدودية مثل هذه الأدلة قياسًا بالكم الهائل لمواقع الإنترنت بالإضافة إلى أن تحديثها يتطلب وقتًا ليس بالقصير .[2]
تتميز مقاربة الدليل الموضوعي ( Subject Directory Approach ) بالبحث في قاعدة بيانات صغيرة تشمل عناوين وشروحاً ، أعدتها مواقع الويب وقام العاملون بمؤسسة الدليل الموضوعي بانتقائها وتنظيمها في فئات موضوعية، وعليه، فيمكن تعريف الأدلة الموضوعية كمواقع متخصصة بالإنترنت تنتقي مواقع ويب أخرى وتنظمها تحت رؤوس موضوعات واسعة مثل الفن والتربية  والتسلية، والعلوم ، ويمكنك أن تتصفح باعتماد موضوعات عريضة إلى أن تجد الموضوع المحدد الذي ترغب فيه أو أن تقوم ببحث ضمن الدليل الموضوعي باستخدام كلمات مفتاحيــة ( Keywords ).
يغطي الدليل الموضوعي الواحد جزءاً صغيراً مما يتوافر من مواقع بالإنترنت ، فعلى سبيل المثـال  فإن ياهــو ( yahoo ) - الذي يعد أكبر دليل موضوعي والأكثر شعبية - يغطي أقل من 1 بالمائة من الويـب ، والأشخاص الذين ينشؤون الدليل الموضوعي هم الذين يحددون الفئات الموضوعية  التي يجب أن تكون على رأس القائمة.
ونظراً لغياب ترتيب هرمي معياري أو لغة موحدة تؤخذ منها المصطلحات الموضوعية ، فإن استخدام عدد من الأدلة الموضوعية يشبه التجول داخل محلات مختلفة لبيع الكتب حيث يمتلك كل واحد منها مجموعة مختلفة من الكتب وضعت على الرفوف حسب رؤوس الموضوعات المتبعة بالمحل ، وبالرغم من أن هناك نقاطاً تلتقي فيها مجموعات محلات بيع الكتب ( الأدلة ) فإننا لا نجد الكتب نفسها في اثنين منها ولا تحوي مجموعاتها كل الكتب المطبوعة . [3]
لكل دليل موضوعي طابعه الخاص ويحاول أن يميز نفسه بامتلاك قوة مميزة ، فعلى سبيل الذكر إذا كنت ترغب في معلومات أكاديمية عليك أن تستخدم دليل إنفومين ( Infomine) الذي أنشئ لخدمة الأكاديميين ، أما إذا كنت تبحث عن معلومات يمكن أن تندرج تحت فئة موضوعية واسعة أو شعبية، فعليك أن تستخدم دليل ياهو ( Yahoo ) ، وإذا كنت تعتقد أنه من الأفضل بالنسبة إليك أن تستعين بمختص المراجع ( (Reference librarian ، فما عليك إلا أن ترجع إلى كشاف المكتبيين بالإنترنت ( Librarians’ Index to the Internet ) . ويوجد نوع آخر من الأدلة الموضوعية ، وهو الدليل الذي يختص في مجال واحد ( مثل الطب والتجارة ) ، ومن أمثلة الأدلة المتخصصة في الطب المتاحة على الإنترنت يمكن الإشــارة إلى Medical Matrix (http://medmatrix.org/index.org/index.asp) وOMNI  (http:omni.ac.uk).
يكمن الهدف من وراء إعداد الأدلة الموضوعية في تنظيم المعلومات مسبقاً في فئات موضوعية حتى يتمكن المستفيد من استخدامها في تصفح المعلومات ، إن البحث داخل قاعدة بيانات أحد الأدلة الموضوعية يشبه البحث عن المعلومات باعتماد الفهرس ، فعندما تستخدم فهرس المكتبة فأنت تبحث عن مؤلف الكتاب أو عنوانه أو موضوعه ، وعليه، فأنت لا تتوقع من فهرس المكتبة أن يمكنك من البحث باعتماد النص الكامل للكتاب ، كذلك للمكتبات نظامها الخاص الذي يمكنك من التعرف إلى الموضوعات الأخرى ذات العلاقة بموضوع بحثك ، وتقوم الأدلة الموضوعية بهذه الوظيفة بتمكين المستفيد من التصفح من خلال رؤوس موضوعات واسعة ، وتتيح العديد من المتصفحات للمستفيد إمكانية استرجاع المعلومات لا عن طريق التصفح فحسب وإنما أيضاً بواسطة الكلمات المفتاحية ( Keywords) ، واستخـــدام هذه الكلمـــات لا يستدعي منك معرفة رأس الموضوع (الفئة الموضوعية) التي تندرج تحتها المعلومات التي ترغب فيها فاعتماد طريقة الكلمات المفتاحية يمكنك من الوصول مباشرة إلى المصادر ذات الصلة بمصطلح البحث المستخدم.
عندما تبحث في دليل موضوعي فأنت تبحث على الأقل من خلال عناوين صفحات الويب ، بيد أن الأدلة الموضوعية الجيدة تتيح لك فرصة البحث من خلال الشروح التي قام بإعدادها القائمون على الأدلة المذكورة ، وفي بعض الحالات فأنت تجد نفسك تبحث باعتماد الشروح التي وضعها مؤلفو صفحة الويب بأنفسهم ، وبما أن شروح المؤلف قد تقتصر على جزء معين من الوثيقة و تهمل غيرها من المعلومات الموجودة بصفحة الويب ، فهذا قد يفضي إلى نتائج غير متوقعة في ختام عملية البحث .[4]

ــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــ

المصادر:


[1] عبد المجيد بوعزة . المكتبات الرقمية : تحديات الحاضر و آفاق المستقبل . – الرياض : مكتبة الملك فهد الوطنية ،2005. – ص 64
[2] منى عبد العزيز اسماعيل . استراتيجيات البحث واستخدام قواعد البيانات . – مقالة منشورة في Konl.google وحدة المعرفة . – متاح في الرابط: hw2eymkgep6y/1إيهاب رجب/استراتيجيات-البحث-واستخدام-قواعد /http://konl.google.com/k/2
تاريخ الدخول إلى الموقع :20/3/2012
[3] عبد المجيد بوعزة .-  مصدر سابق ، ص 65
[4] عبد المجيد بوعزة . - مصدر سابق ، ص ص 67- 69.