http://arius.blogfa.com
 
invitation to religion

محركات البحث في النصوص العربية وصفحات الإنترنت

 

يتناول هذا المقال تعريفَ محرِّكات البحث في النصوص العربية وصفحات الإنترنت، ومبدأ عملها. ثم يَعرض مشكلاتِ البحثِ ذاتَ المنشأ اللغوي والتنفيذي، ونماذجَ من واجهات البحث في النصوص العربية، وأخرى من محرِّكات البحث في مواقع الإنترنت وصفحاتها. وأخيرًا يَقترح خوارزميةً لتطوير هذه المحرِّكات.

 

1- مقدمة:

دَرَج مؤلِّفو الكتب ومصنِّفوها على تذييل كُتُبهم بفِهْرِسٍ يتضمَّن عناوينَ أقسامها وأبوابها وفصولها. وغرضُهم من هذا تيسيرُ الوصول إلى العنوان المطلوب من طريق رقم جزء الكتاب ورقم صفحته. وقد تقتضي مادةُ الكتاب وضْعَ فِهرسٍ مفصَّلٍ يتضمن مسائلَه الفرعية، أو وضْعَ فهرسَيْن: أحدهما إجماليٌّ، والآخر تفصيليٌّ؛ كما في كتاب النحو الوافي، لمؤلِّفه عباس حسن؛ حيث أُفْرِدَ لكلِّ جزءٍ من أجزائه الأربعة فهرسان؛ الأول لبيان الأبواب العامة للجزء، والآخر لتفصيل المسائل والموضوعات التي يشتمل عليها كلُّ بابٍ من أبوابه العامة. بلغ مجموعُ صفحات النحو الوافي   2890صفحة، وعددُ صفحات فهارسه 80 صفحة [أي بنسبةٍ مئويةٍ قدرُها 2.8% من حجم الكتاب].


..........................................................



ادامه مطلب
نوشته شده در تاريخ Fri 19 Apr 2013 توسط ariusabdulahad
بررسي مؤلفه هاي مؤثر بر ميزان بازيابي اطلاعات (جامعیت) و

دقت بازيابي اطلاعات (مانعیت) در نظام هاي بازيابي اطلاعات وب مدار

محسن شمس اژه اي - سيروس اميدي فر

 

 
مقدمه
وب، همچون مغز بيکران همگاني است. مغزي که بسيار بيشتر از آنچه مغز يک انسان مي­تواند در خود جاي دهد در خاطر دارد. خرد انباشته شده در وب ما را قادر مي­سازد تا ابعاد تازه­اي را تجربه کنيم. وب به عنوان بزرگترين بستر ضبط خلاقيت بشر مطرح است. ورود اينترنت به زندگي انسان و استفاده از آن به عنوان بستري براي تبادل، ذخيره و بازيابي اطلاعات، فرصت­هاي بسياري از جمله ذخيره اطلاعات در محيطي نامحدود و بازيابي آن در اين محيط را در اختيار انسان قرار داده است. امّا سيل روز افزون توليد اطلاعات و گوناگوني محتواي موجود در وب به عنوان عمده­ترين خدمت موجود بر روي آن، بازيابي اطلاعات را با مشکل مواجه ساخته است. انسان با تلاش براي کنترل اطلاعات موجود در اين اقيانوس بيکران اطلاعات و اين مغز همگاني، سعي در بدست آوردن مربوط ترين اطلاعات موجود در اين محيط دارد و اين خود بزرگترين چالش عصر حاضر است.
رشد مجموعه­هاي متن الكترونيك (براي مثال كتابخانه­هاي ديجيتال، وب و اينترانت) شديداً دشواري يافتن اسناد مربوط را افزايش داده است. براي مثال رشد تواني اندازه وب، مطرح كننده نيازهاي جديد به فنون بازيابي اطلاعات جاري بوده است.
مشكل سخت تعيين محل كردن بهترين اسناد مرتبط با نياز اطلاعاتي كاربر است (باروس، ؟). در اين مقاله، ضمن بيان برخي مفاهيم، مؤلف مي­کوشد با توجه به افزايش ميزان توليد اطلاعات در وب، و تعدد نظام­هاي بازيابي موجود در وب، به رويکردهايي که عمدتاً اين نظام­ها پيش گرفته­اند تا ميزان جامعيت و مانعيت را براي کاربر مهار پذير نمايند اشاره کند. مؤلف مي­کوشد تا با ترسيم سه مؤلفه اصلي، رويکردهايي را که حول اين سه مؤلفه شکل گرفته­اند تا بر ميزان جامعيت و مانعيت تأثير گذارند را بيان مي­کند. شايان ذکر است که رويکردهاي خاص که توسط برخي نظام­ها دنبال مي­شود ذکر نشده و تنها رويکردهاي عمومي که تقریباً تمامي نظام­هاي بازيابي وب مدار از آنها بهره مي­برند بيان مي­شود.... بقیه در ادامه مطلب ...


ادامه مطلب
نوشته شده در تاريخ Sat 18 Feb 2012 توسط ariusabdulahad
تمامی حقوق این وبلاگ محفوظ است | طراحی : پیچک