این مقاله تکامل وب را در رابطه با وب و فناوریهای بازیابی اطلاعات بررسی میکند.
در این بررسی بین عناصر مختلف وب در زمینهء نمایهسازی و صفحات جستجوی وب وجه تمایز وجود دارد.
ده ابزار اصلی و مهم وب براساس معیارهای انتخاب و تعداد اتصالها با یکدیگر مقایسه و ارزیابی شدهاند.
ابزارهای جستجو مانند راهنماها و موتورهای جستجوگر نیز مورد بررسی و مقایسه قرار گرفتهاند.
کلمه اینترنت مخفف Interconnected Networks و به معنی شبکههای بههممرتبط است.
اینترنت سیستمی برای توزیع و تبادل اطلاعات در سطح جهان است که براساس آخرین آمار موجود در حال حاضر 226 کشور به آن متصل هستند.
این مجموعه به همراه فناوریهای ساده کاربردی، سبب کاهش هزینهء نشر الکترونیکی شده است (1).در هر صورت، وب یک عنصر منسجم و واضح مستقل نیست، بلکه دو عنصر مجزای وب وجود دارند: وب قابلرویت و دیدنی، و وب نامرئی و غیرقابل رویت(2).
برای فهم کاربرد این دو عنصر و برای ارزیابی اطلاعات ضرورت دارد که از موضوع خارج شویم و ببینیم چگونه صفحات وب تولید میشوند.
دو نوع صفحهء وب وجود دارند: استاتیک و دینامیک.
صفحات وب استاتیک توسط طراح وب، در خدماتدهندهء وب نصب میشوند و برای هر کس و هر چیزی که وب سایت را مشاهده کند قابل دسترساندو هر تغییری هم باید به صورت دستی انجام شود.
صفحات وب دینامیک توسط رایانه با بهکارگیری دستورهای یک زبان دستنوشته(1) و اغلب «سیجیآیجاوا»(2)که به عنوان پلی بین سرویسگرهای پروتکل انتقال ابرمتن (3) و کاربران وب عمل میکند، ایجاد می شود.
دستورهای یک زبان دستنوشته، نتایج را در یک صفحهء خالی وب جا میدهند و به کاربر، صفحهء وب دینامیک را ارائه میدهند.
صفحات وب استاتیک اطلاعات عام و کلی را برای کاربر تهیه میکند، در حالی که صفحات وب دینامیک، اطلاعات منحصربهفرد را برای کاربر تهیه مینمایند.
صفحات وب استاتیک برای همهء کاربران قابل رویتاند و در دسترس می باشند.
چکیده این مقاله تکامل وب را در رابطه با وب و فناوریهای بازیابی اطلاعات بررسی میکند.
ابزارهای جستجو مانند راهنماها و موتورهای جستجوگر نیز مورد بررسی و مقایسه قرار گرفتهاند.
کلیدواژه : وب، راهنماهای جستجوگر، موتورهای جستجوگر مقدمه کلمه اینترنت مخفف "Interconnected Networks" و به معنی شبکههای بههممرتبط است.
این مجموعه به همراه فناوریهای ساده کاربردی، سبب کاهش هزینهء نشر الکترونیکی شده است (1).در هر صورت، وب یک عنصر منسجم و واضح مستقل نیست، بلکه دو عنصر مجزای وب وجود دارند: وب قابلرویت و دیدنی، و وب نامرئی و غیرقابل رویت(2).
برای فهم کاربرد این دو عنصر و برای ارزیابی اطلاعات ضرورت دارد که از موضوع خارج شویم و ببینیم چگونه صفحات وب تولید میشوند.
دو نوع صفحهء وب وجود دارند: استاتیک و دینامیک.
صفحات وب استاتیک توسط طراح وب، در خدماتدهندهء وب نصب میشوند و برای هر کس و هر چیزی که وب سایت را مشاهده کند قابل دسترساندو هر تغییری هم باید به صورت دستی انجام شود.
صفحات وب دینامیک توسط رایانه با بهکارگیری دستورهای یک زبان دستنوشته(1) و اغلب «سیجیآیجاوا»(2)که به عنوان پلی بین سرویسگرهای پروتکل انتقال ابرمتن (3) و کاربران وب عمل میکند، ایجاد می شود.
دستورهای یک زبان دستنوشته، نتایج را در یک صفحهء خالی وب جا میدهند و به کاربر، صفحهء وب دینامیک را ارائه میدهند.
صفحات وب استاتیک برای همهء کاربران قابل رویتاند و در دسترس می باشند.
اولین مطالعه در موسسه تحقیقاتی «انئیسی» در پرینستون آمریکا در دسامبر سال 1997 نشان داد که صفحات وب قابل رویت، حداقل 320 میلیون صفحهء وب را شامل میشوند، در حالی که دومین مطالعه تخمین زد که تعداد صفحات وب رشد کرده و به 800 میلیون صفحه در فوریه سال 1999 رسیدهاند.
در هر صورت، اکثر ناشرین اطلاعاتشان را بر روی وب به وسیلهء پایگاههای اطلاعاتی بزرگ توزیع میکنند.
این اطلاعات اساسا جنبه تجاری دارد (2).
موتورهای جستجوگر(4) و راهنماهای وب 2.
1.
راهنماهای وب چه تفاوتی بین راهنمای وب و موتور جستجو وجود دارد؟
راهنمای وب: الف.
فهرستی از سایتهای وب که از قبل تعیین شدهاند، میباشد؛ ب.
توسط ویراستاران جمعآوری شده؛ ج.
براساس موضوع و عنوان طبقه بندی شده؛ د.
انتخابی است.
با توجه به این که راهنماهای وب توسط افراد جمعآوری میشوند, تصمیمگیری دربارهء کیفیت محتوای هر یک از سایتهای وب قبلا انجام شده است.
در نتیجه راهنماهای وب در اینترنت بسیار مورد مراجعه قرار میگیرند، زیرا کاربران به دنبال موضوعات خاصی در اینترنت هستند که این راهنماها، نقطهء شروع خوبی در تشخیص بهترینها در وب میباشند.
در کاربرد راهنماهای وب، کاربر میتواند در بین فهرستهای راهنما حرکت نماید.
راهنماهای اصلی وب همچنین اجازهء عبور از دیگر موتورهای جستجو را هم میدهند.
مثلا بزرگترین راهنمای وب، یعنی «یاهو»، اجازهء عبور از موتور های جستجوی دیگر را میدهد.
سایتهای وبی که به وسیلهء راهنمای وب نمایهسازی شدهاند، به علت روند تکمیل به صورت دستی، در آن راهنماها باقی میمانند؛ مگر این که به احتمال بسیار ضعیف به صورت دستی حذف شوند.
در حالی که وجود دائمی یک لیست یا یک فهرست در موتور جستجو همیشه ضمانت نمیشود، اما ساختن و حضور دائمی یک فهرست در یک راهنمای وب مثل «یاهو» امکانپذیر میباشد.
2.
موتورهای جستجوگر وقتی که یک موتور جستجوگر را به کار میبرید، کاربر، پایگاه اطلاعاتی سایتهای وب را جستجو مینماید.
همه موتورهای جستجوگر دارای سه جزء ترکیبی هستند: الف.
«اسپایدرها»(5)که سایتهای وب را بررسی میکنند، ب.
فهرستها و نمایه پایگاه اطلاعاتی؛ ج.
نرمافزار بازیابی اطلاعات.
2 .
2 .1.
اسپایدرهای موتورهای جستجوگر پایگاه اطلاعاتی موتورهای جستجوگر ابتدا توسط «اسپایدرها» ساخته میشود و توسط موتورهای جستجوگر به مأخذ اصلی اعزام میشود.«اسپایدرها» برنامههایی هستند که وب را به دنبال صفحات جدید وب جستجو مینمایند، کلمات را نمایهسازی میکنند و اتصال را به صفحات برقرار مینمایند، سپس کلمات نمایهشده را با آدرسی که به یک صفحهء وب یا هر منبعی که بر روی وب جهانی و به طور کلی اینترنت قرار دارد اشاره مینماید,(6) مقابله میکنند.
2 .2.
نمایهء پایگاه اطلاعاتی موتور جستجو این بخش عنصر اصلی از هر موتور جستجو است.
این همان چیزی است که کاربر به دنبال آن است.
در طی سال 1998 تعدادی از تولیدکنندگان موتورهای جستجو آغاز به کار کردند.
این شرکتها نمایهها را مطابق با معیارهای گوناگون ساختند.
بطور مثال می توان از نمایهء «دایرکت هیل» و «گوگل» (7) نام برد و نیز «نمایهء نامهای حقیقی» (8) که شرکتها را قادر میسازد واژههای کلیدی خود را برای حمایت از محصولات خود ثبت نمایند.
3 .
نرمافزار بازیابی اطلاعات تمامی موتورهای جستجوگر، نرمافزار مختص به خود برای پاسخگویی به سوالات دارند.
موتورهای جستجوگر مطابق با قوانین مشابه به شرح زیر عمل مینمایند: هر سایت وب شامل کلمات یا واژههایی است که سوءال کاربر را با آنها مقابله میکند.
و در صفحهء نمایش، به صورت فهرستوار نمایش میدهد و با توجه به سوال کاربر و ارتباط موضوعی، فهرستی از مطالب را طبقهبندی مینماید.
تفاوت مختصری در چگونگی کار الگوریتمها بین موتورهای جستجو وجود دارد، که دلیلی بر این مدعااست که کاربران، با یک پرسش واحد, از موتورهای مختلف نتایج متفاوتی را کسب مینمایند.
در هر صورت، دلیل مهم دیگر اختلاف نتایج جستجو، نسبت پایین همپوشانی، در بین موتورهای جستجوگر میباشد.
پورتالها «پورتال»(9) ها سایتهای وبی هستند که خود عرضهکنندهء خدمت خاصی نیستند، ولی مراجعین را به صورت ساده و دوستانه به اطلاعات و سایتهای موردعلاقهشان هدایت میکنند.
«پورتال» ها نقاط اصلی برای راهبردهای تجارت الکترونیکی هستند و به تدریج از سال 1994 به وسیلهء سه نوع شرکت اینترنتی به وجود آمدند.
این شرکتها که نقش اساسی در توزیع زنجیرهء اطلاعاتی برای کاربر ایفا میکنند به شرح زیر میباشند: الف.
تولیدکنندگان خدمات اینترنتی(10) ب.
سایتهای جستجو(11) ج.
تولیدکنندگان مرورگر(12) سایت «اکسایت»(13) نمونهای که از یک سایت پورتال موفق است(1).
4.
توسعه و تکامل فناوری جستجو همهء ما تکامل زندگی بشر بر روی کره خاکی را به خاطر داریم.
همانطور که همگی ما میدانیم، شکلهای مختلف زندگی سلولی برای مدتهای بسیار طولانی قبل از تکامل زیستی وجود داشته است.
در هر صورت هنگامی که به این نقطه از تکامل دست یافتیم، تغییرات به فرم سازمانیافتهء آن در مدت زمان کمتری به انجام رسید.
همین مطلب برای فناوری جستجوی وب نیز صادق است.
با تاکید بر روی پورتالیزیشن و تجارت الکترونیکی، اولین نسل سایتهای جستجو، عملاً و به تدریج فراموش شدند و این در حالی است که آنها تا سالهای متمادی، حکومت اصلی را به عهده داشتند؛ اما بدلیل این که نتوانستند خودشان را با تغییرات محیطی وفق بدهند، فراموش گردیدند و انواع جدیدی از تولیدکنندگان جستجو به بهرهبرداری رسیدند.
4 .1.
موتورهای جستجوی ماورا موتورهای جستجوی ماورا(14) به کاربر این امکان را میدهند که از میان موتورهای جستجوی متعدد و راهنماهای وب به طور مقارن و همزمان، جستجو نماید (2و3).
محبوبترین موتورهای جستجوی ماورا به شرح زیر میباشند: - Dogpile ( www.dogpile.com ) - Mamma ( www.mamma.com ) - 2Q ( www.2q.com ) - Infind ( www.infind.com ) - Insleuth ( www.isleuth.com ) - Surfy ( www.surfy.com ) - Webtaxi ( www.webtaxi.com ) 4 .2.
نسل اول موتورهای جستجو که توسط سایتهای وب بصورت«اسپایدر», نمایهسازی را ایجاد کردند، انبوهی از واژهها و کلمات را تجزیه و تحلیل نمودند.
راهنماهای وب به طور دستی گردآوری شدند و از آوریل 1998 مورد بهرهبرداری قرار گرفتند: یکی از این راهنماها به نام «دایرکت هیل»(15)یک حرکت ریشه ای را آغاز کرد و اصلاحاتی انجام داد و روش خود را «راه سوم»(16) نامید.
این راهنمای وب ادعا میکرد که در زمان جستجو، کنترل با کاربر است و نتایج به صورت طبقهبندی شده بر روی سایت وب نمایان میشوند.
این موتور جستجو، آنچنان که ادعا میکرد نتوانست خدمات منحصربهفردی را ارائه نماید.
بنابراین موتور جستجوی دیگری به نام «هاتبات»(17)به جای آن تولید شد (2).
4 .3.
جستجوی زبان طبیعی همانطور که قبلا بحث شد، اولین نسل موتورهای جستجو با مقابلهء واژههایی که توسط کاربران ارائه میشدند عمل مینمودند.
آنها به محتوای واژههای جستجو توجه نمی کردند.
برای مثال به ارتباط منطقی بین واژههای جستجو و دیگر معناهای لغوی توجه نمیشد، به علاوه، لغات را به صورت تحتاللفظی جستجو میکردند و به واژهها و توصیفگرهایبولی نظیر and, or, not توجه نداشتند.
دو موتور جستجوی جدید یکی پس از دیگری در طول یک هفته آغاز به کار کردند.
این موتورهای جستجو، به شرح زیر زبان طبیعی را برای جستجو پیشنهاد کردند: الف.Ask Jeeves www.askjeeves.com این موتور جستجو در اول ژوئن سال 1998 شروع به کار کرد و به عنوان اولین موتور جستجوی زبان طبیعی بر روی اینترنت معرفی شد.
این موتور جستجو سوءال کاربر را با استفاده از پایگاه اطلاعات هفت میلیونی سوءالات، پاسخ میداد.
اگر هیچ گونه مقایسهای وجود نداشت، سپس نزدیکترین واژه از پایگاه برای کاربر ارائه میشد و سوءال میشد که مناسبترین آن را انتخاب کند.
این موتور جستجو همچنین کاربر را به موتورهای جستجوی دیگری نیز راهنمایی میکند، مانند «یاهو»، «لیکاس», «اینفوسیک» و «آلتاویستا».
ب.
دومین موتور جستجو به نام Electric Monk چند هفته بعد آغاز به کارکرد.
این موتور جستجو با استفاده از زبان طبیعی، الگوریتم سوءالات کاربران را پاسخ میگوید.
این الگوریتم با استفاده از اصطلاحنامه، به واژههای مرتبط نیز توجه میکند.
جستجو از طریق زبان طبیعی در این موتور جستجوگر، سپس به صورت سوءالات مرکّب بولی درآمد و به «آلتاویستا» تسلیم شد.
4 .4.
تجزیه و تحلیل متکی بر اتصال موتورهای جستجوی نسل اول برای ساخت نمایههای عظیم با هدف پاسخگویی به هر نوع سوال ساخته شدند.
آنها به محتوای هر صفحهء خاص تأکید داشتند که چگونه این صفحات به هم مربوط میشوند و اتصال مییابند.
همانطور که قبلا گفته شد، روش نمایهسازی آنها به دلیل بیتوجهی به ترکیب زبان، ساخت جملات و مترادفها با شکست روبرو شد.
تجزیه و تحلیل متکی بر اتصال سعی دارد که با بررسی ارتباط بین صفحات، بر این مشکلات فائق آید.
موتورهای جستجوگر متکی بر اتصال به سرعت رشدکردهاند و از نظر کاربران اینترنت در حال حاضر از محبوبیت خاصی برخوردارند.
4.4.1.«گوگل»(18) این موتور جستجوگر نیز مانند «یاهو» توسط دانشجویان دانشگاه استانفورد ایجاد شد این فناوری با استفاده از روشی با نام «رتبهبندی صفحه»(19) وب، به دیگر موتورهای جستجو متصل میشود.
اگر شما، به عنوان یک نویسندهء سایت وب، به دیگر سایتهای وب از جهت اهمیت آن سایتها متصل شوید، می توانید داوریها و پیشنهادهایی دربارهء سایت ارائه دهید.
همانطور که راهنماهای وب نظیر «یاهو» توسط ویراستاران به صورت دستی جمعآوری و تالیف گردیدهاند.
«گوگل» هم به دنبال اعلام قضاوت میلیونها نویسندهء سایت وب به صورت خودکار طراحی شد.
البته این موتور جستجو در مقایسه با «یاهو» با سایتهای وب بیشتری دسترسی دارد.
در حقیقت برخلاف دیگر موتورهای جستجوگر، که هر چه نمایههای آنها گستردهتر میشود، کمتر مفید واقع میشوند، «گوگل» ادعا دارد که با گستردگی نمایهها و عظیمتر شدن آنها، به نتایج بهتری دست یافته است.
از دیگر موتورهای جستجو که با استفاده از الگوریتم طبقهبندی عمل مینمایند میتوان از«هاتبات» و «اکسایت» نام برد.
«گوگل» تنها موتور جستجویی است که به طور بسیار گسترده ای جستجوهایش متکی بر اتصال میباشند.
تخمین زده شده که نمایهء این موتور جستجوگر بین 70 تا 100 میلیون صفحه میباشد، اما از طریق اتصال، قدرت دسترسی به بیش از 300 میلیون صفحهء وب نیز به کاربر اینترنت داده میشود.
دسترسی بیشتر و صحت نتایج جستجوی بیشتر سبب گردیده که این موتور جستجو در ردیف ده موتور جستجوی محبوب در شبکهء اینترنت قرار گیرد.
4.4.2.
(20)Clever با توجه به «نمایهنامهء استنادی علوم»(21) (مطالعهء ارجاعی مقالات علمی با یکدیگر) clever جستجوی واژههای کلیدی را براساس تلفیق کلمات و ارتباط مطالب بررسی مینماید.
این موتور جستجوگر نیز مانند «گوگل» با استفاده از اتصال، به سوءالات پاسخ میدهد.
ولی برخلاف «گوگل» ابتدا سوءال را به دیگر موتورهای جستجو نظیر «آلتاویستا» تسلیم میکند و سپس کاربر را به صفحاتی که از نتایج جستجو کسب شدهاند راهنمایی مینماید.
این موتور جستجو توسط شرکت «آیبیام» ایجاد شده.
4.4.3.
Focused Crawler یکی دیگر از موتورهای جستجویی که توسط شرکت،« آیبیام» ایجاد شده.
این موتور جستجو البته به اندازهء clever گسترش پیدا نکرد.
برخلاف دیگر موتورهای جستجو نظیر «گوگل» و clever، این موتور جستجو مجموعهای بسیار مناسب و در ارتباط با موضوع را از طریق وب جستجو مینماید.
به زبانی دیگر، این موتور جستجو فقط سایتهای وبی را جستجو میکند که در ارتباط با پرسش کاربر میباشند.
جستجوی گروههای خبری در حالی که در حال حاضر وب به مثابه مخزن اولیهء دانش بشری بر روی اینترنت میباشد، تنها مخزن هم به حساب نمیآید.
گروههای خبری، محلی است که گروهی از افراد، تجربیات، افکار و دانش خود را در مورد یک موضوع مورد علاقه، برای بازیابی اطلاعات به اشتراک میگذارند.
تفاوت بین وب و گروههای خبری در این است که وب مجموعهای از دانش بشری را به طور صریح و روشن ارائه میکند.
در حالی که گروههای خبری مجموعهای از دانش بشری را به طور ضمنی و غیرصریح ارائه مینمایند.
دانش صریح و روشن میتواند به افراد و موءسسات کمک کند تا از اطلاعات و تجارب گذشته برای برنامهریزی آینده کمک بگیرند، اما دانش غیرصریح و ضمنی مجموعهای از تجارب و عقاید و خلاقیتهایی است که برای استخراج اطلاعات صریح و روشن مورد نیاز میباشد.
آدرس بعضی از گروه های خبری تخصصی: DejaNews ( www.dejanews.com ) Reference.com ( www.reference.com ) Liszt’s New groups directory ( http://liszt.com/news ) 4.4.4.
اطلاعات شرکتها سایتهای زیادی دربارهء معرفی شرکتها و تولیدکنندگان اطلاعات تجاری وجود دارند.
هر محققی میتواند از این سایتها بازدید کند.
چنین سایتهایی دارای پایگاههای تجاری میباشند.
یک بررسی بر روی نامهای شرکتها براساس عملکرد موتورهای جستجوگر پیشرو و راهنماهای وب برای انتقال نتایج مناسب برای پژوهشگراننشاندادکه «سراچ انجین واچ»(22)و«هاتبات» و «گوگل» در ردهبندی، در ردههای ابتدایی قرار میگیرند.
در آگوست 1999، موتور جستجوگر «جامپ»(23) آغاز به کار نمود.
این موتور جستجوگر دارای یک نمایهء تخصصی است که بر اطلاعات و خبرهای مربوط به شرکتها تأکید دارد.
این موتور جستجوگر فهرستی از شرکتها، شامل اطلاعاتی نظیر عناوین شرکتها، قدمت، زمینهء موضوعی و آدرس پست الکترونیکی و ثبت اختراعات، و شرکتهای وابسته به آن شرکت را نیز معرفی مینماید (2و3).
4.4.5.
فایلهای تصویری و چندرسانه ای تقریباً 70 درصد از صفحات وب غیرمتنی هستند.
آنچه مسلم است کاربرد, مفاهیم را به همراه تصاویر بهتر از اطلاعات فقط به صورت متنی درک مینماید.
سه موتور جستجوی تخصصی اصلی که فایلهای تصویری و چندرسانهای را ارائه میدهند، در این زمینه به شرح زیر میباشند.
Ditto ( www.ditto.com ) Scour ( www.scour.net ) Altavista photo finder( www.altavista.com ) مقایسهء ابزارهای جستجو در اینترنت این روزها اینترنت منبع اصلی تهیهء منابع اطلاعاتی شناخته شده است.
ابزارهای مهمی برای کمک به یافتن اطلاعات در این فضای اطلاعاتی وجود دارند.
راهنماها و موتورهای جستجوگر پایگاههای اطلاعاتی هستند که به روند دریافت اطلاعات سرعت میبخشند.
این ابزارها اسناد را با استفاده از زبان علامتگذاری ابرمتن(24) جمعآوری، ذخیره و تنظیم مینمایند.
قبل از ظهور اینترنت اکثر پایگاههای اطلاعاتی کتابشناختی نقش اصلی را در بازیابی اطلاعات ایفا میکردند.
با توسعهء نرمافزارهای جستجو، اطلاعات علمی به راحتی قابل دستیابی شدند.
تعداد ابزارهای جستجو در اینترنت به طور مداوم در حال رشد است.
در این مقاله تعداد ده ابزار جستجو در اینترنت از قبیل راهنماها و موتورهای جستجوگر براساس تعداد صفحات اتصال، انتخاب شدهاند.
جدول یک: ردهبندی موتورهای جستجوگر و راهنماها براساس تعداد صفحات اتصال به آنها معیارهای ارزیابی شامل جمعآوری اطلاعات و تجزیه و تحلیل اسناد و بازیابی اطلاعات بوده است.
جدول 2.
مقایسهء ابزارهای جستجو و راهنماها در زمینه جمعآوری اطلاعات و تجزیه و تحلیل اسناد نتایج ارزیابی ابزارهای جستجوی اینترنت با توجه به معیارهای اصلی بازیابی اطلاعات در جدول یک نشان داده شده است.
شش معیار برای ارزیابی وجود دارد و حداکثر نمره 6 میباشد.
تقریبا همهء ابزارهای جستجو چهار معیار اصلی را دارند.
غیر از Nerd world که از شش عملگر منطقی بولی فقط از OR استفاده می نماید,و «یاهو» که عملگر پرانتز را قبول نمی کند, اختلافات دیگری نیز وجود دارند.
«اینفوسیک» از عملکرد ستاره (*) استفاده نمیکند و «لیکاس» و «وب کراولر» سیستم را ملزم میکنند که ستاره را به عنوان اولین حروف کلمات در جستجو استفاده نماید.
تنها ابزارهای جستجوی اینترنت که جستجوی کاملی را ارائه می دهند «لیکاس» و «اینفوسیک» هستند.
با توجه به جستجو براساس طبقهبندی موضوعی، فقط دو راهنما یا دایرکتوری «یاهو» و Ned world همهء صفحاتشان طبقهبندی و دستهبندی شده است.
و Northern light تنها موتور جستجوگر میباشد که اجازهء جستجو براساس طبقهبندی را نمی دهد (2).
در «نورثرن لایت» این امکان وجود دارد که به وسیلهء نواحی (25)، جستجو انجام شود.
در دیگر موتورهای جستجوگر این امکان کمتر وجود دارد.
با توجه به جدول شماره 3، «نورثرن لایت» از تعداد 9 ناحیه شش ناحیه شامل: عنوان, نشانی، «یوآراِل», کشور، زبان، تاریخ، و نوع سازمان را جستجو مینماید.
ردهبندی ابزارهای جستجوگر با توجه به تعداد نواحی قابل جستجو به ترتیب به شرح زیر میباشد: (تاریخ، زبان, نشانی «یوآراِل»، عنوان) Altavista (تاریخ، نشانی «یورآراِل»، عنوان) Yahoo (زبان، نشانی «یوآراِل», عنوان) Lycos (کشور, نشانی «یوآراِل»، عنوان) Info seek (منطقهء جغرافیایی، تاریخ، زبان) Hotpot (نوع سازمان، زبان) Excite و بالاخره سه ابزار جستجوی باقیمانده یعنی Web Crawler, Nerd world and Aolnet find امکان جستجو از طریق نواحی را ارائه نمیدهند.
در اینجا باید توجه کرد مهمترین نواحی مورد توجه در ارتباط با جستجو، عنوان، «نشانی» یوآراِل, و زبان میباشند.
هیچ اختلافی در میان موتورهای جستجوگر و راهنماها در مورد استفاده از ناحیه وجود ندارد.
از تعداد دو راهنما در این مقاله، «یاهو» پنج ناحیهء قابل جستجو را پیشنهاد میکند و «نِرد وُرلد» هیچ ناحیهای را پیشنهاد نمینماید.
ضمنا دیگر موتورهای جستجوگر نیز در مورد استفاده از نواحی ناهمگون هستند.
با توجه به قابلیت مرور(26) و نظراندازی، موتورهای جستجوگر به شرح زیر امکان مرور و نظراندازی را ارائه میدهند.
«اکسایت»، «لیکاس»، «آلتاویستا», «هاتبات»، «نورثرن لایت».
به موتورهایجستجوگر نظیر «نورترون لایت» و «آلتاویستا» امکان استفاده از ناحیهء کشوری را ارائه میدهند.
سهابزار جستجوکهقادرند دستورها(27) رابه کارببرند شامل «آلتاویستا», «هاتبات» و «اینفوسیک» میباشند.
این سه موتور جستجوگر پس از جستجوی یککلمهای، فهرستی از واژههای ترکیبی را برای راهنماییهای بعدی و گسترش ارائه میدهند.
جدول شماره 4 ردهبندی ابزارهای جستجو در اینترنت و راهنماهای وب را براساس نمرههای آنها نشان میدهد.
«نورثرن لایت» با کسب بالاترین نمره یعنی نمره 13 در بالاترین رده، و «نردورلد» با کسب نمره 2 در پایینترین رده قرار دارند.
تعدادزیادی از نمرهها نیزبین 5/11-5/10 هستند و به شرح زیر میباشند: «آلتاویستا»،«لیکاس»،«اکسایت»,«انیفوسیک» و«هاتبات».
درجهبندی موتورهای جستجوگر نتیجهگیری مهمترین نتیجهء قابل توجه این است که هیچ ارتباطی بین محبوبیت و قابلیت جستجوی اطلاعات در میان ابزارهای جستجوی مورد مطالعه وجود ندارد.
دو مثال واضح از این یافتهها «نورثرن لایت» و «یاهو» میباشند.
اگر چه «نورثرن لایت» کمترین شهرت و محبوبیت را در ردهبندی از نظر اتصال دارا میباشد، این موتور جستجوگر اولین مقام را در ردهبندی از نظر امکانات و قابلیتهای بازیابی اطلاعات کسب نموده است.
در حالی که «یاهو» یکی از محبوبترین ابزارهای جستجو میباشد، ولی از نظر بازیابی اطلاعات، در ردهء پایینی قرار دارد.
این بررسی تفاوت عمدهای را بین موتورهای جستجوگر یا راهنماهای وب نشان نداد.
در جمعآوری اطلاعات و تجزیه و تحلیل اسناد، راهنماها قابل اعتمادترند، زیرا سیستمهای دستی استفاده میکنند.
موتورهایجستجوگر نیز به دلیلاستفاده از دستورهای(28) زبان علامتگذاری فوقمتن یا ابرمتنها(29) اهمیت دارند.
هرچند روشن نیست که نتایج قابلتوجهی را ارائه دهند.
اگرچهراهنماهاوموتورهایجستجوگر پایگاههایی هستند که صفحات زبان علامتگذاری فوقمتن را فهرست میکنند، از نقطه نظر بازیابی اطلاعات، با توجه به دلایل زیر نسبت به پایگاههای اطلاعاتی کتابشناسی معمولی دارای امکانات کمتری هستند.
- تعدادی از ابزارهای جستجو تمامی امکانات موجود در پایگاههای اطلاعاتی کتابشناختی معمولی را ندارند.
- محدود نمودن بازیابی به وسیله نواحی، چندان در ابزارهای جستجو در اینترنت رایج نیست.
- محققین سوءالاتی دربارهء نواحی عنوان نشانی که به یک صفحهء وب، یا هر منبعی بر روی وب جهانی و به طور کلی اینترنت اشاره میکند دارند، که تنها در نیمی از ابزارهای جستجو در اینترنت یافت میشوند.
نه راهنماها که اطلاعات را از طریق پرسشنامههای واگذار شده کسب مینمایند و نه موتورهای جستجوگر که از صفحات زبان علامتگذاری فوقمتن استفاده میکنند، در جستجوهایشان از نواحی استفاده نمیکنند.
- مرور نمایهنامهها یک شکل معمول و رایج نیست.
- استفاده از معانی لغات کنترل شده در ابزارهای جستجوی اینترنت کاربردی ندارد (2و3).
پینوشتها 1-Script 2-Java common Gateway Interface (Jave Cgi) 3-Search Engines 4-Script 5-Spiders 6-URL (Uniform Resource Locator) 7-Direct hill 8-Google Real Names Index 9-Portal 10-Intetnet Service/Access Providers 11-Search Sites 12-Browser Providers Ultra Search Engines 13-www.excite.com 14-Ultra Search Engines 15-www.directhil.com 16-The Third way 17-Hotbot 18-www.google.com 19-Page Rank 20-www.almaden.ibm/cs/k53/clever.htm/ 21-Science Citation Index 22-Search Engine Watch 23-Jump 24-Hrml (Hypet text Mark up language) 25-Fields 26-Browsing 27-Meta tags 28-Meta Tags 29-hyprtext Mark up Language صفحات وب دینامیکصفحات وب استاتیکتوسط رایانه تولید میشونددستی تولید میشوند.اطلاعات منحصربهفرد استاطلاعات عام و کلی استقابل نمایهسازی نمیباشنداکثر آنها قابل نمایهسازی هستند تعداد صفحات اتصال به آنهانام موتورهای جستجوگر و راهنماها1110599Yahoo458239Excite437618Lycos436184Webcrawler356963Info seek350085Altavista238668Hotpot34229Nerd world16192Alone find15780Northern light واگذاری به صورت دستیواگذاری به صورت دستیواگذاری به صورت دستیواگذاری به صورت دستیواگذاری به صورت دستیواگذاری به صورت دستیواگذاری به صورتخودکارواگذاری به صورتخودکارابزارهایجستجو در اینترنتزبانکشورشرح و توصیفنشانی URLعنوانطبقه بندی موضوعیبدون Metatagدارای Metatagابزارهایجستجو در اینترنت××××Yahoo××××Excite×Lycos××××Webcrawler×××Info seek×Altavista×Hotpot××××Nerd world؟؟Aolnet find×Northern light نمرهابزارهای جستجو13Northern light5/11Altavista11Lycos5/10Excite5/10Info seek5/10Hotpot9Yahoo6Webcrawler5/5Aolnetfind2Nerdworld