اطلاع یابی در اینترنت : نیاز جوامع اطلاعاتی امروز
ظهور اینترنت و سپس رشد و گسترش روز افزون « شبکه جهانی وب » فرصتها و چالشهای نوینی را در فرایند اطلاع یابی پدید آورد .
امکان جستجو و دسترسی به حجم زیادی از اطلاعات از طریق اینترنت ، فعالیت های آموزشی ، تحقیقاتی ، تجاری و ..
را تحت تاثیر خود قرار داده است مشکل اصلی فرایند اطلاع یابی در اینترنت بازیابی حجم کم از اطلاعات ومنابع اطلاعاتی نیست ، بلکه مشکل جدیدی تحت عنوان «بازیابی بیش از حد اطلاعات » پدید آمده است در گذشته کاربران نهایی نیاز کمتری به فراگیری مهارتهای اطلاع یابی داشتند و اغلب از متخصصان اطلاع رسانی برای دسترسی به اطلاعات کمک می گرفتند ، اما امروزه باید بدون حضور یک واسط انسانی و داشتن دانش کافی درباره اصول و مهارتهای جستجو و بازیابی اطلاعات به کاوش در اینترنت بپردازند .
بتدریج ، با گسترش خدمات در شبکه جهانی وب ، فراگیری اصول و مهارتهای اطلاع یابی برای جستجو گران مهم وحیاتی شد.
ظهور در اینترنت و سپس رشد و گسترش روز افزون «شبکه جهانی وب » تغییر و تحول شگرفی در فرایند اطلاع یابی به وجود آورد و باعث شد که تعداد بسیار زیادی از استفاده کنندگان برای اولین بار از خانه یا محل کار خود به تنهایی از طریق کامپیوتر شخصی ، امکان جستجو و دسترسی به حجم زیادی از اطلاعات را پیدا کنند از یک طرف ، استفاده از محیط گرافیکی شبکه جهانی وب ، بسیار جذاب وساده به نظر می رسید واز سوی دیگر ، قیمت کامپیوتر های شخصی وهزینه اتصال به اینترنت دائما کاهش یافت .
همین امر باعث شد تا بسیاری از افراد بتوانند جستجوی اطلاعات در این محیط دیجیتالی را تجزیه کنند .
به این ترتیب ، برخلاف گذشته که استفاده کنندگان ،نیاز کمتری به فراگیری مهارتهای اطلاع یابی در خود احساس می کردند از این رو سواد اطلاعاتی که مجموعه ای از تواناییها و مهارتها برای جستجو ، ارزیابی واستفاده موثر از اطلاعات است .
به یکی از مهم ترین عناصر اطلاع یابی در اینترنت مبدل شده است .
رشد فزاینده ی اطلاعات واستفاده کنندگان از وب :
شبکه جهانی وب در اوایل دهه ی 1990 در آزمایشگاه فیزیک ذرات اروپا واقع در سوئیس توسط تیم برنیرزلی اختراع شد .
این شبکه پس از گذشت چند سال ، رشد و گسترش شتابناکی به خود گرفت و به عنوان یکی از مهم ترین رسانه های قرن بیستم مطرح شد .
همراه با افزایش حجم اطلاعات قابل دسترس از طریق این محیط ، تعداد استفاده کنندگان آن نیز به طور فزاینده ای زیاد شد ، به طوری که بر آورده شده است تا ماه مارس 2001 حدود 430 میلیون نفر در سراسر جهان به اینترنت متصل بودند .
رشد تعداد سایت های وب نیز بسیار شگفت اور ارزیابی می شود بررسیهای آماری نشان می دهد که در ژوئن 1993 تنها 130 سایت وب قابل دسترسی بودند وپس از گذشت دو سال یعنی ژوئن 1995 این تعداد به 23500 سایت وب رسید .
مطالعات دیگر نمایانگر آن است که در خلال سالهای 1997 لغایت 2000 تعداد سایت های وب تقریبا سه برابر شده است طبق طرح مطالعاتی « اندازه گیری اینترنت » تعداد صفحات وب تا دهم جولای 2000 در حدود 1/2 میلیارد بر آورد شده بود این مطالعه هم چنین نشان می دهد که روزانه بیش از 7 میلیون صفحه جدید به شبکه وب افزوده می شود .
به این ترتیب ، پیش بینی می شود که تا اوایل سال 2001 حجم اطلاعات موجود در محیط وب دو برابر شده واز مرز 2/4 میلیارد صفحه بگذرد
به این ترتیب ، پیش بینی می شود که تا اوایل سال 2001 حجم اطلاعات موجود در محیط وب دو برابر شده واز مرز 2/4 میلیارد صفحه بگذرد .
سیر تحول تاریخی ابزارهای کاوش اینترنت : شبکه جهانی اینترنت در اواخر دهه 1960 پا به عرصه ظهور گذاشت اما تا سال 1990 ابزای برای کاوش اطلاعات موجود در آن وجود نداشت با مروری اجمالی بر تاریخچه ابزارهای کاوش اینترنت می توان دریافت که تقریبا کلیه پیشرفتها در این زمینه توسط دانشجویان وطرحهای پژوهشی آنها صورت گرفته است در سال 1990 اولین ابزار کاوش اینترنت توسط آلان را متیچ در دانشگاه مک گیل تحت عنوان آرکی توسعه یافت .
وی ابتدا قصد داشت اسم این ابزار کاوش را آرکا یوز بگذارد اما بعد به دلیل مطابقت با استاندارد یونیکس از مخفف آن یعنی آرکی استفاده کرد.
آرکی از طریق نمایه سازی فایل های موجود در سایت های FTP یا پروتکل انتقال فایل امکان جستجو و بازیابی فایل ها در محیط اینترنت را برای کاربران فراهم می ساخت به تعبیر دیگر این ابزار کاوش تنها می توانست فایل های اینترنتی نه متن واسناد موجود در اینترنت را بازیابی کند .
در سال 1993 دردانشگاه نوادا برای بازیابی اسناد و متون وسرورهای گوفر نظامی مشابه آرکی طرحی شد که ورونیکا نام داشت در واقع ،ورونیکا برا ی اولین بار امکان جستجو و بازیابی متن واسناد ساده ( بدون تصویر یا پیوندهای فرامتنی ) را در اینترنت فراهم کرد .
یکی دیگر از ابزارهای کاوش مشابه و ورونیکا برای جستجو در سرورهای گوفر ، جاگ هد نام داشت .
در واقع می توان گفت که آرکی و ورونیکا پدر ومادر همه ابزارهای کاوش امروزی به شمار می آیند کمی قبل از ارائه ورونیکا یعنی در سال 1992 تیم برنرزلی در آزمایشگاه فیزیک ذرات اروپا محیطی گرافیکی و فرامتنی مبتنی بر اینترنت ، تحت عنوان شبکه جهانی وب را اختراع کرد .
یکی از ویژگی های این محیط توانایی ارائه اطلاعات چندرسانه ای ونیز استفاده ازنظام فرامتنی برای ایجاد ارتباط با دیگر صفحات مرتبط بود .
پس از گذشت یک سال از ظهور شبکه جهانی وب دو ابزار کاوش برای جستجوی اطلاعات درمحیط وب توسعه یافتند که عبارت بودند از الی وب ورلدواید وب واندرر ورلد واید وب واندرر که توسط ماتئو گری در دانشگاه MIT توسعه یافت از روبات هایا به تعبیر دیگر برنامه های کامپیوتری برای جستجو ونمایه سازی صفحات وب استفاده می کرد به این ترتیب ، اولین موتور کاوش وب مبتنی برنمایه سازی خود کار وماشینی پایه عرصه ظهور گذاشت و اولین پایگاه یا نمایه موتور کاوش تحت عنوان وندکس شکل گرفت .
الی وب به جای بکارگیری روبات ها از شیوه دیگری برای نمایه سازی سایت های وب یعنی فرستادن اطلاعات سایت ها توسط خودطراحان آنها استفاده کرد به این ترتیب افراد می توانستند خود به توصیف محتوای سایت های وب بپردازند و در فرایند نمایه سازی اطلاعات در اینترنت نقش فعالی داشته باشند در اوایل سال 1994 دو دانشجوی دوره دکتری مهندسی برق دانشگاه اسنانفورد به نامهای دیود فیلو و جری یانگ فهرستی از سایت های وب مورد علاقه و منتخب را تهیه و در محیط وب ارائه کردند سپس به منظور جستجو در پایگاه اطلاعاتی گرد آوری شده از سایت ها ، نرم افزار کاوشی به آن افزودند و آن را ( WWW.
yahoo!
.COM) yahoo!
نام نهادند پس ازمدتی حجم اطلاعات موجود در yahoo!
افزایش یافت و روزانه هزاران نفر به آن مراجعه کردند امروزه yahoo!
یکی از رایج ترین و عامه پسیند ترین ابزارهای کاوش اینترنت محسوب می شود که روزانه دهها میلیون جستجو از طریق آن صورت می گیرد .
دراوایل 1994 اولین ابزار کاوش با قابلیت نمایه سازی کلیه واژه های متن کامل صفحات وب توسط دانشگاه واشنگتن تحت عنوان ( www.
Crawler .
com ) web crawler در دسترسی قرار گرفت روبات این ابزار کاوش برخلاف روبات های قبلی که تنها عنوان ، نشانی دسترسی سایت یا 100 کلمه اول موجود درمنابع اینترنت را در پایگاه خود نمایه می کردند قادر بود صفحات وب را به صورت تمام متن نمایه کند به این ترتیب امکان جستجو در متن کامل صفحات وب فراهم شد در سال 1994 موتورهای کاوش دیگری ابداع شدند که هم از نظر بازیابی اطلاعات وهم ازنظر پوشش منابع در شبکه جهانی وب ، قابلیتها وامکانات بهتری داشتند مانند ( www.
Open text .
com ) open text , ( www .
infoseek .
com ) In fosee K( www.
Lycons .
com) lycons رقابت برسرطراحی و توسعه ابزارهای کاوش اینترنت بتدریج واردعصر تازه ای شد وهم اینک نیز شاهد این رقابت در قابلیتهای بازیابی اطلاعات وحجم اطلاعات نمایه شده در پایگاه ابزارهای کاوش هستیم .
در دسامبر 1995 ( WWW.Altavista .
com ) Altavista به عنوان یکی از شناخته شده ترین موتورهای کاوش ظهور پیدا کرد و به دلیل ویژگیها ونو آوریهایی که در آن پیش بینی شده بود به سرعت به عنوان یکی از بهترین ابزارهای کاوش اینترنت مطرح شد به طوری که توانایی انجام روزانه میلیونها جستجو را بدون کاهش سرعت بازیابی اطلاعات به همراه داشت Altavista اولین موتور کاوشی بود که از زبان طبیعی ( مانند جستجوی جمله آب و هوای تهران چطور است ؟
) و عملکردهای بول برای بازیابی اطلاعات در محیط وب استفاده کرد .
در ماه می 1996 ( www.
Hotbot.
Com ) HotBot به عنوان یکی دیگر از ابزارهای کاوش مهم ابداع شد که روبات آن قادر بود روزانه حدود 10 میلیون صفحه در محیط وب را درپایگاه خود نمایه کند برخی از طراحان ابزارهای کاوش به دنبال انجام جستجوهای جامعتر بودند .
وبه این ترتیب در سال 1995 اولین ابر موتور کاوش توسط اریک سلبرگ ، تحت عنوان ( www.
Metacrawler .
com ) Metacrawler ظهور پیدا کرد .
این ابر موتور کاوش می توانست در پایگاه شش موتور کاوش وراهنمای موضوعی به طور همزمان به جستجو بپردازد .
در اواخر سال 1997 یکی از بزرگترین و مهم ترین ابزارهای کاوش امروزی یعنی موتور کاوش ( www.
Google .
com ) Google از طریق طرح تحقیقاتی دانشگاه استانفورد ظهور یافت .
Google تلاش کرد که در نظام رتبه بندی نتایج کاوش خود مبتنی بر میزان ارتباط آنها با کلیه واژه های جستجو ، تحول اساسی به وجود آورد که از طریق استفاده از معیار میزان استناد به یک صفحه یا سایت مشخص توسط سایت های دیگر صورت میگیرد.
همراه با رشد افزون اطلاعات در محیط اینترنت ، تعداد ابزارهای کاوش نیز به طور فزاینده ای افزایش یافت به طوری که تاژوئن 2001 یکی ازراهنماهای ابزارهای کاوش اینترنت به نام Serch Enginc Guide مدعی است 2500 موتور کاوش و راهنمای موضوعی در زمینه های موضوعی مختلف را در پایگاه خود نمایه کرده است .
جستجو در شبکه جهانی وب : چالشها و فرصتها درحال حاضر ، میلیونها نفر در سراسرجهان درباره قابلیتها وامکانات شبکه جهانی وب صحبت می کنند وتعداد زیاد دیگری علاقه دارند جستجوی اطلاعات در این محیط راهر چه زودتر تجربه کنند حال سوال اینجاست هنگامی که ما ممکن است در پیدا کردن یک « فایل » که چند ماه قبل در کامپیوتر شخصی خود ذخیره کردیم ، با مشکل مواجه شویم و زمان نسبتا زیادی را صرف پیدا کردن آن کنیم ، چگونه خواهیم توانست در میان « چند میلیارد صفحه وب » که بدون هیچ ساختار نظامند و منطقی درمحیط وب قرار گرفته اند اطلاعات مورد نظر خود را شناسایی کنیم به آنها دست یابیم ؟
آیا راهکارهای مناسبی برای جستجو ومرور اطلاعات در این حجم فزاینده از اطلاعات وجوددارد؟
آیا ابزارها و امکانات موجود برای جستجو و بازیابی اطلاعات از جامعیت و دقت لازم برخوردارند؟
آیا می توان فرایند اطلاع یابی در اینترنت را مانند پایگاههای اطلاعاتی سنتی تحت کنترل در آورد و به نتایج مطلوب دست یافت ؟
پاسخ به سوالاتی از این قبیل ، به طور مستقیم یا غیر مستقیم با ابزارهای و امکاناتی تحت عنوان « ابزارهای کاوش اینترنت » ارتباط دارد که به عنوان تنها فناوری حال حاضر برای رویارویی با حجم فزاینده ای از اطلاعات دیجیتال ودسترسی به محتوای آنهامطرح هستند .
شبکه وحشی وب یا شبکه جهانی انتظار : متخصصان کتابداری واطلاع رسانی ، سالهای متمادی تلاش کردند برای سازماندهی اطلاعات یک نظام منطقی راتوسعه دهند ، تابه این ترتیب بتوان به طور مناسب و کار آمد به اطلاعات مورد نظر دست یافت از این رو ، نظامهای رده بندی ( مانند دیویی و کنگره ) در بسیاری از کتابخانه ها مورد استفاده قرار گرفتند و بشر توانست انواع اطلاعات را تحت کنترل خوددر آورد با رشد فزاینده اطلاعات سازماندهی نشده در وب چالشهای جدیدی برای دسترسی مناسب و کار آمد به منابع اطلاعاتی در این محیط پدید آمده است .
درمحیط وب ، هیچ استاندارد مشخصی ( مانند فهرست نویسی ، رده بندی کنترل کتابشناختی و کنترل واژگان ) برای ذخیره سازی و بازیابی منطقی اطلاعات نظیر آنچه در دنیای چاپی یا پایگاههای اطلاعاتی سنتی با آنها آشنا هستیم ، وجود ندارد بسیاری از صفحات وب حتی مولف ناشرو تاریخ انتشار ندارند .
فرض کنید در بزرگترین کتابخانه جهان حاوی چند میلیارد صفحه به دنبال اطلاعات هستید که بدون هیچ نظم منطقی روی قفسه های الکترونیکی مجازی یا به عبارت دیگر سایبر اسپیس قرار گرفته اند از طرف دیگر شبکه جهانی وب بر خلاف کتابخانه های چاپی ، یک فهرست پایگاه مرکزی مشخص ثابت و پایدار ندارد وهرکس می تواند هر مطلبی را با هر محتوایی در آن منتشر کند ،بدون آنکه هیچ گونه نظارت کیفی و کمی براطلاعات منتشر شده وجود داشته باشد .
مشکل اساسی ترین این است که صاحبان سایت های وب هیچ گونه الزام و تعهدی برای در دسترس قرار دادن صفحات یا سایت های خود در مدت زمان طولانی ندارد بنابراین سایت یا صفحه وبی که برای مثال ، امروز قابل دسترس بوده است فردا شاید دیگر وجود نداشته باشد .
یکی دیگراز مشکلات محیط وب ، تغییر نشانی سایت ها به منابع است که به دلایل مختلف روی می دهد نشانی دسترسی به صفحات یا سایت های وبی که قبلا به آنها مراجعه کردیم ، بدون هیچ گونه اطلاعی تغییر کند وهیچ مکانیسمی هم برای دسترسی به نشانی جدید پیش بینی نشود این موضوع مانند این است که محل نگهداری یک کتاب در قفسه کتابخانه بدون هیچ اصول منطقی تغییر کند که خود به معنای عدم دسترسی به آن منبع است .
وبا وجود مشکلاتی از این قبیل ، دور از انتظار نیست که برخی از معتقدان شبکه جهانی وب به چنین محیط بی نظم بی ثبات و غیر قابل کنترلی ، عنوان « شبکه وحشی وب » اطلاق می کنند.
واما یکی دیگر از مشکلات دسترسی به اطلاعات از طریق وب بویژه در کشورهای در حال توسعه سرعت پایین خطوط ارتباطی و مخابراتی برای ارسال و دریافت داده ها از طریق اینترنت است شاید شما هم تجربه چند دقیقه منتظر ماندن برای مشاهده یک صفحه ب را داشته باشید .
سرعت پایین اینترنت می تواند بر رفتار اطلاع یابی استفاده کنندگان تاثیرات منفی داشته باشد به طوری که ممکن است اشتیاق جستجو در این محیط را از دست بدهند یا فرایند جستجو را تهیه کاره رها کنند « شبکه جهانی انتظار » عنوانی است که در برخی متون به منظور اشاره به سرعت پایین خطوط اینترنت برای ارسال ودریافت داده ها به کار رفته است وهم اینک نیز کشورهاتا حدود زیادی از آن رنج می برد .
فرصتهای اشاعه و دسترسی به اطلاعات از طریق وب : با وجود محدودیتها و مشکلات اطلاع یابی در وب که به طور مختصر به آنها اشاره شد ، فرصتهای جدیدی نیز برای استفاده کنندگان جهت دستیابی و اشاعه اطلاعات به وجود آمده است .
آرتورسی کلارک نویسنده مشهور داستانهای علمی – تخیلی – در مصاحبه تلویزیونی با شکبه خبری CNN به مناسبت آغاز سال 2000 میلادی توجه مخاطبان را به ظهور یک پدیده اسرار آمیز و شگفت آور در قرن بیستم یعنی در شبکه جهانی وب جلب کرد که درگذشته نه چندان دور هیچ یک از نویسندگان ، حتی تصور آن راهم نمی کردند وی که عمدا از طریق خدمات کنفرانسی و یدوئی مبتنی بر اینترنت در این مصاحبه شرکت کرده بود این موضوع را مورد تاکید قرار داد که شبکه جهانی وب بیشتر وعمیق تر از تصورات نویسندگان داستانهای علمی – تخیلی درباره تسخیر فضا توسط انسان زندگی روزمره ما را تحت تاثیر نفوذ قرار داده است .
شبکه جهانی وب نه تنها فرایند دسترسی به منابع اطلاعاتی را آسان کرده است بلکه فرصتهای جدیدی نیز برای اشاعه و انتشار اطلاعات در اختیارقرار داده است .
درحال حاضر ، هر سازمان یا فردی می تواند دارای سایت و مشخصی باشد واز طریق حجم وسیعی از اطلاعات را در اختیار قرار دهد .
با ظهور خدمات رایگانی که فضای رایگان برای طراحی سایت ها در اختیار می گذارند هر کس بدون پرداخت هزینه می تواند صفحه یا سایت وب شخصی خود را طراحی کند و اطلاعات مورد نظر را در دسترس کلیه افراد در جهان قرار دهد .
موتور کاوش ( www.
Av.
Com ) Alta Vista یکی از شناخته شده ترین و بزرگترین ابزارهای کاوش وب است که در دسامبر سال 1995 ظهور پیدا کرد این موتور کاوش به دلیل ویژگیها ونو آوریهایی که در آن پیش بینی شده بود خیلی زود در میان کاوشگران حرفه ای اینترنت مطرح شد به طوری که امکان انجام روزانه میلیونها جستجو را بدون کاهشی در سرعت بازیابی اطلاعات به همراه داشت .
AV اولین موتور کاوشی بود که برای جستجوی اطلاعات از زبان طبیعی استفاده کرد .
Alta Vista در میان ابزارهای کاوش اصلی همواره چه از لحاظ حجم پایگاه اطلاعاتی و چه از لحاظ قابلیتهای جستجو و بازیابی اطلاعات دررده های اول تا سوم قرار داشته است .
این ابزار کاوش امکانات مناسبی برای جستجوی اطلاعات چند رسانه ای دارد واز جایگاه ویژه ای درکاوشهای جامع و دقیق برخوردار است .
قابلیت های جستجو : Alta Vista را می توان از نظر قابلیتهای جستجو و بازیابی اطلاعات بهترین موتور کاوشی به شمار آورد این موتور کاوش امکان اجرای عملکرد های بول و ریاضی ، جستجوی عبارتی و ترکیبی کوتاه سازی و نزدیک یابی ، جستجو در فیلد های مختلف و محدود کردن فرایند کاوش را به شیوه های مختلف ارائه می دهد .
عملگرهای بول و ریاضی : عملگرهای بول شامل AND NOT , OR , AND باید در بخش جستجوی ساده با حروف بزرگ درج شود اما دربخش جستجوی پیشرفته می توان آنها را با حروف کوچک ( and not , or , and نیر به کاربرد اخیرا می توان عملگر AND را در بخش جستجوی ساده با حروف کوچک یا بزرگ اجرا کرد .
تنها در بخش جستجوی ساده می توان از عملگرهای ریاضی + و – به ترتیب به عنوان عملگرAND,NOT , AND و بهره جست استفاده از پرانتز در هر دو بخش امکان پذیر است در بخش جستجوی پیشرفته می توان از علامت & به جای AND علامت 1 به جای OR و علامت !
به جای AND NOT استفاده کرد برای اجرای کاوشهای دقیق و پیچیده باید از جستجوی پیشرفته استفاده کرد .
موتور کاوش Google موتو رکاوش یکی از جدید ترین ابزارهای کاوش وب است که در دستامبر 1999 در دسترس عموم قرار گرفت با اینکه Google به طورنسبی بسیار زود به عرصه رقابت ابزارهای کاوش اینترنت گام نهاد ولی به سرعت در میان مردم شناخته شد .
این موتور کاوش مبتکر نظامی منحصر بفرد یعنی تجزیه و تحلیل پیوندهای فرامتنی برای رتبه بندی نتایج کاوش است که تحت عنوان link Opularity از آن نام برده می شود ذخیره تصویری از صفحات یا سایت های نمایه شده در پایگاه Google تحت عنوان به کاربران امکان می دهد که صفحات یا سایت های وب را در همان زمانی که توسط روبات آن شناسایی ونمایه شده اند .
مشاهده کنند .
Google اخیرا در رقابتی فشرده با موتور کاوش fast search توانست عنوان بزرگترین موتور کاوش منفرد در محیط وب رابه خود اختصاص می دهد به دلیل واسط جستجوی ساده و بدون گرافیک ونیز استفاده از برنامه بازیابی اطلاعات مناسب ، این موتور کاوش از سرعت بازیابی بالایی برخوردار است .
جستجوی کلیه واژه در عنوان صفحات وب : یکی از مهمترین و کار آمد ترین روشهای دسترسی به اطلاعات در محیط وب جستجوی کلیه واژه ها در عنوان صفحات وب است یکی از پیش فرضهایی که حتی در رسانه های چاپی هم می توان آن را مطرح کرد این است که عنوان یک صفحه وب تا حدود بسیار زیادی می تواندنمایانگر محتوای اطلاعات موجوددرآن باشد با چنین پیش فرض می توان ادعا کرد که جستجوی کلیه واژه های مختلف در عناوین صفحات وب می تواند کاوشگران را به اطلاعات مرتبط در محیط وب هدایت کند .
دربرخی ابزارهای کاوش نظیرNorthern Light کادرجداگانه ای در بخش جستجوی پیشرفته برای بازیابی کلیه واژه ها کلیه واژه ها در عناوین صفحات وب اختصاص داده شده است .
برخی دیگر نظیر MSN Search , Fast Search فهرست انتخاب جداگانه ای برای اجرای این امکان کاوش دارند هم چنین ابزارهای کاوش برای جستجوی کلیه واژه ها در عنوان صفحات وب ، ممکن است دستورات و فرمانهای کاوش متفاوتی را به کارببرد شامل ( fast search ) all in title (Google ) intitle ( Altvista ) title یا ( yahoo ) t جستجوی صفحات وب به زبانهای مختلف ( Language search) اغلب ابزارهای کاوش ، به ویژه در بخش جستجوی پیشرفته خود برای کاوش اطلاعات به زبانهای مختلف ، امکاناتی پیش بینی کرده اند برای نمونه ، در موتورهای کاوش Excite , Altavista , Google به ترتیب امکان انتخاب 28و25و12 زبان مختلف و بازیابی صفحات وب به زبان مورد نظر وجود دارد در این میان موتور کاوش Fast search با تفاوتی فاحش از سایر ابزارهای کاوش امکان محدود کردن فرایند جستجو را از طریق 47 زبان مختلف از چینی ،ژاپنی و کره ای گرفته تا عربی ، یونانی وایتالیایی در اختیار گذاشته است استفاده از این قابلیت بویژه برای آن دسته ازکسانی که با زبان دیگری بجز انگلیسی آشنایی دارند ، از اهمیت وارزش به سزایی برخوردار است به تعبیر دیگر ، از طریق جستجوی صفحات وب به زبانهای مختلف می توان تا حدود بسیار زیادی «موانع زبانی » موجود دسترسی به اطلاعات را از طریق اینترنت از میان برداشت .
جستجو از طریق تاریخ انتشار منابع در وب : اغلب ابزارهای کاوش بویژه در بخش جستجوی پیشرفته خود ، امکان محدود کردن فرایند جستجو را از طریق تاریخ انتشار منابع در وب در اختیار قرار می دهند این قابلیت به کاوشگران اجازه می دهد طیف زمانی مورد نظر خودرا شامل روز، ماه و سال انتخاب کنند وفقط منابع اطلاعاتی منتشر شده در وب را در همان مقطع زمانی بازیابی کنند موتورهای کاوش MSN Search , Alta vista Narthen light از دو کادر جداگانه برای محدود کردن تاریخ منابع استفاده می کنند .
جستجوی رسانه های مختلف در وب ( Media Search) هنگامی که به دنبال اطلاعات چند رسانه ای نظیر یک قطعه موسیقی ، عکس ، ویدئو و هستیم ،اغلب به نتیجه مطلوب دست نخواهیم یافت زیرا برخی ابزارهای کاوش ، برای متمایز کردن اطلاعات چند رسانه ای از متن ،نظام جداگانه ای ندارند با وجود این تعدادی از ابزارهای کاوش ، بخش کاوش جداگانه ای مختص بازیابی اطلاعات چند رسانه ای دارند موتورهای کاوش lycos , HotBot , Google , Fastsearch , Excite , Altavista از جمله ابزارهای کاوش اصلی به شمار می آیند که امکان جستجو و بازیابی اطلاعات چند رسانه ای در آنها پیش بینی شده است در میان ابزارهای کاوش اصلی ، موتور کاوش Alta vista از جامعیت و امکانات کاوش بسیار مناسب و کار آمدی برخوردار است .
این موتور کاوش ، دربخشهای جداگانه ای تحت عنوان Mp3 / Avdio , Video Images به ترتیب امکان کاوش تصویر ویدئو وصوت را فراهم می کند یکی از مهم ترین قابلیتهای این موتور کاوش ، امکان جستجوی پیشرفته اطلاعات چند رسانه ای از طریق عملگرهای بول ودر فیلدهای مختلف است موتورهای کاوش lycos , Fastsearch هم امکانات مناسبی برای بازیابی اطلاعات چند رسانه ای در اختیار ما قرار داده اند .
درج نادرست نشانی دسترسی به صفحات وب ( URL) در بسیاری ازموارد دیده می شود که به علت درج غلط نشانی صفحات یاسایت های وب نمی توان به صفحه یا سایت مورد نظر دسترسی پیدا کرد بنابراین ، در خواندن ونوشتن نشانی های وب باید دقت بسیاری به خرج دارد زیرا حتی اگر یک نقطه در هنگام درج یا خواندن نشانی صفحه مورد نظر فراموش شود نمی توان صفحه مورد نظر را بازیابی کرد جا افتادگی یا نوشتن Html به جای htm یا برعکس درج www درنشانی سایت هایی که فاقد آن هستند ( مثل http : // dois .
mimas ac .
uk ) از دیگر اشتباهات رایج است .
یکی دیگراز مشکلاتی که ممکن است در مواردمحدودی با آن مواجه شویم وجود « حروف بزرگ » در بخشی از نشانی دسترسی است به عبارت دیگر ، صفحات یا سایت های وبی ممکن است وجود داشته باشند که بخشی از نشانی آنها را حروف بزرگ تشکیل داده باشد برای مثال ، برای دسترسی به سایت Cyber Oewey باید بخشی از نشانی اینترنتی آن را ( www.
Anthus .
com ( icyber Dewey / cyberdewy html حتما با حروف بزرگ تایپ کرد در غیر این صورت بازیابی نمی شود .
ابر موتورهای کاوش : ابر موتورهای کاوش به منظور بالا بردن کارایی و افزایش جامعیت جستجوی اطلاعات درشبکه جهانی وب ابداع شدند طبق بررسیهای به عمل آمده بزرگترین موتور کاوش یعنی Google مدعی است که تا مارس 2002 اطلاعات حدود 1/2 میلیارد صفحه در محیط وب را در پایگاه خود نمایه کرده است حال آنکه طبق مطالعات آماری صورت گرفته تا اوایل سال 2001 بیش از 2/4 میلیارد صفحه در شبکه جهانی وب وجود داشته باشد بنابراین حتی بزرگترین موتور کاوش منفرد ، صرفنظر از وب نامرئی که در بخشهای آتی به آن خواهیم پرداخت فقط توانسته اند تقریبا نیمی از اطلاعات موجود در وب را پوشش دهند از این رو برای انجام جستجوهای جامع ، فناوری و ابزاری مورد نیاز است که از طریق آن بتوان حجم بیشتری از اطلاعات محیط وب را بازیابی کرد که ازآن تحت عنوان ابر موتور کاوش نام برده می شود .
استفاده ی نابجا از ابر موتورهای کاوش باعث سردرگمی وغرق شدن در هزاران سایت بازیابی شده خواهد شد ، به طوری که استفاده کننده حتی مجال برای صدور اجمالی نتایج بازیابی شده نخواهد داشت .
دسترسی به اطلاعات چند رسانه ای در وب : یکی از مهمترین قابلیتهای شبکه جهانی وب ،امکان جستجو و بازیابی حجم بسیار زیادی از اطلاعات چند رسانه ای شامل صوت ،تصویر و ویدئو است از آنجا که ذخیره سازی اطلاعات چند رسانه ای نیاز به فضای بسیار زیادی از حافظه کامپیوتر دارد .
در دسترس قرار دادن آنها حتی از طریق دیسک های فشرده ، محدودیتهای زیادی دارد امروزه ، شبکه جهانی وب ، محیطی منحصر به فرد برای ذخیره سازی و اشاعه اطلاعات چند رسانه ای به شمار می آید بسیاری از استفاده کنندگان که به دنبال اطلاعات چند رسانه ای نظیر موسیقی ، کلام ، جلوه های صوتی ، عکسهای رنگی یا سیاه و سفید فیلم ، انیمشن و ..
هستند اغلب ترجیح می دهند در این محیط به جستجو بپردازند برای مثال ، در موتور کاوش ( www .
alltheweb .
com ) Fastsearch می توان از طریق واسط های جستجوی جداگانه و وارد کردن کلیه واژه های موردنظر ، قطعات صوتی ، تصویری ، و ویدوئی را بازیابی کرد .
بازیابی سریع و آسان حجم بسیاری زیادی از اطلاعات چند رسانه ای که زمانی رویایی بیش نبود با ظهور وب به واقعیت مبدل شده است .
سیاست انتخاب سایت های وب : برخی از راهنماهای موضوعی وب ، سیاست مشخصی برای انتخاب صفحات یا سایت های وب گنجاندن اطلاعات آنها در پایگاه اطلاعاتی خود دارند که به نوعی می تواند یکی از عوامل موثر بر کیفیت محتوای آنها نیز محسوب شود به تعبیر دیگر ، راهنماهای موضوعی ، اغلب فقط صفحات یا سایت های مناسب با کیفیت بالا ، حاوی اطلاعات مفید وبا ارزش را درپایگاه خود نمایه می کنند راهنمای موضوعی open Directory معیارهای مشخصی برای گزینش صفحات یا سایت های وب دارد که مهمترین آنها عبارتند از : صفحات یا سایت های وب باید از کیفیت و اعتبار لازم برخوردار باشند مولف یا طراحان آن مشخص باشند ،از لحاظ محتوایی با دیگر صفحات یا سایت های وب شباهت نزدیک نداشته باشند ، طراحی کلیه صفحات سایت به طور کامل به اتمام رسیده باشد و ساختار گرافیکی منطقی و مناسبی داشته باشند در این میان ، انواع راهنماهای موضوعی نیز وجود دارند که از طریق پرداخت هزینه ای مشخص می توان صفحات وب را با هر محتوا و کیفیتی به آنهامعرفی کرد بدیهی است این راهنماها از اعتبار و کیفیت کمتری برخوردار هستند .
نرم افزارهای کاوشی در شبکه وب : برای جستجو در محیط وب ، برنامه های مختلفی وجود دارد که برای استفاده از آنها ابتدا باید نرم افزار کاوش را بر روی کامپیوتر شخصی خود نصب کرد چنین برنامههایی ، بر خلاف ابزارهای کاوش رایج که از طریق محیط وب ، قابل دسترسی و دارای نشانی مشخص هستند ( نظیر www .
Alta Vista .
com ) هیچ گونه وابستگی به محیط وب ندارد و برنامه کاوش بر روی کامپیوتر شخص ، نصب و اجرا می شود .
اغلب نرم افزارهای کاوش امکان جستجو درچند پایگاه اطلاعاتی را در اختیار قرار میدهند واز این لحاظ ابر موتور کاوش به شمار می آیند .
نرم افزارهای کاوش یا به صورت رایگان از طریق اینترنت ، قبل انتقال به رایانه شخصی هستند یا باید آنها را خریداری کرد برای مثال .
Copernic ( www .
copernic .
com) یکی از مهمترین نرم افزارهای کاوش دروب است که به صورت رایگان قابل دسترس است این نرم افزار امکانات نسبتا مناسبی برای جستجوی اطلاعات در پایگاه 19 ابزار کاوش منفرد دارد.
نمایش اطلاعات در وب : Alta Vista عنوان نشانی دسترسی ، حجم فایل ، تاریخ انتشار ، زبان ، دو سطر بر گرفته از صفحات یا سایت های وب ونیز تعداد نتایج بازیابی شده را نشان می دهد برای مشاهده حجم صفحات بازیابی شده باید این قابلیت را ازطریق بخش Setting فعال کرد .
این موتورکاوش به صورت پیش گزیده تنها 10 مدخل را در هر صفحه نمایش میدهد در جستجوی پیشرفته امکان نمایش 20 تا 100 مدخل درهر صفحه نیز وجود دارد .
Alta Vista فقط امکان بررسی 1000 مدخل ابتدایی بازیابی شده را می دهد و نمیتوان به نتایج بیشتری دست یافت علاوه براین ، دربخش جستجوی پیشرفته امکانی در نظر گرفته شده است تا فقط یک صفحه از هر سایت بازیابی شود ( Sit Collapse) از طریق انتخاب گزینه Family filter نیز می توان از بازیابی سایت های غیر اخلاقی جلوگیری کرد در این بخش امکان محدود کردن بازیابی سایت های غیر اخلاقی از طریق درج گذر واژه وجود دارد .
در اوایل آبان ماه 1381 ساختار گرافیکی این موتور کاوش پس از چند سال تغییر پیدا کرد وشکل دیگری به خود گرفت هم چنین ، امکان جستجوی قالب های فایل به صورت PDF , HTML به بخش جستجوی پیشرفته آن افزوده شد .