ابزارهای جستوجوی اینترنتی در سالیان اخیر به خوبی جای خود را در بین کاربران بازکردهاند، توسعه دسترسی به اینترنت، اینک نه تنها کاربران بلکه سیاستمداران ایرانی را نیز نسبت به کارکرد این نوع ابزارها حساس کرده است. نیاز حکومت به کنترل چرخش اطلاعات در کنار وسوسه بهرهمندی از مزایای تجاری جستوجوگرهای اینترنتی، فضای مناسبی برای مدعیان تولید و عرضه این ابزار فراهم نموده است. در ماههای اخیر عبارت جستوجوگر ملی بهدفعات شنیده شده و کاربران ایرانی با این پرسش مواجه هستند که بومی یا غیربومی بودن جستوجوگر تا چه حد اهمیت دارد؟
جستوجوگرها درگاه دسترسی مناسب به اطلاعات مورد نیاز میان انبوه صفحات اینترنتی است. سرعت، دقت در استخراج نتایج، گستردگی منابع، خدمات جانبی برای دستهبندی نتایج، از جمله مهمترین ویژگیهایی است که کاربران را به سمت یک جستوجوگر هدایت میکند. کاربران در این میان بدون توجه به نام جستوجوگر و تبلیغاتی که میکند، تنها بر اساس میزان رضایت از نتایجی که دریافت میکنند، جستوجوگر خود را برمیگزینند؛ همانگونه که در هنگامه یکهتازیهای یاهو و تبلیغات گستردهاش که به فیلمهای هالیوودی نیز کشیده شده بود، جستوجوگرهای تیزپا و مفیدتری همچون گوگل جایگزین شدند.
صفحات دریافت درخواست و نمایش نتایج، سادهترین بخش موتورهای جستوجوی اینترنتی است. اما در پشت صحنه اتفاقات و فعالیتهای گستردهای باید انجام شود.
در نخستین قدم یک موتور جستوجوی اینترنتی نیاز به جستوجوگر درونی [Crawler) [۱9) دارد که بدون وقفه صفحات اینترنتی را بررسی کرده و بر اساس اطلاعات موجود در آنها، فهرستهای دسترسی ایجاد کند. این فهرستها در زمان دریافت درخواست جستوجو از کاربران، مورد کاوش قرار گرفته و نتایج نهایی از میان این فهرستها استخراج میشود. در قدمهای بعدی فهرستهای چندگانهای از نتایج کار Crawler ایجاد شده و تسهیلات لازم برای پاسخگویی سریع به درخواستهای جستوجوی کاربران فراهم میشود.
دامنه سایتهای اینترنتی که توسط Crawler مورد پیمایش قرار میگیرد، فاصله زمانی مراجعه به سایتها، نوع فهرستبندی اطلاعات، و ساختار فهرستها، و ابزارهای ذخیره این اطلاعات از مسائل کلیدی در طراحی و ساخت یک موتور جستوجوی اینترنتی است.
بر این اساس کارایی یک موتور جستوجو به توانایی و عملکرد این بخشها بستگی دارد: ۱- جستوجوگر درونی (Crawler)؛ ۲- الگوریتمهای دستهبندی فهرستهای اطلاعات؛ ۳- الگوریتمهای بازیابی نتایج بر اساس درخواست کاربر؛ ۴- تجهیزات ذخیرهسازی اطلاعات فهرستهای اطلاعات.
از طرفی موتورهای جستوجو بهطور کلی به چند دسته تقسیم میشوند مهمترین این دستهبندیها عبارت است از:
الف) موتورهای جستوجوی عمومی (General)؛
ب) موتورهای جستوجوی ابَر (Metasearch) که مجموعهای حاوی نتایج جستوجوی چند جستوجوگر عمومی را دستهبندی کرده و نمایش میدهد؛
ج) موتورهای جستوجوی نقطهبهنقطه (P2P) که نتایج جستوجو را بهصورت توزیعشده بر روی کامپیوترهای گروهی از کاربران که با هم اتصال تکبهتک دارند، ذخیره میکند؛
د) موتورهای جستوجوی مفهومی (Semantic) که بر اساس مفهوم عبارت مورد جستوجو، کلمات مترادف، موقعیت جغرافیایی، زبان، و … به دنبال دریافت پاسخ مرتبط میگردد.
با این توضیحات مشخص میشود که آنچه در چند سال اخیر به نام موتورهای جستوجوی ملی (بومی) مطرح شده است غالباً در دسته جستوجوگرهای عمومی قرار داشته که با نیازهای عمومی کشور و اهداف طراحان سازگاری منطقی بیشتری دارد.
اما نکته بسیار مهم در این میان نیاز این جستوجوگرها به مرکز نگهداری دادهها و رایانههای قدرتمندی است که توان ذخیره حجم گسترده اطلاعات و جستوجو در بین این اطلاعات را داشته باشد. در حقیقت با فرض اینکه الگوریتمهای مناسب برای دستهبندی اطلاعات و تهیه فهرستهای جستوجو وجود داشته باشد، تأمین نیازهای سختافزاری بخشهای جستوجوگر درونی (Crawler) و مرکز دادهها (DataCenter) چالش بزرگی است.
ساخت، راهاندازی، و نگهداری یک موتور جستوجوگر نیازمند برنامهریزی و مدیریت مستمر در کنار به کارگیری منابع مالی فراوان، تجهیزات بسیار، و تعداد کثیریرنیروی انسانی ماهر است.
تأمین همه این نیازها توسط بخش خصوصی در ایران غیرممکن میماند، از اینرو دولت ناگزیر از مداخله در این نوع پروژهها شده است. طرح «جستوجوگر پارسی جو» که یکی از ماندگارترین طرحهای جستوجوگر بوده توسط دانشگاه یزد اجرا و از سوی سازمان فناوری اطلاعات پیاده شده است.
همچنین دانشگاه امام حسین، وابسته به سپاه پاسداران جستوجوگری به نام «گرگر» را آماده رونمایی کرده است. [۲] این در حالی است که وزیر ارتباطات و فناوری اطلاعات نیز جستوجوگر دیگری به نام «یوز» را افتتاح کرد. [۳] اما اظهارات معاون وزیر در مورد اختصاص مبلغ ۱۷۰ میلیارد تومان به جستوجوگرهای ملی نشان میدهد که تلاش گسترده برای معرفی این جستوجوگرها که همه عنوان ملی دارند در واقع شرکت در رقابت دریافت منابع مالی است.
جدول یک : فهرست موتورهای جستجوی فعال بر اساس تاریخ ایجاد (منبع : ویکی پدیا) | ||
سال | عنوان | وضعیت فعلی |
1994 | WebCrawler | فعال |
Go.com | فعال (Yahoo Search) | |
Lycos | فعال | |
1995 | Daum | فعال |
Excite | فعال | |
SAPO | فعال | |
Yahoo! | فعال | |
1996 | Dogpile | فعال, |
HotBot | فعال تغییر نام به Lycos.com | |
Ask Jeeves | فعال تغییر نام یافته به ask.com | |
Yandex | فعال | |
1998 | فعال | |
Ixquick | فعال | |
MSN Search | فعال | |
1999 | GenieKnows | فعال تغییر نام یافته به Yellowee.com |
Naver | فعال | |
2000 | Baidu | فعال |
Exalead | فعال | |
Gigablast | فعال | |
2003 | Info.com | فعال |
2004 | Yahoo! Search | فعال |
Sogou | فعال | |
2005 | AOL Search | فعال |
GoodSearch | فعال | |
2006 | Soso (search engine) | فعال |
Ask.com | فعال | |
Live Search | فعال تغییر نام یافته به Bing.com | |
ChaCha | فعال | |
2007 | Blackle.com | فعال (Google Search) |
2008 | DuckDuckGo | فعال |
2009 | Bing | فعال تغییر نام یافته به Live Search |
Scout (Goby) | فعال | |
NATE | فعال | |
2010 | Blekko | فعال |
Yandex | فعال | |
2011 | YaCy | فعالP2P |
2013 | Halalgoogling | فعال |
نگاهی به فهرست جستوجوگرهایی که تابهحال ساختهشده و از یاد رفتهاند نشان میدهد که تولید و پیادهسازی الگویتمها، ایجاد مراکز داده قدرتمند، و فهرستبرداری از صفحات اینترنتی تنها یک گام از مجموعه گامهایی است که باید در این راه برداشت (جدول یک).
وسوسه قرار گرفتن در میان نامهای بزرگی چون گوگل اغلب مدیران را از درک درست الزامات توسعه یک موتور جستوجوی واقعاً ملی بازداشته است. نیازهای امروز کاربران اینترنت به گونهای رقم خورده که موتور جستوجو عضوی از یک ساختار یکپارچه و درهمتنیده خدماتدهی است. بر همین اساس موتور جستوجوی گوگل در خدمت سایر خدماتی چون ایمیل، نقشه، دستیار صوتی، … قرار میگیرد و موتور جستوجوی پرسابقهای چون یاهو به دلیل دور ماندن از این ساختار در مسیر زوال گام بر میدارد. همچنین فهرست موتورهای جستوجوی غیرفعال و تعطیلشده نشان میدهد که ادامه حیات در این عرصه تنها با تهیه و پیادهسازی الگوریتمهای موفق، ممکن نیست؛ (جدول دو).
جدول دو : فهرست موتورهای جستجوی غیرفعال بر اساس تاریخ ایجاد (منبع : ویکی پدیا) | ||
سال | عنوان | وضعیت فعلی |
1993 | W3Catalog | غیر فعال |
Aliweb | غیر فعال | |
JumpStation | غیر فعال | |
WWW Worm | غیر فعال | |
1994 | Infoseek | غیر فعال |
1995 | AltaVista | غیر فعال ارجاع داده شده به Yahoo |
Magellan | غیر فعال | |
1996 | Inktomi | غیر فعال ارجاع داده شده به Yahoo |
1997 | Northern Light | غیر فعال |
1998 | empas | غیر فعال ادغام شده با NATE |
1999 | AlltheWeb | غیر فعال ارجاع داده شده به Yahoo |
Teoma | غیر فعال ارجاع داده شده به Ask.com | |
Vivisimo | غیر فعال | |
2003 | Scroogle | غیر فعال |
2004 | A9.com | غیر فعال |
2005 | SearchMe | غیر فعال |
2006 | Quaero | غیر فعال |
Guruji.com | غیر فعال | |
2007 | wikiseek | غیر فعال |
Sproose | غیر فعال | |
Wikia Search | غیر فعال | |
2008 | Powerset | غیر فعال ارجاع داده شده به Bing |
Picollator | غیر فعال | |
Viewzi | غیر فعال | |
Boogami | غیر فعال | |
LeapFish | غیر فعال | |
Forestle | غیر فعال ارجاع داده شده به Ecosia | |
2009 | Yebol | غیر فعال |
Mugurdy | غیر فعال | |
2010 | Cuil | غیر فعال |
2012 | Volunia | غیر فعال |
و نیر متأسفانه نمونه چینی (Baidu) مورد استناد برخی از مدیران ایرانی در بستر کشوری با جمعیت میلیاردی رشد کرده و از اساس ساختاری متفاوت با آنچه که موتورهای جستوجوی ایرانی دارند فعالیت میکند؛ ضمن اینکه سابقه تحصیل و شروع به کار بنیانگذار آن در آمریکا بوده و برگرفته از کار در جستوجوگر تعطیلشده اینفوسیک است. درحالیکه تعداد بالای مراجعات به «بایدو» در کشوری چون چین و در کنار محدودیتهای بسیار گسترده دسترسی به سایر جستوجوگرهای اینترنتی، امتیازی محسوب نمیشود. [۴]
حساسیتهای سیاسی موجب شده که برخی کشورها به دنبال ایجاد جستوجوگرهای بومی خود باشند. در این میان منافع تجاری که در پشتصحنه خدماتدهی جستوجوگرها شکل میگیرد نیز انگیزه بازیگران این عرصه را دوچندان میسازد.
جستوجوگرهایی که تا کنون با یدک کشیدن نام «ملی» و عمدتاً با حمایت سیاسی و مالی دولت ایجاد شدهاند در مقابل جستوجوگرهای عمده اینترنتی توفیقی نداشتهاند، اما دستیابی به منابع مالی عظیمی که دولت برای این فعالیت اختصاص داده بسیاری را به تکاپو واداشته است.
گرچه شروع این مسابقه به تمایل حاکمیت به ایجاد زیرساخت لازم برای شبکه اطلاعات داخلی و سهولت در کنترل همهجانبه دسترسی به ارتباطات اینترنتی مردم نیز نسبت داده میشود. اما شیوه مدیریت و اجرای این پروژهها که در مورد اینترنت ملی، پیامرسان ملی، و ایمیل ملی نیز آزموده شده تا کنون نه از نظر فنی و نه از جهت کاربردی منفعتی برای کاربران نداشته است.
پانویس:
[1] ویکی پدیا
[۲] نام موتور جستوجوی ایرانی: از یاحق تا گرگر