ابزارهای جست‌وجوی اینترنتی در سالیان اخیر به خوبی جای خود را در بین کاربران بازکرده‌اند، توسعه دسترسی به اینترنت، اینک نه تنها کاربران بلکه سیاست‌مداران ایرانی را نیز نسبت به کارکرد این نوع ابزارها حساس کرده است. نیاز حکومت به کنترل چرخش اطلاعات در کنار وسوسه بهره‌مندی از مزایای تجاری جست‌وجوگرهای اینترنتی، فضای مناسبی برای مدعیان تولید و عرضه این ابزار فراهم نموده است. در ماه‌های اخیر عبارت جست‌وجوگر ملی به‌دفعات شنیده شده و کاربران ایرانی با این پرسش مواجه هستند که بومی یا غیربومی بودن جست‌وجوگر تا چه حد اهمیت دارد؟

15022015-JostejoogarMelli-2

جست‌وجوگرها درگاه دسترسی مناسب به اطلاعات مورد نیاز میان انبوه صفحات اینترنتی است. سرعت، دقت در استخراج نتایج، گستردگی منابع، خدمات جانبی برای دسته‌بندی نتایج، از جمله مهم‌ترین ویژگی‌هایی است که کاربران را به سمت یک جست‌وجوگر هدایت می‌کند. کاربران در این میان بدون توجه به نام جست‌وجوگر و تبلیغاتی که می‌کند، تنها بر اساس میزان رضایت از نتایجی که دریافت می‌کنند، جست‌وجوگر خود را برمی‌گزینند؛ همان‌گونه که در هنگامه یکه‌تازی‌های یاهو و تبلیغات گسترده‌اش که به فیلم‌های هالیوودی نیز کشیده شده بود، جست‌وجوگرهای تیزپا و مفیدتری همچون گوگل جایگزین شدند.

صفحات دریافت درخواست و نمایش نتایج، ساده‌ترین بخش موتورهای جست‌وجوی اینترنتی است. اما در پشت صحنه اتفاقات و فعالیت‌های گسترده‌ای باید انجام شود.

در نخستین قدم یک موتور جست‌وجوی اینترنتی نیاز به جست‌وجوگر درونی [Crawler) [۱9) دارد که بدون وقفه صفحات اینترنتی را بررسی کرده و بر اساس اطلاعات موجود در آنها، فهرست‌های دسترسی ایجاد کند. این فهرست‌ها در زمان دریافت درخواست جست‌وجو از کاربران، مورد کاوش قرار گرفته و نتایج نهایی از میان این فهرست‌ها استخراج می‌شود. در قدم‌های بعدی فهرست‌های چندگانه‌ای از نتایج کار Crawler ایجاد شده و تسهیلات لازم برای پاسخگویی سریع به درخواست‌های جست‌وجوی کاربران فراهم می‌شود.

دامنه سایت‌های اینترنتی که توسط Crawler مورد پیمایش قرار می‌گیرد، فاصله زمانی مراجعه به سایت‌ها، نوع فهرست‌بندی اطلاعات، و ساختار فهرست‌ها، و ابزارهای ذخیره این اطلاعات از مسائل کلیدی در طراحی و ساخت یک موتور جست‌وجوی اینترنتی است.

بر این اساس کارایی یک موتور جست‌وجو به توانایی و عملکرد این بخش‌ها بستگی دارد: ۱- جست‌وجوگر درونی (Crawler)؛ ۲- الگوریتم‌های دسته‌بندی فهرست‌های اطلاعات؛ ۳- الگوریتم‌های بازیابی نتایج بر اساس درخواست کاربر؛ ۴- تجهیزات ذخیره‌سازی اطلاعات فهرست‌های اطلاعات.

از طرفی موتورهای جست‌وجو به‌طور کلی به چند دسته تقسیم می‌شوند مهم‌ترین این دسته‌بندی‌ها عبارت است از:

الف) موتورهای جست‌وجوی عمومی (General)؛

ب) موتورهای جست‌وجوی ابَر (Metasearch) که مجموعه‌ای حاوی نتایج جست‌وجوی چند جست‌وجوگر عمومی را دسته‌بندی کرده و نمایش می‌دهد؛

ج) موتورهای جست‌وجوی نقطه‌به‌نقطه (P2P) که نتایج جست‌وجو را به‌صورت توزیع‌شده بر روی کامپیوترهای گروهی از کاربران که با هم اتصال تک‌به‌تک دارند، ذخیره می‌کند؛

د) موتورهای جست‌وجوی مفهومی (Semantic) که بر اساس مفهوم عبارت مورد جست‌وجو، کلمات مترادف، موقعیت جغرافیایی، زبان، و … به دنبال دریافت پاسخ مرتبط می‌گردد.

با این توضیحات مشخص می‌شود که آنچه در چند سال اخیر به نام موتورهای جست‌وجوی ملی (بومی) مطرح شده است غالباً در دسته جست‌وجوگرهای عمومی قرار داشته که با نیازهای عمومی کشور و اهداف طراحان سازگاری منطقی بیشتری دارد.

اما نکته بسیار مهم در این میان نیاز این جست‌وجوگرها به مرکز نگهداری داده‌ها و رایانه‌های قدرتمندی است که توان ذخیره حجم گسترده اطلاعات و جست‌وجو در بین این اطلاعات را داشته باشد. در حقیقت با فرض اینکه الگوریتم‌های مناسب برای دسته‌بندی اطلاعات و تهیه فهرست‌های جست‌وجو وجود داشته باشد، تأمین نیازهای سخت‌افزاری بخش‌های جست‌وجوگر درونی (Crawler) و مرکز داده‌ها (DataCenter) چالش بزرگی است.

ساخت، راه‌اندازی، و نگهداری یک موتور جست‌وجوگر نیازمند برنامه‌ریزی و مدیریت مستمر در کنار به کارگیری منابع مالی فراوان، تجهیزات بسیار، و تعداد کثیریرنیروی انسانی ماهر است.

تأمین همه این نیازها توسط بخش خصوصی در ایران غیرممکن می‌ماند، از این‌رو دولت ناگزیر از مداخله در این نوع پروژه‌ها شده است. طرح «جست‌وجوگر پارسی جو» که یکی از ماندگارترین طرح‌های جست‌وجوگر بوده توسط دانشگاه یزد اجرا و از سوی سازمان فناوری اطلاعات پیاده شده است.

همچنین دانشگاه امام حسین، وابسته به سپاه پاسداران جست‌وجوگری به نام «گرگر» را آماده رونمایی کرده است. [۲] این در حالی است که وزیر ارتباطات و فناوری اطلاعات نیز جست‌وجوگر دیگری به نام «یوز» را افتتاح کرد. [۳] اما اظهارات معاون وزیر در مورد اختصاص مبلغ ۱۷۰ میلیارد تومان به جست‌وجوگرهای ملی نشان می‌دهد که تلاش گسترده برای معرفی این جست‌وجوگرها که همه عنوان ملی دارند در واقع شرکت در رقابت دریافت منابع مالی است.

جدول یک : فهرست موتورهای جستجوی فعال بر اساس تاریخ ایجاد (منبع : ویکی پدیا)
سالعنوانوضعیت فعلی
1994WebCrawlerفعال
Go.comفعال (Yahoo Search)
Lycosفعال
1995Daumفعال
Exciteفعال
SAPOفعال
Yahoo!فعال
1996Dogpileفعال,
HotBotفعال  تغییر نام به Lycos.com
Ask Jeevesفعال تغییر نام یافته به ask.com
Yandexفعال
1998Googleفعال
Ixquickفعال
MSN Searchفعال
1999GenieKnowsفعال تغییر نام یافته به Yellowee.com
Naverفعال
2000Baiduفعال
Exaleadفعال
Gigablastفعال
2003Info.comفعال
2004Yahoo! Searchفعال
Sogouفعال
2005AOL Searchفعال
GoodSearchفعال
2006Soso (search engine)فعال
Ask.comفعال
Live Searchفعال تغییر نام یافته به Bing.com
ChaChaفعال
2007Blackle.comفعال (Google Search)
2008DuckDuckGoفعال
2009Bingفعال تغییر نام یافته به Live Search
Scout (Goby)فعال
NATEفعال
2010Blekkoفعال
Yandexفعال
2011YaCyفعالP2P
2013Halalgooglingفعال

نگاهی به فهرست جست‌وجوگرهایی که تابه‌حال ساخته‌شده و از یاد رفته‌اند نشان می‌دهد که تولید و پیاده‌سازی الگویتم‌ها، ایجاد مراکز داده قدرتمند، و فهرست‌برداری از صفحات اینترنتی تنها یک گام از مجموعه گام‌هایی است که باید در این راه برداشت (جدول یک).

وسوسه قرار گرفتن در میان نام‌های بزرگی چون گوگل اغلب مدیران را از درک درست الزامات توسعه یک موتور جست‌وجوی واقعاً ملی بازداشته است. نیازهای امروز کاربران اینترنت به گونه‌ای رقم خورده که موتور جست‌وجو عضوی از یک ساختار یکپارچه و درهم‌تنیده خدمات‌دهی است. بر همین اساس موتور جست‌وجوی گوگل در خدمت سایر خدماتی چون ایمیل، نقشه، دستیار صوتی، … قرار می‌گیرد و موتور جست‌وجوی پرسابقه‌ای چون یاهو به دلیل دور ماندن از این ساختار در مسیر زوال گام بر می‌دارد. همچنین فهرست موتورهای جست‌وجوی غیرفعال و تعطیل‌شده نشان می‌دهد که ادامه حیات در این عرصه تنها با تهیه و پیاده‌سازی الگوریتم‌های موفق، ممکن نیست؛ (جدول دو). 

جدول دو : فهرست موتورهای جستجوی غیرفعال بر اساس تاریخ ایجاد (منبع : ویکی پدیا)
سالعنوانوضعیت فعلی
1993W3Catalogغیر فعال
Aliwebغیر فعال
JumpStationغیر فعال
WWW Wormغیر فعال
1994Infoseekغیر فعال
1995AltaVistaغیر فعال ارجاع داده شده به  Yahoo
Magellanغیر فعال
1996Inktomiغیر فعال ارجاع داده شده به  Yahoo
1997Northern Lightغیر فعال
1998empasغیر فعال  ادغام شده با NATE
1999AlltheWebغیر فعال ارجاع داده شده به  Yahoo
Teomaغیر فعال ارجاع داده شده به  Ask.com
Vivisimoغیر فعال
2003Scroogleغیر فعال
2004A9.comغیر فعال
2005SearchMeغیر فعال
2006Quaeroغیر فعال
Guruji.comغیر فعال
2007wikiseekغیر فعال
Sprooseغیر فعال
Wikia Searchغیر فعال
2008Powersetغیر فعال ارجاع داده شده به Bing
Picollatorغیر فعال
Viewziغیر فعال
Boogamiغیر فعال
LeapFishغیر فعال
Forestleغیر فعال ارجاع داده شده به  Ecosia
2009Yebolغیر فعال
Mugurdyغیر فعال
2010Cuilغیر فعال
2012Voluniaغیر فعال

و نیر متأسفانه نمونه چینی (Baidu) مورد استناد برخی از مدیران ایرانی در بستر کشوری با جمعیت میلیاردی رشد کرده و از اساس ساختاری متفاوت با آنچه که موتورهای جست‌وجوی ایرانی دارند فعالیت می‌کند؛ ضمن اینکه سابقه تحصیل و شروع به کار بنیان‌گذار آن در آمریکا بوده و برگرفته از کار در جست‌وجوگر تعطیل‌شده اینفوسیک است. درحالی‌که تعداد بالای مراجعات به «بایدو» در کشوری چون چین و در کنار محدودیت‌های بسیار گسترده دسترسی به سایر جست‌وجوگرهای اینترنتی، امتیازی محسوب نمی‌شود. [۴]

حساسیت‌های سیاسی موجب شده که برخی کشورها به دنبال ایجاد جست‌وجوگرهای بومی خود باشند. در این میان منافع تجاری که در پشت‌صحنه خدمات‌دهی جست‌وجوگرها شکل می‌گیرد نیز انگیزه بازیگران این عرصه را دوچندان می‌سازد.

جست‌وجوگرهایی که تا کنون با یدک کشیدن نام «ملی» و عمدتاً با حمایت سیاسی و مالی دولت ایجاد شده‌اند در مقابل جست‌وجوگرهای عمده اینترنتی توفیقی نداشته‌اند، اما دستیابی به منابع مالی عظیمی که دولت برای این فعالیت اختصاص داده بسیاری را به تکاپو واداشته است.

گرچه شروع این مسابقه به تمایل حاکمیت به ایجاد زیرساخت لازم برای شبکه اطلاعات داخلی و سهولت در کنترل همه‌جانبه دسترسی به ارتباطات اینترنتی مردم نیز نسبت داده می‌شود. اما شیوه مدیریت و اجرای این پروژه‌ها که در مورد اینترنت ملی، پیام‌رسان ملی، و ایمیل ملی نیز آزموده شده تا کنون نه از نظر فنی و نه از جهت کاربردی منفعتی برای کاربران نداشته است.

پانویس:

[1] ویکی پدیا

[۲]  نام موتور جست‌وجوی ایرانی: از یاحق تا گرگر

[۳]  راه‌اندازی موتور جست‌وجوگر ایرانی «یوز»

[۴]  بزرگترین موتور جست‌وجوی چینی