آیا موتور جستوجوی گوگل، نتایج را بهطور دستی تنظیم میکند؟
در پی فعال شدن SafeSearch گوگل در ایران، ویدئوی قدیمی از صحبتهای مدیر شبکه سه در توییتر دستبه دست میشود که میگوید «سرچ گوگل بهطور manual تنظیم میشود.» اما این ادعا چقدر صحت دارد؟ این روزها، فضای اینترنت ایران با پیادهسازی SafeSearch و جستوجوی امن اجباری در موتور جستوجوی گوگل و بینگ دوباره ملتهب شده است، SafeSearch قابلیتی است که گوگل برای ایجاد محیطی نسبتاً امن در اینترنت برای کودکان در نظر گرفته و فعال کردن آن برعهده والدین است تا از کودکان خود دربرابر تهدیدات آنلاین محافظت کنند. اما در ایران این قابلیت بهطور اجباری و به صورت پیشفرض برای تمام کاربران فعال شده که بهگفته عیسی زارعپور، وزیر ارتباطات، نتیجه خواسته خانوادهها بوده است. بااینحال، حضور و اعتراض کاربران در شبکههای اجتماعی نشان میدهد که بسیاری از آنها، با اجرای این طرح مخالف بودند. از آن سو، خبر همکاری ایران و روسیه برای توسعه گزینههای جایگزین اپلیکیشنهای غربی، رفع فیلتر یاندکس در ایران و قطعی موقت اینترنت ثابت در تهران دست به دست هم داد تا ویدئوی کوتاهی از صحبتهای جنجالی علی فروغی، مدیر شبکه سوم سیما بعد از چهار سال دوباره در توییتر بین کاربران دستبه دست شود. او در این ویدئو مدعی است که سرچ گوگل manual یا همان بهطور دستی تنظیم میشود و اینطور مثال میآورد که وقتی کاربری دارد عکس برج میلاد را جستوجو میکند، گوگل بنا به دلایلی به او «10 چیز مسالهدار» هم نشان میدهد. برخی معتقدند این طرز فکر زمینهساز تصمیم دولت به فعال کردن اجباری SafeSearch شده است تا از کاربران دربرابر مواجه شدن با نتایج «مسالهدار» حفاظت کند. اما آیا این ادعا درست است؟ وقتی برای آشنایی با سازوکار موتور جستوجوی گوگل به سند آن مراجعه میکنیم، همان چند کلمه ابتدایی جمله اول پاسخ سوال ما را مشخص میکند: «گوگل موتور جستوجوی خود را تمام خودکار معرفی میکند» و توضیح میدهد که فرایند جستوجو در وبسایتها و اضافه کردن اطلاعات آنها به پایگاه داده توسط برنامهها و باتهایی به نام خزنده وب (Web Crawler) انجام میشود. گوگل سازوکار موتور جستوجوی خود را در سه مرحله توضیح میدهد که بهطور کامل توسط الگوریتمها و باتها انجام میشود: خزیدن در اینترنت، ایندکس کردن وبسایتها، نمایش نتایج به کاربر. خزندههای وب گوگل، باتهای کاملاً خودکاری هستند که تصویر ارتشی از عنکبوتها را در ذهن تداعی میکنند. این باتها طبق برنامهای منظم در سطح اینترنت پخش میشوند و بهجستوجوی وبسایتهای جدید و محتوای بهتازگی منتشرشده میگردند تا آنها را به موتور جستوجوی گوگل اضافه کنند. درباره سازوکار این باتها در مقاله خزنده وب چیست و چگونه کار میکند؟ بهطور کامل توضیح داده شده؛ اما بهطور کلی، این باتها مبتنی بر الگوریتم هستند که بهطور مرتب بهروزرسانی شده و از سمت مجموعه عظیمی از کامپیوترهای مستقر در گوگل برای پیدا کردن URLها و محتوای جدید بسیج میشوند. بعد از مرحله خزیدن و جمعآوری کاملاً خودکار اطلاعات، نوبت ایندکس کردن فرا میرسد. در این مرحله، برنامههای گوگل با پردازش و آنالیز محتوای متنی و تگهای کلیدی از جمله عنوان و متنهای جایگزینی که برای تصاویر و ویدئوها نوشته شدهاند، سعی میکنند از محتوای وبسایت شما سر دربیاورند؛ مثلاً این برنامهها به گوگل در فهم اینکه زومیت یک وبسایت تکنولوژی است، کمک میکنند تا نتایج مرتبطی را به کاربرانی که دنبال محتوای تکنولوژی هستند، نشان دهد. بههمینخاطر، متخصصان سئو به صاحبان وبسایتها توصیه میکنند در تعیین تگها و متنهای جایگزین تصاویر دقت زیادی به خرج دهند، چراکه گوگل عموماً براساس همین نشانهها مرتبط بودن نتایج جستوجو را تعیین میکند. مثلاً اگر برای تصویری از برج میلاد، متن جایگزین برج آزادی را بنویسید، برنامههای گوگل ممکن است آن را در دستهبندی عکس برج آزادی قرار داده و زمانی که کاربر در جستوجوی تصویری از برج آزادی است، به اشتباه با تصویر برج میلاد روبرو شود. تمام اطلاعات جمعآوریشده توسط باتها و آنالیزشده توسط برنامههای دیگر گوگل در گوگل ایندکس ذخیره میشوند که درواقع پایگاه داده عظیمی است که در هزاران کامپیوتر میزبانی میشود. البته تمام محتوای منتشرشده در اینترنت به پایگاه داده گوگل راه پیدا نمیکنند؛ مثلاً اگر محتوای وبسایت کیفیت پایینی داشته باشد یا خود صاحب وبسایت دسترسی خزندههای وب را بسته باشد، گوگل آنها را در نتایج جستوجو نخواهد آورد. درنهایت، زمانی که کاربر عبارتی را در گوگل سرچ میکند، کامپیوترهای گوگل وبسایتهای ایندکسشده در پایگاه داده این شرکت را برای پیدا کردن صفحات مرتبط جستوجو میکنند و نتایجی را که بیشترین کیفیت و ارتباط را با درخواست کاربر دارند، نشان میدهند. مرتبط بودن نتایج با عبارت جستوجو شده نیز براساس صدها فاکتور مختلف تعیین میشود؛ از جمله موقعیت مکانی کاربر، زبان استفادهشده برای سرچ و دستگاهی که از آن جستوجو انجام میشود (دسکتاپ یا گوشی) . برای مثال، نتایج جستوجوی «تعمیرگاه دوچرخه» در گوگل برای کاربری در پاریس و کاربر دیگری در هنگکنگ متفاوت خواهد بود، چون گوگل با در نظر گرفتن موقعیت مکانی کاربر، تعمیرگاه نزدیک محل زندگی او را نشان میدهد. درست است که گوگل فرشته نیست و این روزها بهخاطر قدرت و نفوذ بیحدومرزش، زیر ذرهبین لوایح ضدانحصاری امریکا قرار گرفته است؛ اما دستکاری تعمدی گوگل برای نشان دادن نتایج غیرمرتبط با جستوجوی کاربر نوعی خودکشی شغلی است که موقعیت این غول دنیای فناوری را بهخطر میاندازد، در واقع دلیل اینکه گوگل توانست به سرعت رقبا را کنار زده و رهبری بازار جستوجوی اینترنتی را به دست بگیرد، بهخاطر کارآمدی الگوریتمها و تواناییاش در تطبیق خود با خواستههای کاربر است. اگر گوگل قرار بود بهجای نشان دادن آنچیزی که کاربر در جستوجویش است، «10 تا چیز مسالهدار» را به او نشان دهد، بیشک اکنون محبوبترین و معتبرترین موتور جستوجوی دنیا نبود.