مهمترین نکات از اسناد فاش شده در مورد مکانیسم موتور جستجوی گوگل چیست؟

مهم‌ترین نکات از اسناد فاش‌شده درباره سازوکار موتور جستجوی گوگل چیست؟

اخیراً اسنادی 2500 صفحه‌ای درباره سازوکار موتور جستجوی گوگل فاش شد. اکنون می‌خواهیم مهم‌ترین نکات آن را با هم بررسی کنیم.

چند روز پیش اسنادی 2500 صفحه‌ای از سازوکارهای موتور جستجوی گوگل افشا شد که این شرکت نیز صحت آن را تأیید کرد. اگرچه این اسناد الگوریتم این موتور جستجو را فاش نمی‌کند، اما دارای اطلاعات بسیار ارزشمندی است که فرایندهای درونی گوگل را نشان می‌دهد، فرایندهایی که معمولاً افشا نمی‌شوند. اما حالا می‌خواهیم نگاهی مختصر به برخی از اطلاعات مهم این اسناد داشته باشیم.

احتمالاً برجسته‌ترین نکته درباره این اسناد وجود اطلاعاتی است که نشان می‌دهد نمایندگان گوگل در گذشته، هنگامی که درباره ارزیابی و رتبه‌بندی محتواها توسط این موتور جستجو صحبت می‌کردند، مخاطبان را فریب داده بودند.

اینکه گوگل چگونه محتواها را رتبه‌بندی می‌کند درون یک جعبه سیاه اتفاق می‌افتد. بسیاری از وب‌سایت‌ها برای بقای خود به ترافیک حاصل از موتور جستجو متکی هستند، و خیلی از آن‌ها تلاش – و هزینه – زیادی می‌کنند تا از رقبا پیشی بگیرند و در نتایج رتبه خود را ارتقا دهند. رتبه بهتر به‌معنای بازدیدکننده بیشتر، و در نتیجه، درآمد بیشتر است. ازاین‌رو، گردانندگان سایت‌ها به تک‌تک داده‌هایی که از جانب گوگل یا کارمندان آن منتشر می‌شود، توجه می‌کنند.

گوگل کاربران را فریب داده است؟

برای مثال، سخنگویان گوگل در طول سال‌های اخیر به‌دفعات نقش کلیک‌های کاربر در رتبه‌بندی سایت‌ها را رد کرده‌اند، اما اطلاعات افشاشده انواعی از کلیک‌های کاربر را نشان می‌دهد و می‌گوید این کلیک‌ها در رتبه‌بندی صفحات در موتورهای جستجو اعمال می‌شود.

«رند فیشکین»، متخصص بهینه‌سازی موتور جستجو (SEO) که در کنار «مایک کینگ» به دیده‌شدن این اسناد افشاشده کمک کردند، می‌گوید: «برای من، نکته مهم‌تر و کلی‌تر این است که شواهد محکمی علیه بسیاری از اظهارات عمومی گوگل درباره اینکه آن‌ها چه داده‌هایی را گردآوری می‌کنند و موتور جستجویشان چگونه کار می‌کند، وجود دارد.»

اطلاعات فاش‌شده حاوی مخازنی مملو از داده‌های مختلف درباره گردآوری محتوا توسط گوگل است و برخی از این موارد ممکن است بر نحوه رتبه‌بندی صفحات در موتور جستجو تأثیر بگذارد. در ابتدا گوگل درباره صحت این اسناد واکنشی نشان نداد، اما بعداً آن را تأیید کرد.

در بیانیه این شرکت آمده است: «ما نسبت به ایجاد فرضیات نادرست درباره نتایج جستجوها براساس اطلاعات قدیمی یا ناقص هشدار می‌دهیم. ما اطلاعات زیادی درباره نحوه عملکرد موتور جستجوی خود و عواملی که سیستم‌های ما مورد بررسی قرار می‌دهند، به اشتراک گذاشته‌ایم. درعین‌حال از یکپارچگی نتایج جستجوها در برابر دستکاری محافظت می‌کنیم.»

هیچ گواهی در این اسناد وجود ندارد که میزان اثرگذاری خصوصیات یا صفات (Attributes) مختلف را نشان دهد. این امکان وجود دارد که برخی از صفات موجود در میان این اطلاعات – نظیر شناسه «سایت‌های شخصی کوچک» یا افت رتبه به‌دلیل نقد محصول – در بخشی از سازوکار موتور جستجو پیاده‌سازی شده باشد، اما به‌نظر می‌رسد که بعداً از رده خارج شده است. همچنین نمی‌توان با قطعیت گفت که از آن‌ها برای رتبه‌بندی سایت‌ها استفاده شده است.

کینگ می‌گوید صرف‌نظر از توصیفاتی که برای مؤلفه‌های ذکرشده وجود دارد، لزوماً نمی‌دانیم که چگونه از آن‌ها استفاده می‌شود. از طرفی، اگرچه اطلاعات درباره آن‌ها پراکنده است، اما می‌توانیم داده‌های زیادی را در این زمینه مشاهده کنیم.

اینکه بزرگ‌ترین پلتفرم جستجوی جهان رتبه‌بندی نتایج جستجوی خود را مبتنی بر چگونگی تعامل کاربر با محتوا تنظیم نکند، در ظاهر غیرمنطقی به‌نظر می‌رسد. ولی تکذیب‌های مکرر، استفاده از کلمات دقیق در پاسخ‌های گوگل، و مطالب گوناگونی که این ادعاها را تکرار می‌کنند، باعث شده تا این مبحث در میان متخصصان سئو به یک موضوع بحث‌برانگیز تبدیل شود.

موتور جستجوی گوگل از کروم اطلاعات می‌گیرد

نکته مهم دیگری که فیشکین و کینگ به آن اشاره کرده‌اند، به چگونگی استفاده از داده‌های کروم در رتبه‌بندی جستجو مربوط می‌شود. نمایندگان گوگل قبلاً گفته بودند که این شرکت از داده‌های کروم برای رتبه‌بندی استفاده نمی‌کند، اما اسناد افشاشده ممکن است خلاف این قضیه را نشان دهد. برای مثال، در یک بخش به chrome_trans_clicks اشاره شده که ظاهراً مشخص می‌کند کدام لینک‌ها از یک دامنه باید در قالب زیرمجموعه آن در نتایج جستجو نمایش داده شوند. فیشکین معتقد است که این یعنی گوگل از تعداد کلیک روی صفحات در کروم استفاده می‌کند تا محبوب‌ترین یا مهم‌ترین صفحات را به‌دست آورد و آن‌ها را در نتایج جستجو نشان دهد.

در فایل‌های فاش‌شده بیش از 14 هزار صفت وجود دارد، و محققان هفته‌ها زمان صرف بررسی این اطلاعات خواهند کرد. در این اسناد به «وررونده‌ها» (Twiddlers) نیز اشاره شده که ظاهراً سازوکارهایی برای تعیین رتبه در خارج از به‌روزرسانی‌های بزرگ سیستمی است. این دستکاری‌ها منجر به تقویت یا افت رتبه یک محتوا براساس یک معیار خاص می‌شود. عناصر صفحات وب، نظیر اینکه نویسنده کیست، هم به‌عنوان میزان «اعتبار» سایت‌ها ذکر می‌شود. فیشکین می‌گوید بسیاری موارد دیگر مثل محتواهای خلق‌شده با هوش مصنوعی نیز وجود دارد که در این اسناد به آن‌ها اشاره نشده است.

همه این‌ها برای افرادی که درون صنعت SEO کار نمی‌کنند، به چه معناست؟ در وهله اول، باید انتظار داشت که همه گردانندگان وب‌سایت‌ها این اطلاعات فاش‌شده را بخوانند و سعی کنند از آن‌ها سر در بیاورند. ترفندهای زیادی به کار گرفته خواهد شد تا مشخص شود که کدام مواد جواب می‌دهد. ناشران، شرکت‌های تجاری و کسب‌وکارها هم احتمالاً آزمایش‌های گوناگونی انجام می‌دهند تا داده‌های ارائه‌شده در این اسناد را آزمایش کنند. بنابراین می‌توان حدس زد که در آینده ظاهر و محتوای وب‌سایت‌ها تغییر کند.

فیشکین می‌گوید: «خبرنگاران و کسانی که اطلاعات مربوط به سئو و گوگل سرچ را منتشر می‌کنند، باید از نقل‌قول چشم‌بسته بیانیه‌های عمومی گوگل دست بردارند، و نگاه سخت‌گیرانه‌تر و دقیق‌تری به گفته‌های نمایندگان این غول موتور جستجو داشته باشند. هنگامی که رسانه‌ها ادعاهای گوگل را به‌نحوی تکرار می‌کنند که گویی حقیقت دارند، آن‌ها درحال کمک به روایتی از داستان گوگل هستند که تنها برای این شرکت مفید است، نه برای متخصصان، کاربران یا عموم مردم.»