آپدیت جدید گوگل برای حذف و کاهش ایندکس ها

 چهارشنبه 10 اردیبهشت 1393

آپدیت جدید گوگل برای حذف و کاهش ایندکس ها از نتایج جستجو در تاریخ 16 آپریل 2014 یا 27 فروردین 1393 انجام شده است. در شانزده روز گذشته تماس های زیادی از طرف همکاران سئو کار و مدیران سایت ها داشتم که سایتشون دچار مشکل اساسی شده بود و از نتایج گوگل حذف شده بود. دلیل این موضوع آپدیت جدید الگوریتم گوگل هست.

قبل از اینکه در مورد این آپدیت توضیح بدهم لازم میدونم یک توضیح کوتاه در مورد اینکه چرا موتورهای جستجو دوست ندارند صفحات ایندکس شده زیادی داشته باشند بدهم. چندی پیش در شعار یکی از همایشها دیدم که نوشته بود گوگل نتوانسته تمام صفحات اینترنت را ایندکس بکنه و به همین دلیل موتور جستجوی خوبی نیست. نکته ای که نگارنده این شعار و سخنران این همایش بهش دقت نکرده بود این هست که بین نتوانستن و نخواستن تفاوت زیادی وجود داره.

موتور جستجوی یاهو در سال 2009 حدود 60% از صفحات ایندکس شده خود را حذف کرد، گوگل نیز از سال 2012 تا به حال آپدیت های زیادی ارائه کرده تا جلوی ایندکس شدن صفحات اینترنتی را بگیره که از جمله معروفترین آنها که احتمالا همگی با آن آشنا هستید جلوگیری از ایندکس شدن مطالب کپی شده در سایت ها هست.

چرا موتورهای جستجو علاقه ای به ایندکس کردن همه صفحات ندارند؟

پاسخ این سوال را از دو جنبه می توان بررسی کرد:

  • اطلاعات موجود در اینترنت بسیار حجیم هستند و ایندکس کردن آنها نیازمند سخت افزارها و نرم افزارهای بسیار گران قیمتی است که هزینه موتورهای جستجو را شدیدا افزایش می دهد و بعضا ایندکس کردن تمام مطالب تا حدودی غیر ممکن به نظر می رسد. به عنوان مثال تمام موتورهای جستجوی فارسی که در سال های اخیر توسط سازمان های مختلف راه اندازی شدند و نهایتا پروژه آنها به شکست منجر شد مشکل اساسی که داشتند در بخش خزنده آنها بود که از نظر زمان بندی و تشخیص کیفیت محتوا دچار مشکل بود و از طرف دیگر امکانات سخت افزاری لازم برای نگهداری داده های حجیم را نداشتند و نرم افزار آنها نهایتا کند و نا کارآمد می شد.
  • هر داده ای ارزش ایندکس شدن ندارد. مثل محتوای تکراری و داده های کپی که هیچ کمکی به کاربری که به دنبال مطلب خاصی می گردد نخواهند کرد.

بروزرسانی الگوریتم گوگل - حذف ایندکس های سایت از نتایج گوگل

آپدیت جدید گوگل چه کاری انجام می دهد؟

دو خاصیت اصلی این آپدیت به صورت زیر هستند:

  • این آپدیت جدید تمام اطلاعات دامنه های پارک شده روی هم را حذف می کند. به عنوان مثال اگر شما یک دامنه با پسوند ir و یک دامنه با پسوند com داشته باشید و هر دو را روی یک هاست پارک کرده باشید و گوگل تا به حال نتوانسته بود تشخیص دهد که اطلاعات هر دو دامنه کپی هستند، الگوریتم جدید با بروزرسانی که بر روی آن انجام شده تمام ایندکس های حداقل یکی از دو دامنه را حذف خواهد کرد.
  • در صورتی که از پروتکل https استفاده می کنید و یا این پروتکل بر روی هاست شما فعال هست ممکن است این الگوریتم آسیب جدی به سایت شما برساند زیرا گوگل تمام صفحات ایندکس شده http شما را حذف خواهد کرد. حتی اگر https سایت شما خطا بدهد و صرفا پروتکل آن بر روی سایت شما فعال باشد.
  • در صورتی که سایت شما هم با www و هم بدون آن لود می شود و ریدایرکت نمی شود، حتما یکی از دو حالت را انتخاب کنید زیرا گوگل این موضوع را نیز مد نظر دارد و ایندکس های اضافه را پاک می کند. بهترین روش برای ریدایرکت کردن، استفاده از کد خطای 301 است.
  • ایندکس شدن پوشه های مختلف سایت با پروتکل های مختلف نیز از هم جدا شده اند، یعنی اگر آدرس دهی صفحات مختلف سایت شما به صورتی است که هر بخش در یک پوشه قرار دارد مانند www.example.com/cat در این صورت گوگل برای هر پروتکل ایندکس جداگانه ای برای سایت شما در نظر خواهد گرفت.

 چه کاری باید انجام بدهم تا سایت من دچار مشکل نشود؟

در اولین مرحله به وبمستر تولز مراجعه کنید و گزارش index stat وب سایت خود را بررسی کنید. در صورتی که پس از تاریخ بروزرسانی تغییری در تعداد ایندکس های شما بوجود نیامده است مشکلی شما را تهدید نمی کند اما اگر تعداد ایندکس های سایت شما افت پیدا کرده است به دنبال یکی از مواردی باشید که در پاراگراف قبل توضیح دادم و سعی کنید آنها را برطرف کنید.

مطالب مرتبط
مطالب من را در شبکه های اجتماعی دنبال کنید:
دیدگاه خود را با ما در میان بگذارید
امتیاز:
captcha