بدون دیدگاه
2021/05/08
144 بازدید

راهنمای کامل خطای خزش (Crawl error)

ایجاد رتبه بندی بالای در نتایج جستجو، با اطمینان از اینکه Google می تواند محتوای شما را بررسی کند، شروع می شود. وقتی گوگل نتواند به درستی صفحه ای را باز کند یا از یک صفحه به صفحه دیگر منتقل شود، نمی تواند محتوا را ایندکس کند. این موارد به عنوان خطاهای خزش شناخته می شوند. Crawl errors به خطاهایی گفته می شود که خزنده های گوگل حین بررسی محتوای یک سایت به آن برمی خورند و در پنل وبمسترتولز نیز به نمایش در می آید.
کنسول جستجوی گوگل به شما کمک می‌کند تا شیوه عملکرد گوگل نسبت به سایت خود را بررسی کنید، عملکرد این ابزار اینگونه است که هر آنچه را که خزنده‌های گوگل بدست می‌آورند را نمایش می‌دهد پس می‌توانید اطلاعات کاملی از سایت خود داشته باشید. یکی از بخش‌های بسیار مهم و کاربردی این ابزار، بخشی تحت عنوان Crawl Errors وجود دارد که در آن خطاهایی که خزنده‌های گوگل هنگام بررسی سایت شما با آن‌ها مواجه شده است را به نمایش می‌گذارد.
ویکی دمی در این مقاله موارد زیر را به شما آموزش می دهد:

⦁ خطای Crawl چیست؟
⦁ خطاهای سایت چیست؟
⦁ خطاهای URL چیست؟
⦁ ابزار بازرسی URL چیست؟
⦁ مشکل خطاهای خزنده چیست؟خطای خزش (Crawl) چیست؟

خطاهای خزشی، مشکلاتی است که موتورهای جستجو هنگام دستیابی به صفحات شما با آن روبرو می شوند. این خطاها مانع از خواندن محتوای ربات های موتور جستجو و فهرست بندی صفحات شما می شوند.
Crawl Errors همچنین می تواند به گزارشی موجود در نسخه قدیمی Google Search Console اشاره کند.

گزارش خطاهای خزنده دارای دو بخش اصلی است:

⦁ خطاهای سایت: این خطاها از دسترسی Googlebot به کل وب سایت شما جلوگیری می کنند. در واقع در این قسمت خطاهای پیش آمده در سایت شما که از دسترسی به گوگل بات جلوگیری کرده است نشان داده می شود.
در واقع این خطاها مانع خزنده‌های گوگل می‌شوند، تا به ‌کل وب‌ سایت شما دسترسی داشته باشند.
⦁ خطاهای URL: این خطاها هنگامی رخ می دهد که Googlebot قادر به دسترسی به URL خاصی نیست. یعنی این بخش هنگامی که خزنده های دسکتاپ یا گوشی های هوشمند موقع بررسی یک لینک به بن بست رسیده باشند، نمایش داده می شوند.
البته در نسخه جدید سرچ کنسول گوگل، این خطاها بر اساس هر URL و در Index Coverage گزارش می‌شوند.

  قیمت پروژه سئو چگونه تعیین می شود؟

مشاهده خطا در coverage

در بخش جدید Index Coverageدر Search Console با مرور زمان موارد زیر مورد بررسی قرار می گیرد:

⦁ خطاهایی که با آنها روبرو شده اند. (و تعدادی از آنها را که برطرف کرده اید)

⦁ صفحات معتبری که Google ایندکس کرده است.

⦁ صفحاتی که Google با آنها روبرو شده است اما ایندکس نشده است.

⦁ صفحات معتبری که با Google ایندکس شده است، اما برخی از خطاها را در آن پیدا کرده است.

خطای صفحات در سرچ کنسول
به منظور پوشش دادن خطاهای خزش، فقط در مورد خطاها بحث خواهیم کرد، زیرا این موارد باعث می شود صفحات شما توسط Google خزیده یا ایندکس نشوند.
با توجه به این‌ که موارد ذکرشده مانع می‌شوند تا صفحات شما توسط خزنده‌های گوگل ایندکس شوند، در ادامه به بررسی آن‌ها خواهیم پرداخت.

⦁ خطاهای سایت

خطاهای سایت مشکلاتی است که در سطح سایت رخ می دهد. خطاهای سایت به این معنی است که کاربران و Google قادر به دسترسی به هیچ یک از صفحات شما نیستند.

بنابراین از این خطاها صرف نظر نکنید. در کل خطاهای سایت همه Crawl Error هستند که از دسترسی ربات موتور جستجو به وب سایت شما جلوگیری می‌کنند.
خطاهای سایت می‌توانند دلایل مختلفی داشته باشند که شایع‌ترین آنها موارد زیر هستند:

سه خطای سایت وجود دارد که Google آنها را خطای خزیدن می داند.

⦁ خطای DNS

DNS مخفف عبارات domain name system است. IP یک سایت را به کمک رشته‌ای از اعداد به حروف و اعداد قابل کاربرد ترجمه می‌کند. به‌طورکلی دی‌ان‌اس پلتفرمی است که ما را قادر می‌سازد بدون این‌که  آدرس IP هر سایتی را بدانیم در اینترنت مسیریابی کنیم. خطای DNS در خطای خزش به این معناست که موتور جستجو قادر به برقراری ارتباط با سرور شما نیست. به عنوان مثال ممکن است DNS خراب شده باشد و در نهایت سایت شما توسط مخاطبان بازدید نشود.
یعنی موتور جستجو قادر نیست با سرور شما ارتباط برقرار کند. برای مثال ممکن است خراب باشد و به عبارتی وب‌ سایت شما قابل بازدید نیست. این معمولا یک مسئله موقتی است. به هرحال گوگل پس از آن به وب‌سایت شما بازمی‌گردد و سایتتان را کراول می‌کند. اگر در برنامه Google Search Console خود متوجه این اخطار خطای کراول شدید، می‌تواند به این معنی باشد که گوگل چندین بار سعی کرده اما موفق به کراول آن نشده است.

سیستم domain name system یا دی‌ان‌اس به ترتیب زیر کار می‌کند:

  طراحی سایت در مازندران

⦁ شما یک نام دامنه را در مرورگر خود تایپ می کنید.

⦁ مرورگر بررسی می کند که آیا اطلاعات مربوط به آن دامنه به صورت محلی در رایانه شما ذخیره شده است یا خیر.

⦁ در غیر اینصورت، مرورگر درخواستی را به سرور محلی DNS شما ارسال می کند. (که معمولاً توسط ISP شما ارائه می شود).

⦁ سرور محلی DNS به دنبال جزئیات نام دامنه است. اگر هیچ اطلاعاتی ندارد، باید سرور نام ریشه دامنه را پیدا کند.

⦁ برای یافتن سرور، سرور DNS آدرس URL را به چند قسمت تقسیم کرده و از راست به چپ می رود. بنابراین برای www.example.com URL را به “com” ، “example” و “www” تبدیل می کند.

⦁ سرور DNS به سرور نام ریشه DNS متصل می شود، تا محل سرور قسمت اول دامنه را بیاموزد: “.com”. این به عنوان سرور نام سطح دامنه سطح بالا (TLD) شناخته می شود.

⦁ سرور DNS به سرور TLD متصل می شود.

⦁ سرور دی‌ان‌اس از TLD name server، جزئیات name server را خواهد پرسید که شامل جزئیات نام دامین یعنی “example” باشد.

⦁ دراین مرحله ، سرور DNS از سرور نام اطلاعات مربوط به example.com را می خواهد و نام سرور با آدرس IP دامنه برمی گردد.

سرور dns

 

ایجاد اتصال DNS بسیار مهم است زیرا اولین قدم برای دسترسی به یک وب سایت است. اگر Google نتواند اتصال DNS برقرار کند، دسترسی به وب سایت شما را نمی تواند پیدا کند.

Google دو نوع خطای DNS دارد:

⦁ مهلت زمانی DNS : (DNS Timeout)
سرور DNS شما به سرعت به درخواست Google پاسخ ندهد.

⦁ جستجوی DNS: ( DNS Lookup)
Google قادر به دسترسی به وب سایت شما نبوده است، زیرا سرور DNS شما نتوانسته نام دامنه شما را پیدا کند.

ویکی دمی توصیه می کند اگر Google نمی تواند سایت شما را با استفاده از ابزارFetch as جستجو یا خزش کند، با ارائه دهنده DNS و به سراغ DNS Provider بروید و با آنها تماس بگیرید.

در مجموع اولین روشی که گوگل برای رفع خطای DNS پیشنهاد می‌دهد استفاده از Fetch as Google هست که به شما می‌گه Googlebot چطور در صفحات سایت شما جستجو و خزش می‌کند. حالا وقتی که شما فقط دنبال خطای DNS با سرعت بالا هستین می‌توانید عمل fetch رو بدون render انجام بدهید.

⦁ خطاهای سرور

خطاهای سرور با خطاهای DNS متفاوت است. منظور آنها این است که Google توانسته است URL شما را در سرور DNS جستجو کند. با این وجود، به دلیل مشکل سرور، نمی تواند صفحه را بارگیری کند.

  تفاوت صفحات doorway، orphan و dead end

این معمولاً به این معنی است که پاسخ دادن به سرور شما خیلی طولانی شده و درخواست Google به پایان رسیده است. Google فقط زمان مشخصی را به انتظار پاسخ سرور اختصاص خواهد داد، و اگر این انتظار خیلی طولانی شود ، ربات گوگل تسلیم می شود.

مانند خطاهای DNS ، خطای سرور برای وب سایت شما یک معضل بزرگ است. این بدان معنی است که مشکلی در سرور شما رخ داده است که مانع دسترسی کاربران و ربات ها به وب سایت شما می شود.

انواع مختلفی از خطاهای سرور وجود دارد:

⦁ وقفه زمانی (Timeout):

پاسخگویی به درخواست Googlebot به سرور خیلی طولانی شود.یعنی وقفه‌ای در ارتباط به وجود آمده و سرور شما در زمان مقرر به درخواست گوگل پاسخ نداده است.

⦁ سرصفحه یا هدرهای ناقص (Truncated headers):

سرور شما اتصال خود را قبل از ارسال سرصفحه های کامل، قطع کرد. در واقع گوگل می‌تواند به سرور شما متصل شود اما اتصال قبل از ارسال‌های headers قطع شد.

⦁ تنطیم مجدد اتصال ( Connection reset):

Google توانست به سایت شما متصل شود، اما چیزی دریافت نکرد، زیرا اتصال در اواسط پاسخ بازنشانی شد.

⦁ پاسخ ناقص (Truncated response):

سرور شما قبل از اینکه گوگل بتواند اطلاعات را کامل دریافت کند، قطع‌شده است.

⦁ اتصال رد شد (Connection refused):

سرور شما از اتصال با Googlebot خودداری کرد.  گوگل نمی‌تواند به سرور سایت شما دسترسی پیدا کند زیرا هاست شما ممکن است Googlebot را مسدود کرده باشد و یا مشکلی با تنظیمات فایروال داشته باشد.

⦁ اتصال ناموفق بود (Connect failed):

شبکه سرور شما از کار افتاده یا غیرقابل دسترسی است و گوگل قادر به اتصال به سرور سایت شما نیست.

⦁ وقفه اتصال (Connect timeout):

پردازش اتصال نیز طول کشید و گوگل نمی‌تواند با سرور سایت شما اتصال برقرار کند.

⦁ بدون پاسخ (No response):

قبل از ارسال هرگونه پاسخ، ارتباط با سرور شما پایان یافت. گوگل می‌تواند به سرور شما وصل گردد اما قبل از ارسال داده‌های موردنیاز، ویکی دمی پیشنهاد می کند که برای یافتن منابعی درباره نحوه عیب یابی هر نوع خطای سرور، به مقاله راهنمای Google مراجعه کنید.

ادامه دارد…..

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

*
*

4 − سه =