مضرات محتوای تکراری در 2020
مضرات محتوای کپی برای سایت چقدر است؟ آیا با محتوای کپی پنالتی می شویم؟ تا چه حد محتوا کپی باشد موردی ندارد؟ تشخیص محتوای تکراری توسط گوگل چگونه انجام می شود؟ بدترین تاثیر duplicate content چیست؟ چطور می توانیم جریمه محتوای کپی وبسایت را برطرف کنیم؟ اگر هر یک از سوالات و مشکلات بالا برای شما هم پبش آمده است و جواب قطعی برایش ندارید، این مقاله ی ویکی دمی را از دست ندهید.
تعریف جامع محتوای تکراری
به محتوایی که در بیش از یک آدرس اینترنتی (url) ظاهر شود اصطلاحا محتوای تکراری یا duplicate content می گویند.
به طور کلی وقتی از یک صفحه با محتوای یکسان، چندین نسخه جداگانه ساخته شود، یا اینکه یک محتوا در چند دامنه مختلف وجود داشته باشد، مشکل محتوای تکراری یا همان duplicate contet به وجود می آید. برای مثال وقتی صفحه ای از یک مقاله، با چهار نسخه ی بدون www ، با www، با https و بدون https منتشر شود، بعلت دارا بودن چهار صفحه با محتوای کاملا یکسان ولی با آدرس های متفاوت، قطعا موضوع تکراری بودن محتوا به میان می آید و این طور نیست که فرض کنید چهار صفحه مجزا برای سایت خود ایجاد کرده اید.
پنالتی محتوای تکراری وجود ندارد!
اجازه دهید یک بار برای همیشه این قضیه را حل کنیم: هیچ چیز به معنای “مجازات یا پنالتی محتوای تکراری” نیست. حداقل ، به شکلی که اکثر مردم تصور می کنند معنی ندارد. پنالتی شدن جزء مضرات محتوای تکراری به حساب نمی آید. این حرف را ما نمی گوییم! چیزی است که توسط خود گوگل اعلام شده و بار دیگر امسال در وبلاگ moz دوباره اعلام شد. حالا سوال زیر پیش می آید که در نهایت محتوای تکراری چه جریمه ای دارد؟
جریمه محتوای تکراری چیست؟
هنگامی که چندین نسخه تکراری و بسیار مشابه هم، یا اصطلاحا appreciably similar از یک محتوا وجود داشته باشد و گوگل آن را در بیش از یک آدرس اینترنتی مشاهده کند، تصمیم گیری برای موتورهای جستجو کمی دشوار می شود. چون نمی توانند تصمیم درستی بگیرند که کدام نسخه به کوئری سرچ (عبارت مورد جستجو) مرتبط تر است؟ و به کدامیک باید رتبه دهند؟ همچنین تمامی معیارهای رتبه بندی، اعم از اعتبار صفحه (PA)، لینک های داخلی و انکرتکست و … را برای کدام نسخه باید درنظر بگیرند و در کدام نسخه های دیگر حذف کنند؟
پس جریمه محتوای تکراری چه می شود؟ در واقع این جریمه در افت رتبه بندی یا اصطلاحا رنک صفحات در نتایج جستجو تاثیر گذار است،
علل ایجاد محتوای تکراری
- داشتن نسخه های متعدد از یک صفحه تکراری
- دارا بودن 4 نسخه متفاوت با آدرس های متفاوت مانند: با www ، بدون www، با http و بدون https
برای این موضوع، باید شما نسخه اصلی صفحه خود را که می خواهید با آن رنک بگیرید به موتور جستجو معرفی کنید تا فقط نسخه اصلی مورد الویت و رتبه دهی گوگل قرار گیرد. بهترین راه جلوگیری از محتواهای تکراری در این موارد، مشخص کردن آدرس کنونیکال (canonical) یا کانونی صفحه اصلی است.[irp]
پارامترهای url
پارامترهای یوآرال (url)، هر کدام به صورت جداگانه، یک آدرس جدید به موتورجستجو معرفی می کنند که محتوای اصلی تمامی صفحات آنها یکسان است. پس نیازی به ایندکس و رتبه دهی صفحات حاوی url نیست و فقط صفحه اصلی حائز اهمیت است. بنابراین این صفحات باید نوایندکس (noindex) شوند.
Session ID
زمانی که هر بازدید کننده از صفحه ای دیدن می کند، یک Session ID متفاوت دریافت می کند و این شناسه در آدرس سایت نمایان شده و به عنوان یک صفحه جدید با محتوای تکراری ساخته می شود. این صفحات نیز بایستی ایندکس نشوند.
نسخه های صفحه موبایل یا صفحات AMP
صفحات AMP (نسخه های پرسرعت موبایل هستند که فقط با کاهش یک سری کدهای HTML، سرعت لود سریع تری در گوشی های تلفن همراه دارند) علی رغم url های جداگانه، دارای محتوای یکسان با دسکتاپ هستند، اما بدلیل دارا بودن آدرس های اختصاصی AMP، دارای معضل ایجاد محتوای تکراری هستند.
صفحات چندزبانه
صفحات مجزا برای هر زبان، در سایت های چندزبانه نیز نوعی دیگر از محتوای تکرای به حساب می آید. دلیل آن شناخت سریع محتوای ترجمه شده توسط گوگل است. برای حل این مشکل باید از تگ پیشنهادی خود گوگل یعنی hreflang استفاده کرد.
مهم ترین مضرات محتوای تکراری
- سردرگمی ربات های موتور جستجو در خزش صحیح صفحات و رتبه بندی به نسخه اصلی هر صفحه
- تقسیم رتبه در بین صفحات تکراری و افت شدید رتبه در نسخه اصلی صفحه
- اسپم شناخته شدن وب سایت و کاهش تدریجی اعتبار صفحات
- افت اعتبار دامنه به تدریج و با گذشت زمان.
روش های تشخیص محتوای کپی
اولین روش، کپی کردن بخشی از محتوای صفحه در باکس جستجوی گوگل است. شما می توانید تا دو خط از یک پاراگراف را در جعبه جستجوی گوگل جستجو کنید و در نتایج بدست آمده به دنبال لینک صفحه خود بگردید. اگر لینک صفحه شما پایین تر از بقیه بود و جژء لینک یک نتایج نبودید، باید به محتوای خود شک کنید و شروع به بررسی محتوا کنید. چون اگر محتوای شما کپی نبود باید به عنوان اولین لینک مرجع در نتایج نمایان می شدید.
دومین روش، استفاده ازابزارهای تشخیص محتوای کپی است. در این روش با کپی کردن محتوای صفحه خود و یا کپی آدرس صفحه، درصد محتوای کپی را می توانید مشاهده کرده و حتی در بعضی از این ابزارها، آدرس منابعی که محتوای شما از آنها کپی شده نیز مشخص است. به این ترتیب می توانید متوجه میزان محتوای کپی صفحات خود شوید.
ابزارهای تشخیص محتوای کپی
اولین ابزاری که قصد معرفی آنرا داریم ابزار duplicate checker است. این ابزار یکی از محبوب ترین و کاربردی ترین ابزارهای تشخیص محتوای کپی است. روش استفاده به این صورت است که با کپی کردن لینک صفحه، درصد محتوای یونیک و کپی شده را مشاهده می نمایید. در این ابزار، لینک صفحاتی که کپی برداری شده اند نیز قابل رویت بوده و حتی کلمات و جملاتی که کپی شده اند نیز هایلایت می شوند و بدین ترتیب محتوای کپی کاملا مشخص خواهد شد.
ابزار دوم siteliner است که نسبت به ابزار قبلی دارای یک سری ویژگی ها و معایب است: از جمله ویژگی های این ابزار، بررسی تعداد لینک های داخلی و خارجی هر محتوا است و اگر لینک شکسته باشد شناسایی می کند. اما این ابزار نمی تواند صفحه خاصی را بررسی کند ونحوه کار آن به این صورت است که تعداد 250 صفحه از وب سایت را به همراه درصد محتوای کپی، متوسط تعداد کلمات هر صفحه، درصد محتوای اورجینال صفحه و.. اعلام می کند.
اگر این دو ابزار برای شما کارایی خوبی ندارد یا اینکه علاقمند هستید با ابزارهای جدیدتری برای کشف محتوای تکراری آشنا شوید، پیشنهاد می کنیم مقاله بهترین ابزارهای تشخیص محتوای کپی را مطالعه کنید.
ناگفته نماند که الگوریتم پاندا با محتواهای تکراری بسیار برخورد خواهد کرد، پس بهتر است قبل از نوشتن محتوا حتما به نکاتی که پاندا برای جلوگیری از پنالتی خود اعلام کرده است، رجوع نمایید.
چگونه از مضرات محتوای تکراری جلوگیری کنیم؟
اگر خواسته یا ناخواسته محتوای صفحات شما duplicate شده است، باید شروع به یک سری اقدامات کنید تا از مضرات محتوای تکراری در امان بمانید. این اقدامات به صورت خلاصه در زیر بیان شده:
ریدایرکت 301
وقتی چند نسخه از یک صفحه دارید، می توانید با انتقال دائم تمامی صفحات متفرقه به صفحه اصلی، موتورهای جستجو را متوجه آن کنید. به این ترتیب بعد از مدتی صفحات متفرقه از رده خارج شده و مشکل محتوای تکراری این صفحات برطرف می شود.
تگ کنونیکال
با تگ rel-canonical به موتورهای جستجو، نسخه کانونی یا اصلی هر صفحه را اعلام کنید تا یک تمایز بین چند صفحه مشابه به وجود بیاید و در نتیجه تمرکز خزنده گوگل فقط روی نسخه اصلی باشد و بقیه نسخه ها را نادیده بگیرد.
چرا بعضی از سایت های حاوی محتوای تکراری افت نمی کنند؟
بارها شده این سوال در ذهن خیلی از کاربران پیش آید که چرا بعضی از وب سایت ها، بخصوص وبسایت های خبری، با درج محتواهای کاملا کپی، مضرات محتوای تکراری متوجه این وب سایت ها نمی شود ؟ ما در این سوال، جواب های کوتاه و مختصری را در زیر ذکر می کنیم. جالب است بدانید که دلایل زیر از عمده ترین علل عدم افت رتبه سایت های کپی است:
- عمر دامنه طولانی (عمر دامنه طولانی یک نوع ارزش بیشتر نزد متور جستجو است).
- دامین آتوریتی یا اصطلاحا اعتبار دامنه بالا
- تولید و انتشار محتوا در تعداد بسیار بالا (از هر 100 محتوا اگر تقریبا 30 محتوا کپی باشد، گوگل بدلایل ذکر شده در بالا، برای اینگونه وب سایت ها خیلی سختگیری نمی کند و در مقابل محتوای تکراری آنها افت رتبه ای را ایجاد نمی کند.
در صورتی که با الگوریتم های گوگل مانند پاندا آشنایی ندارید، می توانید مقاله الگوریتم های گوگل را مشاهده نمایید.
امیدوارم این مقاله توانسته باشد، به سوالات بعضی از دوستان پاسخ دهد، لطفا نظرات خود را برای ما ارسال نمایید.
دیدگاهتان را بنویسید