תוכן משוכפל: סיבות ופתרונות

למנועי חיפוש כמו גוגל יש בעיה – זה נקרא 'תוכן משוכפל'. תוכן משוכפל פירושו שתוכן דומה מופיע במספר מיקומים (כתובות URL) באינטרנט, וכתוצאה מכך מנועי חיפוש אינם יודעים איזו כתובת URL להציג בתוצאות החיפוש. זה יכול לפגוע בדירוג של דף אינטרנט, והבעיה רק ​​מחמירה כאשר אנשים מתחילים לקשר לגרסאות השונות של אותו תוכן. גם אם אינך מומחה וורדפרס, מאמר זה יעזור לך להבין את הגורמים השונים לתוכן כפול, ולמצוא את הפיתרון לכל אחד מהם.

מהו תוכן משוכפל?

תוכן משוכפל הוא תוכן הזמין במספר כתובות באתרים באינטרנט. מכיוון שיותר מכתובת אתר אחת מציגה את אותו תוכן, מנועי החיפוש אינם יודעים איזו כתובת URL לדרג גבוה יותר בתוצאות החיפוש. לכן הם עשויים לדרג את שתי כתובות האתרים נמוכות יותר ולהעניק עדיפות לדפי אינטרנט אחרים.

במאמר זה נתמקד בעיקר בגורמים הטכניים לתוכן משוכפל ובפתרונות שלהם על מנת שתוכלו בתור מומחי קידום אתרים לדרג את האתר שלכם גבוה יותר במנועי החיפוש.

בואו נמחיש זאת בדוגמה

ניתן לדמות תוכן משוכפל לאדם העומד בצומת דרכים בו יש תמרורים המצביעים לשני כיוונים שונים לאותו יעד: באיזו דרך עליכם לנסוע? כדי להחמיר את המצב, היעד הסופי שונה גם הוא, אך רק במעט. כקורא, לא אכפת לך כי אתה מקבל את התוכן שאותו רצית, אך מנוע החיפוש צריך לבחור איזה עמוד להציג בתוצאות החיפוש מכיוון שהוא כמובן לא רוצה להציג את אותו התוכן פעמיים.

נניח שהמאמר שלך על 'מילת מפתח x' מופיע בכתובת http://www.example.com/keyword-x/ ואותו תוכן מופיע גם ב http://www.example.com/article-category/keyword-x/. מצב זה אינו פיקטיבי: זה קורה בהרבה מערכות ניהול תוכן מודרניות. נניח שהמאמר שלך נאסף על ידי כמה בלוגרים וחלקם מקשרים לכתובת האתר הראשונה, בעוד שאחרים מקשרים לשני. התוכן המשוכפל הוא הבעיה שלך מכיוון שקישורים אלה מקדמים כתובות אתרים שונות. אם כולם היו מקשרים לאותה כתובת אתר, הסיכוי שלך לדירוג 'מילת מפתח x' היה גבוה יותר.

 

הסיבות לתוכן משוכפל

ישנן עשרות סיבות לתוכן משוכפל. רובם טכניות: לא פעם אדם מחליט לשים את אותו התוכן בשני מקומות שונים מבלי להבהיר מהו המקור. אלא אם כן שיבטתם פוסט ופרסמתם אותו בטעות כמובן. אבל אחרת, זה מרגיש לא טבעי עבור רובנו.

ישנן סיבות טכניות רבות אך זה קורה בעיקר משום ש-בוני האתרים שלכם אינם חושבים כמו דפדפן או אפילו משתמש, שלא לדבר על עכביש מנועי חיפוש – הם חושבים כמו מתכנת. קח את המאמר שהזכרנו קודם, המופיע בכתובת וב http://www.example.com/keyword-x/http://www.example.com/article-category/keyword-x/. אם תשאל את המפתח, הוא יאמר לך שהוא קיים רק פעם אחת.

אי הבנה של המושג URL

לא, המפתח לא השתגע, הוא פשוט מדבר בשפה אחרת. CMS כנראה מפעיל את האתר, ובמאגר זה יש רק מאמר אחד, אך תוכנת האתר מאפשרת לאחזר את אותו מאמר במסד הנתונים באמצעות מספר כתובות אתרים. הסיבה לכך היא שבעיני המפתח, המזהה הייחודי לאותו מאמר הוא המזהה שיש למאמר במסד הנתונים, ולא כתובת ה- URL. אך עבור מנוע החיפוש, כתובת האתר היא המזהה הייחודי לפיסת תוכן. אם תסביר את זה למפתח, הוא יתחיל להבין את הבעיה. ואחרי שתקראו מאמר זה, תוכלו אפילו לספק לו פתרון מידי.

Session IDs

לעתים קרובות אתה רוצה לעקוב אחר המבקרים שלך ולאפשר להם, למשל, לאחסן פריטים שהם רוצים לקנות בעגלת קניות. כלומר, היסטוריה קצרה של מה שהמבקר עשה באתר שלך ויכולה להכיל דברים כמו הפריטים בסל הקניות שלהם. כדי לשמור על אותה הפעלה כאשר מבקר לוחץ מדף אחד למשנהו, צריך לשמור את המזהה הייחודי לאותו הפעלה – שנקרא Session ID – איפשהו. הפיתרון הנפוץ ביותר הוא לעשות זאת באמצעות עוגיות. עם זאת, בדרך כלל מנועי חיפוש לא מאחסנים קבצי Cookie.

בשלב זה, מערכות מסוימות חוזרות לשימוש בSession IDs  בכתובת האתר. המשמעות היא שכל קישור פנימי באתר מקבל את אותו Session ID לכתובת האתר שלו, ומכיוון שהוא ייחודי, הוא יוצר כתובת URL חדשה, ולכן בעצם יוצר תוכן משוכפל.

 

 

פרמטרים של כתובות אתרים המשמשים למעקב ומיון

סיבה נוספת לתוכן משוכפל היא שימוש בפרמטרים של כתובות אתרים שאינם משנים את תוכן הדף, למשל בקישורי מעקב. אתה מבין, עבור מנוע חיפוש, http://www.example.com/keyword-x/ ו- http://www.example.com/keyword-x/?source=rss אינם אותה כתובת אתר. זה האחרון עשוי לאפשר לך לעקוב מאיזה מקור אנשים הגיעו, אבל זה עלול גם להקשות עליך לדירוג טוב – תופעת לוואי מאוד לא רצויה!

זה לא נוגע רק לפרמטרים למעקב, כמובן. זה מתאים לכל פרמטר שאתה יכול להוסיף לכתובת אתר שאינה משנה את פיסת התוכן החיונית, בין אם פרמטר זה מיועד ל'שינוי המיון על קבוצת מוצרים 'או ל'הצגת סרגל צד אחר': כולם גורמים לשכפול תוֹכֶן.

הפצת תוכן

מרבית הסיבות לתוכן כפול הן 'האשמה' שלך או של האתר שלך. אולם לעיתים אתרים אחרים משתמשים בתוכן שלך, עם הסכמתך או בלעדיה. הם לא תמיד מקשרים למאמר המקורי שלך, ולכן מנוע החיפוש לא 'משיג' אותו ונאלץ להתמודד עם גרסה אחרת של אותו מאמר. ככל שהאתר שלך הופך פופולרי יותר, כך תקבל יותר העתקות תוכן וזה יהפוך את הבעיה לגדולה יותר ויותר.

סדר הפרמטרים

גורם שכיח נוסף הוא כי CMS אינו משתמש בכתובות אתרים נקיות ויפות, אלא בכתובות אתרים כמו /? Id = 1 & cat = 2, כאשר מזהה מתייחס למאמר וחתול מתייחס לקטגוריה. כתובת האתר /? Cat = 2 & id = 1 תניב את אותן התוצאות ברוב מערכות האתר, אך הן שונות לחלוטין עבור מנוע חיפוש.

 

דפים ידידותיים להדפסה

אם מערכת ניהול התוכן שלך יוצרת דפים ידידותיים להדפסה ואתה מקשר לאלה מדפי המאמר שלך, גוגל בדרך כלל תמצא אותם, אלא אם כן אתה חוסם אותם במפורש. עכשיו, שאל את עצמך: איזו גרסה אתה רוצה שגוגל תציג? זו עם המודעות והתוכן ההיקפי שלך, או זו שמציגה רק את המאמר שלך?

 

WWW לעומת ללא WWW

זה מהעתיקים בספר, אך לפעמים מנועי החיפוש עדיין טועים: WWW לעומת תכנים כפולים שאינם WWW, כאשר שתי הגרסאות של האתר שלך נגישות. סיטואציה אחרת ופחות נפוצה, אך כמו שראיתי גם היא HTTP לעומת HTTPS תוכן כפול, שם אותו תוכן מוגש על שניהם.

פתרון רעיוני: כתובת 'קנונית'

כפי שכבר ראינו, העובדה שמספר כתובות אתרים מובילות לאותו תוכן היא בעיה, אך ניתן לפתור אותה. אדם אחד שעובד בפרסום בדרך כלל יוכל לומר לך די בקלות מה צריכה להיות כתובת ה- URL 'הנכונה' עבור מאמר מסוים, אבל לפעמים כשאתה שואל שלושה אנשים באותה חברה, תקבל שלוש תשובות שונות …

זה בעיה שצריך לטפל בה מכיוון שבסופו של דבר יכולה להיות רק אחת כתובת אחת לכל עמוד (URL). כתובת אתר 'נכונה' זו עבור פיסת תוכן מכונה כתובת ה- canonical ידי מנועי החיפוש.

 

זיהוי נושאי תכנים כפולים

אולי לא ידוע לך אם יש לך סוגיה של תוכן משוכפל באתר שלך או עם התוכן שלך. השימוש בגוגל הוא אחת הדרכים הקלות ביותר לאתר תוכן משוכפל.

ישנם מספר מפעילי חיפוש שמועילים מאוד במקרים כאלה. אם תרצה למצוא את כל כתובות ה- URL באתר שלך המכילות את מילת המפתח X במאמר, הקלד את ביטוי החיפוש הבא ל- Google:

site: example.com intitle: "מילת מפתח X"

 

גוגל תציג בפניך את כל הדפים ב- example.com המכילים את אותה מילת מפתח. ניתן להשתמש באותה שיטה לזיהוי תוכן משוכפל ברחבי האינטרנט. נניח שהכותרת המלאה של המאמר שלך הייתה 'מילת מפתח X – למה זה מדהים', היית מחפש:

כותרת: "מילת מפתח X – למה זה מדהים"

 

וגוגל תיתן לך את כל האתרים שתואמים את הכותרת הזו. לפעמים כדאי אפילו לחפש משפט אחד או שניים מהמאמר שלך, מכיוון שמעתיקי תוכן מסוימים עשויים לשנות את הכותרת. 

 

פתרונות מעשיים לתוכן משוכפל

לאחר שהחלטת איזו כתובת URL היא כתובת ה- URL הקנונית עבור התוכן שלך, עליך להתחיל בתהליך של קנוניזציה (כן אני יודע, נסה לומר את זה שלוש פעמים מהר בקול). פירוש הדבר הוא שעלינו לספר למנועי החיפוש על הגרסה הקנונית של הדף ולתת להם למצוא אותו בהקדם האפשרי. ישנן ארבע שיטות שונות לפתרון הבעיה, לפי סדר עדיפות:

  1. לא ליצור תוכן משוכפל
  2. הפניית תוכן משוכפל לכתובת הקנונית
  3. הוספת רכיב קישור קנוני לדף בעל תוכן משוכפל
  4. הוספת קישור HTML מהדף המשוכפל לדף הקנוני

הימנעות מתוכן משוכפל

לחלק מהגורמים לעיל לתוכן משוכפל יש תיקונים פשוטים מאוד:

  • האם יש Session IDs בכתובות האתרים שלך?
    לרוב ניתן פשוט להשבית אותן בהגדרות המערכת שלך.
  • האם יש לך דפים כפולים ידידותיים להדפסה?
    אלה מיותרים לחלוטין: כדאי פשוט להשתמש בגיליון סגנון הדפסה.
  • האם אתה משתמש בעמוד תגובות בוורדפרס?
    אתה צריך פשוט להשבית תכונה זו (תחת הגדרות »דיון) ב 99% מהאתרים אם אתה משתמש בYOAST.
  • האם הפרמטרים שלך בסדר שונה?
    אמור למתכנת שלך לבנות סקריפט כדי להכניס תמיד פרמטרים באותו סדר.
  •  
  • יש לך בעיות WWW לעומת ללא WWW?
    בחר מאמר אחד ותישאר איתו על ידי הפניית אחד לשני. ניתן גם להגדיר העדפה בכלי מנהלי האתרים של גוגל, אך יהיה עליכם לתבוע את שתי הגרסאות של שם הדומיין.

אם עדיין לא הצלחת לתקן את הבעיה, עדיין כדאי להתאמץ. המטרה צריכה להיות שמנוע החיפוש לא יציג תוכן משוכפל, מכיוון שזה ללא ספק הפיתרון הטוב ביותר לבעיה.

301 הפניית תוכן משוכפל מחדש

במקרים מסוימים אי אפשר למנוע לחלוטין מהמערכת בה אתה משתמש ליצור כתובות אתרים שגויות לתוכן, אך לעיתים ניתן להפנותם מחדש . אם זה לא הגיוני בעיניך (מה שאני יכול להבין), זכור זאת בזמן שאתה מדבר עם המפתחים שלך. אם אכן תיפטרו מכמה מבעיות התוכן הכפולות, וודאו כי אתם מפנים את כל כתובות ה- URL המשוכפלות הישנות לכתובות האתר הקנוניות המתאימות.

שימוש בקישורים

 לפעמים אתה לא רוצה או לא יכול להיפטר מגרסה כפולה של מאמר, גם כאשר אתה יודע שזו כתובת ה- URL הלא נכונה. כדי לפתור בעיה מסוימת זו, מנועי החיפוש הציגו את אלמנט הקישור הקנוני. הוא ממוקם בקטע <head> של האתר שלך, והוא נראה כך:

<link rel = "canonical" href = "http://example.com/wordpress/seo-plugin/" />

בחלק href של את הקישור הקנוני, אתה מציב את כתובת האתר הקנונית הנכונה עבור המאמר שלך. כאשר מנוע חיפוש התומך בקנונית מוצא את אלמנט הקישור הזה, הוא מבצע הפניית 301, ומעבירה את רוב ערך הקישור שנאסף על ידי אותו דף לדף הקנוני שלך.

תהליך זה הוא מעט איטי יותר מניתוב מחדש של 301, כך שאם אתה יכול פשוט לבצע הפניה 301 שתהיה עדיפה, כפי שציין ג'ון מולר של גוגל.

 

 

קישור חזרה לתוכן המקורי

אם אינך יכול לעשות את כל האמור לעיל, יתכן כי אינך שולט בחלק <head> בסעיף באתר שבו התוכן שלך מופיע, הוספת קישור חזרה למאמר המקורי מעל או מתחת למאמר זה תמיד רעיון טוב. ייתכן שתרצה לעשות זאת בפיד ה- RSS שלך על ידי הוספת קישור חזרה למאמר בו מעתיקי תוכן מסוימים יסננו את הקישור, אך אחרים עשויים להשאיר אותו בפנים. אם גוגל תיתקל בכמה קישורים המצביעים על המאמר המקורי שלך, היא תבין מספיק מהר שזו הגרסה הקנונית בפועל.

מסקנה: ניתן לתקן שכפול תוכן, וחשוב מאוד לעשות זאת

שכפול תוכן קורה בכל מקום. טרם נתקלתי באתר המונה יותר מ -1,000 עמודים שלא נתקל בו לפחות בבעיית תוכן משוכפל זעירה. זה משהו שאתה צריך לפקוח עליו כל הזמן, אבל זה ניתן לתיקון, והתגמול גדול מאוד. התוכן האיכותי שלך יכול להמריא בדירוג, רק על ידי היפטרות מתוכן משוכפל באתר שלך!



השארת תגובה