בדיוק כמו הנושא של הקידומת  (אם או בלי www), כל כפילות של תוכן באתר שלכם יכולה לגרום לנזק בדירוג שלכם במנועי החיפוש. אתם, כמבון, צרכים לדאוג שהתוכן שלכם הוא יחודי ואינו מועתק ממקום אחר, או נמצא בשימוש חוזר בחלק אחר של האתר שלכם. כמו כן עליכם לדאוג שלא ניתן להגיע לאותו עמוד משתי כתובות שונות (או יותר).

רוב מערכות ניהול התוכן (CMS) סובלות מעניין זה וג'ומלה היא אחת מהן. גם כאשר הפעלת את האפשרות של כתובות ידידותיות בהגדרות הכלליות של המערכת הכתובות הלא ידידותיות עדיין קיימות. זה אומר שתי כתובות עם אותו תוכן, ולעתים גם יותר. כפילויות של תוכן קיימות בגלל הסיבות הבאות::

  • הנושא של אם או בלי www כפי שכבר נידון במאמר הקודם.
  • עמודים שמסתיימים עם index.html, index.php, וכדומה, אשר מציגים את אותו תוכן של עמוד שאין לו את החלק של 'index'.
  • פרמטרים בכתובת, כדוגמת ..../page1?font-size=large
  • לוכסנים מסימים (מפועים בסוף הכתובת ולמעשה אין להם משמעות)
  • לעתים גם שימוש מעורב באותיות קטנות וגדולות.
  • ג'ומלה באופן מיוחד: אותו מאמר המופיע בשתי הגדרות של פריטי תפריט שונים
  • ניתן לגשת לכתובות לא ידידתותיות למרות שהופעלה התכונה של כתובות ידידותיות.

קיומם של דפים שניתן לגשת אליהם מיותר מכתובת אחת גורם לנזק לדרוג שלכם, לכן חשוב לטפל בכך ולמנוע זאת. ניתן לבצע זאת בדרכים רבות. בחלקם ניתן להשתמש כמו שהם, אבל ניתן גם לשלב כמה טכניקות בכדי להמנע מכל כפילות:

1: הגדרת תג קנוני לעמוד המתאים

הגדרת תג קנוני לעמוד המתאים, כך שכתובות לא ידידותיות לא יאונדקסו. יש דרכים לעשות זאת, אבל הן יעילות רק למשתמשים מנוסים. ביצוע שגוי יכול לגרום לתוצאה ההפוכה. הדרך הקלה ביותר לבצע זאת היא להשתמש בהרחבה. לרוב ההרחבות של כתובות ידידותיות יש את היכולת הזאת.

אם התג מוגדר נכון, כל הכתובות הכפולות של דפי הג'ומלה יכילו את התג בחלק של הכותרת ה-HTML-ית  של העמוד, כמו בדוגמא של העמוד בו אתם צופים (הערה: השארתי את כתובת המקור של המאמר). ניתן להגיעה אליו בשתי צורות:

הכתובת הראשונה מופנית נכון, אבל היא לא הייתה כזאת, הדרת כתובת קנונית תספר לגוגל שאלו אותם דפים על פי הכתובת הידידותית:

<link href="/Checklist/avoid-duplicate-url-s" rel="canonical"/>

שימוש בטכניקה זאת, מונע מקבלת כתובות כפולות לאותו עמוד לאידוקס נכון על ידי גוגל, למרות שעדיין ניתן לגשת אליהם ביותר מכתובת אחת. 

המקום היחידי שאת יכולים להגדיר זאת בג'ומלה הוא ברמה של ההתקן System - SEF. זה מאפשר לכם להגדיר את שם הדומיין של האתר (Site Domain). אבל, הוא ישים רק למקרים של שימוש במצב של אותו אתר המופעל ממפר שמות דומיין:

system-sef-plugin-canonical

אליכם לשים לב שכעת (ג'ומלה 3.2, תוקן בגירסה 3.2.1), יכולות להיות בעיות עם הדרך בה ג'ומלה מטפלת הכתובות קנוניותt. יתכן ותצטרכו להשתמש ברחבה בכדי לטפל בהם בדרך שלכם.

2: שימוש בהפניות 301

שימוש בהפניות 301, פרושה, שאתם אומרים לגולש אליכם לכתובת כזאת: כתובת זאת עברה באופן קבוע, אנא, השתמשו בכתובת השניה:

http://joomla-seo.net/index.php?option=com_content&Itemid=125&catid=15&id=18&lang=en&view=article

הגולש יועבר לכתובת:

http://joomla-seo.net/Checklist/avoid-duplicate-url-s

אתם יכולים ליישם את הפניית 301 בעזרת קובץ .htaccess, או על ידי שימוש בהרחבה, כמו ReDJ, שהיא הרחבה פשוטה ויפה למטרה זאת.

עוד מידע על הפניות 301 ניתן למצוא במאמר על כיוונון מחדש של כתובות ישנות.

3: הגדרת חוקים בקובץ .htaccess

שימוש בקובץ .htaccess מאפשר לכם לכם לפתור את רוב המקרים של כתובות כפולות (מתוך הנחה שאפשות הכתיבה של כתובות מופעלת). דנו כבר בכך במאמר של כתובות אם וללא הקידומת www, אבל אתם יכולים להשתמש בכך בכדי להמנע מלוכסן בסוף הכתובת:

RewriteEngine On
RewriteCond %{REQUEST_FILENAME} !-f
RewriteCond %{REQUEST_FILENAME} !-d
RewriteRule ^(.+)/$ http://%{HTTP_HOST}/$1 [R=301,L]

ושוב, בדקו שאכן הלוכסנים מוסרים מסוף הכתובת אם הופיעו ושהאתר שלכם עובד ללא בעיה ולא נוצרו תקלות. תמיד צריך להיות זהיר עם השינויים בקובץ .htaccess!

בעיה דומה יכולה להיווצר כאשר יש פרמטרים בכתובת, דבר שיוביל לכך שגוגל ייתחס לעמוד זה כאילו אלו שני עמודים שונים, לדוגמא:

4: הגדרת הקובץ robots.txt

אתם יכולים להגדיר את הקובץ robots.txt בדרך כזאת שיאסרו על כתובת משתנים שמשתמשים בתו '?' מלהכנס לתהליך האינדוקס של האתר, במאמר אודות robots.txt תוכלו למצוא את הקוד. הוא מונע בעיות עם כתובות כפולות במניעת גישה לכתובות לא ידידותיות, ובאתו הזמן גם לכתובות עם פרמטרים, כמו בדוגמא הבאה:

5: שימוש בהרחבה

באתרים קטנים, מניעת כפיליות יכולה להתבצע בקלות על ידי שימוש בקובצים .htaccess, robots.txt,  וכנראה גם הרחבה קטנה עבור הפניות 301 אבל באתרים גדולים שימוש בהרחבות שתומכות בכתובות ידידותיות, יהיה יעיל יותר. זה לוקחזמן לילמוד כיצד הרחבות אלו פועלות, לכן התחילו לנסות אותן באתר שלכם שהוא לא כל כך חשוב. אם השימוש בהן הוא נכון, כל הכתובות הכפולות יעלמו מהאתר שלכם. אבל אם השימוש יהיה שגוי או לא נכון התוצאה יכולה להיות הפוכה.
כמה מההרחבות הידועות של כתובות ידידותיות:

בידקו באתר של המאמר המקורי, ב-אזור ההרחבות שלו על אינפורמציה אודות הרחבות אלו ואחרות.

6: כלי מנהלי אתרים של גוגל

שיוש ב-Google Webmaster Tools היא דרך אפשרית להפטר מכל הכתובות הכפולות. עדיף להשתמש בכל הטכניקות שתוארו בכדי להמנע מקיומה של בעיה זאת וגילויה בכלי מנהלי האתרים, וגם אם מצאתם כתובת כפולה, חיזרו אחרוה לשלבים הקודמים ובידקו את ההגדרות שלכם. למרות זאת, יתכן ולא תוכלו והמנע מהופעתה של בעיה זאת של כתובות כפולות.

הערה: אל תיבהלו אם אתם רואים הערת הזהרה בכלי מנהלי אתרים  על בעיה כזאת או דומה לה.. במיוחד באתר חדש, גוגל מגלה את הבעיה, אבל בדרך כלל, בעיקר עם פרמטרים, לומד שאלו לא עמודים שונים, וההזהרות יעלמו לאחר מספר שבועות.... התמקדו בבעיות האחרות אבל זכרו שזה נושא מרכזי ומתקדם. לאינפורמציה קראו את המאמר הבא בנושא.

דרכים נוספות לטיפול בכתובות כפולות ניתן למצוא במאמר שהתפרסם לא מזמן ב-Joomla Magazine.

מאמר זה הינו תרגום של מאמר שנכתב על ידי Simon Kloostra. ניתן לקרוא את המקור כאן

הדגמות

הדגמת ג'ומלה

בקרוב, הדגמת רכיבים ומודולים...