چند نکته مهم در رابطه با سئو ( مرحله ۲ )

بازدید: 2110 بازدید

چند نکته مهم در رابطه با سئو

 

با سلام خدمت دوستان عزیز :

این آموزش برای کسانی که علاقه مند به جوملا هستن و کار می کنند خیلی بیشتر تاثیر دارد و برای دیگر افراد نیز بی تاثیر نیست و نکات کلیدی سئو خیلی خوب و جالبی بیان شده است…..

 

فایل robots.txt :

Crawlerها این توانایی را دارند که به یک وب سایت آسیب وارد نمایند. ولی با انجام یک سری اقدامات می توان رفتار آن ها را کنترل نمود. این اقدامات به وسیله robots.txtصورت می گیرد. فایل robots.txt یک عنصر واقعی ، مهم و تاثیر گذار است که شما بر روی آن کنترل دارید. این فایل در rootسایت شما قرار می گیرد. این فایل حاوی دستور العمل های ضروری و مهمی می باشد که وظیفه کنترل Crawlerها را بر عهده دارد و به آن ها می گوید چه قسمتی از سایت شما را ایندکس کنند و چه قسمت هایی را ایندکس نکنند. برای ایجاد ارتباط با Crawlerها باید از دستورالعملی خاصی استفاده نمایید که آن ها متوجه شوند. در بیش تر فرم های این فایل از دستور زیر استفاده می کنیم:

User-agent: *
Disallow: /

این دو قسمت خیلی ضروری و مهم می باشند. قسمت اول یعنی : User-agentبیانگر فرمان شما به Crawlerها می باشد. نشان ستاره)*( نشان می دهد که تمام و انواع Crawlerها را پوشش می دهد ولی این قابل کنترل و تغییر توسط شما می باشد و می توانید تنها به یک یا چند Crawlerاجازه ارتباط دهید.


قسمت دوم یعنی
: Disallowبه Crawlerمی گوید که به چه قسمت هایی اجازه دسترسی ندارد. و علامت اسلش ( / ) نشان دهنده تمام داریکتوری ها می باشد. پس این قسمت به Crawlerمی گوید از ایندکس کردن داریکتوری ها چشم پوشی کن.


علامت () : بیانگر این موضوع است که
Crawlerها با دستور مهمی روبه رو هستند و باید به آن توجه کنند. معمولا از Crawlerها خواسته می شود که از اکثر دایرکتوری ها صرفه نظر کنند. به عنوان مثال اگر بخواهید که به Crawlerها اعلام نمایید که از دایرکتوری های موقتی چشم پوشی نماید به صورت زیر عمل می نماییم:

User-agent: *
Disallow: /tmp/

و شاید شما بخواهید از دایرکتوری های بیشتری چشم پوشی شود:

User-agent: *
Disallow: /tmp/
Disallow: /private/

Disallow: /links/listing.html

 

 

 

در دستور بالا از Crawlerها خواسته می شود که از دایرکتوری های موقت و شخصی و همچنین صفحاتی که شامل لینک ها است چشم پوشی نمایند. نکته ای که همیشه باید در ذهن داشته باشید این است که Crawlerها فایل robots.txtرا از بالا به پایین می خوانند پس اگر شما می خواهید یک سری فرمان بنویسید باید به چگونه نوشتن آن دقت کنید.


به مثال زیر توجه کنید:

User-agent: *
Disallow: /tmp/
User-agent: CrawlerName
Disallow: /tmp/
Disallow: /links/listing.html

اگر توجه کنید می بینید که در یک فرمان به تمام Crawlerها اجازه دسترسی و ارتباط داده اید و در فرمانی دیگر تنها به یک Crawlerخاص. در این جا آن Crawlerخاص فرمان را نخواهد انجام داد زیرا قبل از آن شما اجازه ارتباط به تمام Crawlerها را داده اید.
صحیح دستور بالا به صورت زیر می باشد:

User-agent: CrawlerName
Disallow: /tmp/
Disallow: /links/listing.html
User-agent: *
Disallow: /tmp/
User-agent: CrawlerName
Disallow: /tmp/
Disallow: /links/listing.html
User-agent: *

Crawlerهای موتورهای جست جو متفاوت دارای نام های متفاوتی هستند که اگر شما logوب سرور را بررسی کنید احتمالا نام آن ها را مشاهده خواهید نمود. برخی از آن ها در لیست زیر آورده شده است:

Google: Googlebot
MSN: MSNbot
Yahoo! Web Search: Yahoo SLURP or just SLURP
Ask: Teoma
AltaVista: Scooter
LookSmart: MantraAgent

WebCrawler: WebCrawler
SearchHippo: Fluffy the Spider

متا تگ Robots :

وقتی که از متا تگ Robotsاستفاده می نمایید این امکان را برای Crawlerها فراهم می نمایید که به جای استفاده از فایل robots.txtاز این تگ استفاده نمایند و با سایت شما ارتباط برقرار نمایند. متا تگ robotsقطعه کدی به صورت HTMLمی باشد که در تگ > <HEADسایت شما قرار می گیرد. این متا تگ برای کسانی که می خواهند از داخل سایت Crawlerها را کنترل نمایند مناسب می باشد.
به مثال زیر توجه نمایید:

<html>
<head>
<meta name=”robots” content=”noindex, nofollow”>
<meta name=”description” content=”page description.”>
<title>
Web Site Title
</title>
</head>
<body>

کد بالا بیانگر این می باشد که Crawlerها نباید محتویات سایت را ایندکس نمایند و نباید لینک های سایت را دنبال نمایند.
به مثال های زیر نیز توجه نمایید:

<meta name=”robots” content=”index,follow”>
<meta name=”robots” content=”noindex,follow”>
<meta name=”robots” content=”index,nofollow”>
<meta name=”robots” content=”noindex,nofollow”>

تفاوت عمده ای که بین فایل robots.txtو متاتگ های robotsوجود دارد این است که متا تگ robotsاین امکان را برای ما فراهم نمی کند که Crawlerخاصی را انتخاب نماییم و همچنین در برابر با robots.txtدارای دقت خیلی کم تری می باشد.


خیلی از
Crawlerها هستند که نه فایل robots.txtو نه متاتگ های robotsرا می شناسند و شما نیز نمی توانید کنترلی بر روی آن ها داشته باشید. همانطور که Crawlerها می توانند موجب ایندکس شدن صفحات شما شوند ، همچنین می توانند در صورتی که درست کنترل و هدایت نشوند موجب آسیب به سایت شما شوند.

 

فایل استاندارد robots.txt برای جوملا :

به صورت استاندارد فایل robots.txtبرای جوملا به صورت زیر می باشد:

User-agent: *
Disallow: /administrator/
Disallow: /cache/
Disallow: /components/
Disallow: /images/
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Disallow: /libraries/
Disallow: /media/
Disallow: /modules/
Disallow: /plugins/
Disallow: /templates/
Disallow: /tmp/
Disallow: /xmlrpc/

همانطور که مشاهده می کنید بعضی از دایرکتوری های خاص برای موتورهای جستجو بلوکه شده اند.

 

 

 

در ادامه با ما باشید……..