Webmaster BG   SEO оптимизация

Go Back   Webmaster BG > Web Development > CMS

Reply
 
Thread Tools Display Modes
  #1  
Old 13-03-2010, 03:27 PM
Juve Juve is offline
Member
 
Join Date: Jul 2009
Posts: 95
Juve is on a distinguished road
Default robots.txt за wordpress

За да се избегне дублиране на съдържанието и индексирането на ненужни страници прочетох, че е добре robots.txt да изглежда така:

HTML Code:
    User-Agent: *
    Disallow: /cgi-bin
    Disallow: /awstats
    Disallow: /wp-admin
    Disallow: /wp-includes
    Disallow: /wp-content/plugins
    Disallow: /wp-content/cache
    Disallow: /wp-content/themes
    Disallow: /category
    Disallow: /author
    Disallow: /trackback
    Disallow: /*trackback
    Disallow: /*trackback*
    Disallow: /*/trackback
    Disallow: /*/trackback/$
    Disallow: /feed/
    Disallow: /feed/atom/
    Disallow: /feed/rss/
    Disallow: /*feed*
    Disallow: /*/rss/$
    Disallow: /*/feed/$
    Disallow: /*/feed/rss/$
    Disallow: /*/feed/atom/$
    Disallow: /rss/
    Disallow: /wp-register.php
    Disallow: /wp-login.php
    Disallow: /comments
    Disallow: /comments/feed/
    Disallow: */comments
    Disallow: /*/comments/feed/$
    
    Disallow: /*?*
    Disallow: /*?
    
    Disallow: /*.php$
    Disallow: /*.js$
    Disallow: /*.inc$
    Disallow: /*.css$
    Disallow: /*.gz$
    Disallow: /*.wmv$
    Disallow: /*.cgi$
    Disallow: /*.xhtml$
    
    Allow: /wp-content/uploads
    
     # allow google image bot to search all images
    User-agent: Googlebot-Image
    Disallow:
    Allow: /*

    # allow Google adsense bot on entire site
    User-agent: Mediapartners-Google*
    Disallow:
    Allow: /*
Понеже не съм 100% сигурен за някои неща, реших да го постна тук преди да съм сътворил простотията
Reply With Quote
  #2  
Old 13-03-2010, 03:35 PM
nbsp's Avatar
nbsp nbsp is offline
Senior Member
 
Join Date: Jan 2007
Posts: 2,612
nbsp is a jewel in the roughnbsp is a jewel in the roughnbsp is a jewel in the rough
Default Re: robots.txt за wordpress

Не знам от къде си го преписал това, но има неща които са тотално погрешни, като забраняване достъп на ботовете до RSS. Ако не знаеш какво означава всеки конкретен ред от писаните горе, по-добре изобщо не го прави.
Reply With Quote
  #3  
Old 13-03-2010, 03:39 PM
miraco miraco is offline
Senior Member
 
Join Date: Nov 2009
Posts: 295
miraco is an unknown quantity at this point
Default Re: robots.txt за wordpress

И на мен ще ми е интересно как да забраня в сайт за обяви с wordpress Гугъл да чете дублирано съдържание.
__________________
Строителство | Forum | Обяви
Reply With Quote
  #4  
Old 13-03-2010, 03:48 PM
Juve Juve is offline
Member
 
Join Date: Jul 2009
Posts: 95
Juve is on a distinguished road
Default Re: robots.txt за wordpress

Quote:
Originally Posted by nbsp View Post
Не знам от къде си го преписал това, но има неща които са тотално погрешни, като забраняване достъп на ботовете до RSS. Ако не знаеш какво означава всеки конкретен ред от писаните горе, по-добре изобщо не го прави.
Марто, с много неща не съм нясно и понеже знам, че с горното мога да оплескам нещо, търся мение на по-разбиращите от мен. Освен RSS кое друго на изтрия
Reply With Quote
  #5  
Old 13-03-2010, 04:00 PM
nbsp's Avatar
nbsp nbsp is offline
Senior Member
 
Join Date: Jan 2007
Posts: 2,612
nbsp is a jewel in the roughnbsp is a jewel in the roughnbsp is a jewel in the rough
Default Re: robots.txt за wordpress

Аз бих задал въпроса по друг начин "Кое да оставя"?

Първо, за да се справиш с дублираното съдържание в блог, не е удачно да го правиш чрез robots.txt, най-добре чрез темплейта. Забранявайки на търсачките
да индексират категориите например, ти намалява броя на страниците в блога, което не виждам с какво може да ти е полезно.

Вместо това е по-добре на категориите да показваш, само част от статиите или само заглавията.

В този robots.txt файл виждам, че се забраняват динамичните адреси (тези които съдържат "?"), но това не е универсално правило за всички блогове. Някои не ползват пренаписани адреси. Твоят ползва ли?
Reply With Quote
  #6  
Old 13-03-2010, 04:15 PM
Juve Juve is offline
Member
 
Join Date: Jul 2009
Posts: 95
Juve is on a distinguished road
Default Re: robots.txt за wordpress

Quote:
Originally Posted by nbsp View Post
Аз бих задал въпроса по друг начин "Кое да оставя"?
......
Да точно така трябваше да си задам въпроса
Адресите ми са пренаписани за това добавих Disallow: /*?* и Disallow: /*? , знам че по-добрият вариянт е да резна дължината на публикациите от темплейта, но с темплейта на този блог срешнах трудност, никъде не мога да открия:

HTML Code:
 <?php the_content(""); ?> (или нещо подобно)

за да го заменя с:
<?php the_excerpt(""); ?>
А без горното, единстеният начин (който аз знам) да показвам само част от текста е да ползвам откъси в публикациите, но това ми се вижда неудачно, понеже реже публикациите навсякъде и в блог страницата.
Reply With Quote
  #7  
Old 13-03-2010, 05:18 PM
muslim's Avatar
muslim muslim is offline
Senior Member
 
Join Date: Sep 2007
Location: Bulgaria-Kazanlak
Posts: 280
muslim скоро ще стане известен
Send a message via Skype™ to muslim
Default Re: robots.txt за wordpress

http://wordpress.org/extend/plugins/...bots.txt&sort=

Има доста плъгини за целта аз лично съм ползвал и продължавам да ползвам на един от сайтовете си PC Robots.txt и съм доволен. Разбирасе ако имаш нужното познание най-добре е сам да си създадеш файла и да добавиш това което си искаш.

Иначе един пич написа цяла статия за създаването на умен robots.txt ама на мен ми се видя сложно, но най-вече ме домързя да се занимавам, но ако вие имате желание може да хвърлите едно око и да го коментирате http://sebastians-pamphlets.com/smart-robots-txt/
Reply With Quote
Reply

Thread Tools
Display Modes

Posting Rules
You may not post new threads
You may not post replies
You may not post attachments
You may not edit your posts

BB code is On
Smilies are On
[IMG] code is On
HTML code is Off
Forum Jump

Similar Threads
Thread Thread Starter Forum Replies Last Post
Coppermine; URL и robots.txt shark За Начинаещи 4 04-12-2009 09:32 PM
robots.txt на phpBB2 bgkulinar За Начинаещи 3 28-08-2009 12:13 AM
robots.txt a4kata SEO 4 20-04-2009 03:45 PM
robots.txt wildcards или как? evilsatan Търсачки 3 27-04-2008 04:48 PM
Robots.txt smo SEO 5 25-01-2007 11:24 AM


All times are GMT +3. The time now is 11:51 PM.

IT Новини   Реклама в Интернет   Web Design   SEO Оптимизация   Homepage.bg   Интернет Реклама   VPS   Хостинг   cPanel Hosting   Expired Domains   SEO Конференция

Powered by vBulletin® Version 3.7.6
Copyright ©2000 - 2010, Jelsoft Enterprises Ltd.