понедельник, августа 04, 2008

Мой любимый способ делать сателлиты

Начиная тему о создании сателлитов, я обещал рассказать и о своем любимом способе. Настала пора исполнять заявленное, что я с удовольствием и делаю.

Этот способ знаком многим, и называется он WordPress. На тему сателлитов на движке ВордПресс написано очень много материалов и добавить к этому что то новое я, наверное, не смогу, просто изложу свое видение этого процесса.

Для начала, почему WordPress? Ну тут ответ простой – блоги любимы поисковыми машинами и это уже все осознали, а этот движок для блогов имеет и целый ряд преимуществ, которые полезны как для сателлитов, так и для любых сайтов. Тут и удобная для индексации ботами структура, и постоянно увеличивающаяся коллекция тем оформления, а главное – большое количество дополнений – плагинов – улучшающих функциональность блога.

Установку WordPress на хостинг я описывать не буду по причине неоднократного подробного разъяснения этого процесса в деталях на других ресурсах. Для сателлитов главным является контент – этим и займемся. Для автоматизации процесса наполнения контентом воспользуемся одним из плагинов, специально для этого сделанных. Это может быть WP-O-MATIC, feedwordpress, smartrss. Эти плагины занимаются тем, что берут контент из указанных им RSS-фидов и вставляют его в блог в нужные категории. Единственное, чем стоит озаботиться, это поиском подходящих RSS-лент, которые несут полный вариант записи с блога или сайта.

Существуют и другие подобные им плагины для Вордпресс, но они или платные, или "сняты с производства" их авторами – это плагин wp-autoblog – очень наглый плагин, кроме того, что он забирал контент с блогов, он еще и пинговал их, тем самым ставя на себя ссылку с тематического ресурса. После многочисленных жалоб владельцев украденного контента на такое хамство, автор плагина убрал его из публичного доступа, но если поискать, то его можно найти в других местах.

Для придания оригинальности награбленному контенту используется плагин-синонимайзер simplesyn21, обученный работе с русским языком и поставляемый в комплекте с базой синонимов как для английского, так и для русского языка.

Исходя из своего опыта могу сказать, что наибольшую эффективность показала связка WordPress 2.5.1 + feedwordpress 0.993 + simplesyn21. В этой комплектации все очень удачно совмещается и корректно работает – тырит контент и переписывает его на лету. Есть некоторые моменты, на которые стоит обратить внимание сразу – это небольшой конфликт плагина feedwordpress, который выражается в следующем: трудно настроить виджеты в теме Вордпресс. Особенно сильно это мешает при использовании тем с двухколоночным сайдбаром – виджеты во второй колонке не настраиваются. По этому сперва стоит настроить дизайн блога и укомплектовать виджетами сайдбар, а только потом активизировать плагин в админ-панели.

После активации плагина настраивайте его как вам нравится, а именно – укажите, куда должна вести ссылка заголовка записи на индексной странице, в архиве или в рубрике – на сайт-источник, или на ваш сайт. Ответ для робоблога очевиден. Определите, кого вы назначите в авторы утянутого контента, в какие рубрики его поместите и какие теги ему присвоите. Выдайте разрешение или запрет на комменитирование и пингование сграбленных постов. Решите, как будут грабиться записи – по вашей команде или автоматически. Если на автомате, то укажите периодичность. Жадничать не надо – не указывайте промежуток меньше суток – спешить некуда.

За тем, как настроили общие функции, переходите к частностям – настраивайте каждую отдельную RSS ленту. Для этого из раздела настроек перейдите к разделу "синдикация" и укажите адрес RSS-фида, подтвердите, что именно он вам и нужен увидите его в общем списке синдицированных сайтов. Можно (нужно) править и отдельный фид – по ссылке "правка" – обзываете его как вам нравится и можно удалить ссылку на источник (а можно и не удалять), Назначьте, в какую рубрику будет публиковаться контент из этого фида и какие теги ему будут присвоены. Можно разрешить или запретить создание новых рубрик, новых авторов, комментирование и пингование записей. Так же определяйтесь, сразу публиковать запись из синдицированных фидов. или дождаться подтверждения публикации – если хотите их сперва редактировать. Премодерация позволит придать уникальности с сохранением читабельности, что послужит дополнительным плюсом сателлиту в глазах как искалок, так и людей.

Следует учитывать, что плагин стремиться указать ссылки на источники сграбленных фидов и засовывает их в блогролл. Ваше дело, оставить их там, или убрать. Как убрать, решайте сами.

Русифицированный плагин feedwordpress качаем здесь и не забываем благодарить автора перевода.

Плагин SmartRss занимается тем же - созданием записей в блоге из указанных ему источников контента. Настройки плагина просты – нужно указать ему адрес rss и назначить, в какую категорию помещать запись из этого фида. Так же нужно определить, сколько записей из ленты переносить в блог и каков минимальный размер записи должен быть, чтобы на него реагировать. Это сделано для того, чтобы не появлялись очень маленькие записи из одного заголовка. Еще в плагине присутствует некий фильтр, но как он работает и что с ним делать, я так и не понял и оставил его в покое.

У плагина тоже есть стремление сослаться на источник контента прямо с главной страницы и увести с сайта юзера и поисковых ботов. Это лечится заменой в коде темы вашего блога в файлах index.php archive.php search.php функцию вывода контента с "the_content" на "the_excerpt" , после этого на главной будет выводиться только отрывок из поста, а ссылка будет вести на страницу записи с полным текстом, а уже там будет стоять ссылка на источник (или не стоять).

В действие плагин можно привести в ручном режиме – для этого один из двух файлов плагина, который wp_smartrss.php – кладем в корень сайта, а другой – smart_rss.php – в папку с плагинами – для активации и настройки. Потом в браузере в адресной строке набираем адрес http://www.sitename.com/wp_smartrss.php и жмем enter. Если все нормально, то на экране монитора появится отчет о проделанной работе, а на вашем блоге появится кучка записей.

Для тех, у кого блогов-сателлитов много и заниматься таким онанизмом некогда, применяется запуск скрипта по заданию крона через заданный промежуток времени. Крон лучше настраивать с имитацией действий живого человека – не ровно в 24.00 каждый день, а через произвольный промежуток времени, вроде 29часов 47 минут. кроме выходных. Вопросы по настройке крона адресуйте вашему хостеру и поисковой системе Google.

WP-O-MATICплагин того же плана, но до сих пор вызывал противоречивые отзывы – от восторга до проклятий за положенный сервер и убитую базу данных. Автор плагина предупреждал, что версия не стабильна и возможны последствия, за которые он ответственности не несет. У меня таких фатальных последствий не было, но трудности в настройке я испытывал из за конфликтов, вызваемых плагином в моей голове и скудных познаний в иностранных языках.

На днях вышла стабильная версия плагина и я опробовал ее в комплекте с WordPress 2.5.1 - все установилось и настроилось исключительно просто и комфортно – путем последовательного нажимания кнопочек после активации плагина в админке и любезного приглашения перейти к настройке параметров. Следует только после установки плагина в его папке сделать директорию под именем "cache" и назначить ей чмоды 777 Потом можно настраивать синдикацию контента из сграбленных фидов. Для этого в настройках создается компания путем нажимания кнопочки Add campaign и указывайте названия компании, активна она или нет и короткую ссылку на нее. Название компании служит для удобства распознавания ее среди других компаний и отображается только для админа. Продолжаем жать на кнопки – FEEDS – пишите адреса фидов для этой кампании, фидов может быть много. Сразу и проверяется их пригодность к парсингу. После этого определите, к каким рубрикам будут приписаны указанные фиды. Следующая кнопка "Rewrite" служит для того, чтобы заменить указанные вами слова на другие – синонимизация сграбленных текстов. Так же можно нужные вам ключевики сделать ссылками на продвигаемый ресурс. Предусмотрена возможность использовании регулярных выражений – кто знает – юзайте. За последней кнопкой скрываются тонкие настойки оформления контента с использования шаблона поста, включения рекламы, кеширования картинок, принмать или нет уведомления, и так далее. После этого можно жать кнопку сабмита.

Для запуска плагина в действие так же требуется крон -серверный или юзерский – частоту обновления настраивайте по потребности, но в разумных пределах или запускайте в ручную.

В процессе эксплуатации указанных плагинов было замечено следующее – солидные ресурсы с богатыми rss лентами охраняют свой контент. Это выражается в том, что они определяют, кто обращается к ленте – юзерский браузер, читалка фидов или серверный парсер, и в последнем варианте контент не отдается и граббер остается нисчем. Это плохо. Решение этой проблемы было найдено в упомянутом наглом плагине wp-autoblog – там был использован так называемый "Snoopy.class" который маскирует серверный парсер под браузер и препятствий в получении контента с rss не возникает. Вот если бы кто из кодеров смог подружить этот класс, например, с feedwordpress, то это был бы просто праздник на улице робоблоггеров. У кого какие мысли имеются по этому поводу – в комментариях поделитесь.

В продолжении темы будут рассмотрены другие плагины, которые добавят функциональность сателлиту и сделают его максимально эффективным в достижении поставленных целей. Подписка на RSS позволит вам быть в курсе.

15 Уже высказались.:

Анонимный комментирует...

Я тоже долго маялась с глюком виджетов в вордпресс. Была та же проблема - не настраивались во второй колонке. Спасибо за такой содержательный пост. Советы очень помогли. Пишите еще и денежных успехов вам!

SEO consigliere комментирует...

У меня многие плагины глючат - бывает.

А за денежные успехи большое спасибо!

Анонимный комментирует...

Спасибо за подробную статью, разместил небольшую заметку про вас в своем блоге

Анонимный комментирует...

очень полезная инфа
посоветуйте где искать ингл. базу
для simplesyn21 ,гуглил не нашел

Анонимный комментирует...

Вот ссылка:http://bseo.ru/2008/04/05/plagin-sinonimajzer-dlya-wordpress/

Там можно скачать плагин синонимайзер SimpleSyn2
и базы русских и англ. синонимов в разных форматах.

Анонимный комментирует...

с wp-o-maticом не сложилось как-то... я тупой и крон мне не подчинился :-) пришлось юзать feedwrdpress, хотя впечатления приятные, но с google-news почему-то тянет с исходным кодом и коряво, с другими источниками нормально... и не сохраняет картинки статьи, а каждый раз подгружает их с источника, а wp-o-matic сохранял, что было приятно... :-) хотя у wp-o-matic кажется где-то была функция обновления по любому заходу кого-то на сайт - робота или человека... может ее стоит попробовать? если пинговать сервисы раз в сутки, то и заходить он будут тоже на сайт, а значит и запускать обновления фидов... :-)

Деньги и Спорт комментирует...

Фeedwrdpress тоже юзал, так себе - забанился сайт через 2 апа....

зщдд комментирует...

с wp-o-maticом не сложилось как-то... я тупой и крон мне не подчинился такая же фигня

Михрютка комментирует...

еще можно использовать плагин feedmaster, он помоему пофункциональнее приведенных в посте

SEOconsigliere комментирует...

Плагин Feedmaster просто сказка, по сравнению со всеми перечисленными. Но есь у него один недостаток - он платный. Хотя затраты на его приобретение окупаются на одном созданном им сплоге.
Пользуюсь им регулярно.

Maklar комментирует...

На мой взгляд wordpress тяжеловат для сателлита. Много места занимает да и платить за базу Mysql за 50-100 страничный сайтик. Хотя это конечно на любителя:)

Анонимный комментирует...

Есть варианты cборки WP, которые позволяют использовать ОДИН комплект MySQL и WP для
НЕСКОЛЬКИХ сайтов. Ищите в инете или пишите мне
viptk(собака)mail.ru

Рамиль комментирует...

У меня при добавлении ленты пишет, что "добавлен как сайт-участник при синдикации ленты"
Как быть?

SEOconsigliere комментирует...

Рамиль, это в каком плагине? Какую ленту добавляете и куда?

Рамиль комментирует...

SEOconsigliere, feedwordpress, лента моего сайта на ucoz, не добавляется. Хотя, вернул версию WP 2.6 и все заработало

Отправить комментарий