BackSpark.net

Долой оригинальность - привет банальность! Зарабатываем как можем, а можем по разному.
Spam or non-smap
1 Ноябрь 2008 | SEO | 3 Ответа »

Решил сегодня поделиться своими наблюдениями на тему спама. Раньше уже писал по этому поводу, но сегодня буду исправляться. Оказывается, бестолковые комментарии могут быть вполне и толковыми. Уже не раз приходилось слышать о том, что с помощью спама можно выглядеть более человечно в глазах поисковых систем. Но недавно столкнулся с этим на личном опыте.

Итак, есть один ГС, которому пол года. Статей на нем где-то штук 10-15. Первые месяцы трафик шел на этот блог только по второстепенным запросам, по главному же сайт находился далеко вне десятки. Как Гугл, так и Яндекс показывали одинаковые результаты и посетители шли поровну с обеих поисковиков.

Со временем на этот говно-сайт, конечно же, стал понемножку капать спам, но я решил не ставить Akismet и посмотреть, как будут развиваться дела дальше. И вот теперь, могу отчитаться по результатам эксперимента, длительностью в пол года.

Общее количество спам-комментариев – 2800, причем среднее количество спама для последних статей – 500 штук.

В Яндексе сайт благополучно забанен.

В Гугле находится на 9-ом месте по основному запросу и благополучно получает 200 переходов в день. Конечно, такие показатели также заслуга выхода из песочницы, но, тем не менее, постоянно нарастающий контент тоже в плюс.

Кстати по поводу Яндекса, что-то не лады у него с индексацией. И не только говно-сайтов, а и нормальных проектов с уникальным контентов. Все никак не хочет Яша проидексировать этот блог, а прошло уже почти три месяца с момента его открытия. Писал письмо в службу поддержки и сегодня получил следующий ответ

Здравствуйте, Вадим!
Благодарим Вас за то, что обратили наше внимание на проблемы с индексированием Вашего сайта. Мы постараемся в скором времени определить, по какой причине он отсутствует в поиске.


С уважением, Платон Щукин
Служба поддержки Яндекс.Ру

Ну что же, буду ждать…

Несмотря на то, что после запуска Находки полный «римейк» произойдет лишь спустя 3-4 апдейта, некоторые особенности видно уже сегодня. Итак:

1. Вырос вес сайтов, с возрастом более 6 месяцев

2. Если раньше морда намного опережала по своим пузомеркам внутряки, то теперь разница стала не такой очевидной.

3. Выросло качество выдачи сайтов со стоп-словами

4. Ссылки с Сапы все еще хорошо индексируются.

5. Теперь при вводе слов, значащих в раздельном написании то же самое, что и в слитном, выдача улучшится.

Общая тенденция заметна невооруженным глазом. Качество выдачи становиться еще лучше, тем самым усложняется работа оптимизаторов, приходиться больше времени уделять внутрякам, доры и сателлиты скоро вообще умрут. Естественно таким нишам как адалт жить осталось недолго. Так что создавайте свои большие белые проекты и будет вам счастье.

P.S. Вот так вот нам лучше налепить всякой хуйни, чем сделать что-то нормально. А еще многие удивляются почему єто у нас качество продукции низкое.

Мой блог находят по следующим фразам

Решил сегодня попробовать что-то новое в продвижении блога. Нет, Америку открывать не буду, этим методом уже давно пользуются многие, но не воспринимают его всерьез. Речь идет о продвижении, посредством форумов. Ссылка в подписи, небольшое упоминание урла в посте – ничего запрещенного, никакого спама, лишь белые методы.

Знаю, времени это заберет немало, так как придется постоянно писать новые сообщения. Но есть также и плюсик – форумы – это всегда куча новой, интересной и полезной информации, так что тем о том, как повысить тИЦ или заработать в AdSense станет еще больше)).

Плацдармом для своих действий выбрал 4 основных форума SEO-тематики:
http://forum.searchengines.ru/
http://www.armadaboard.com/
http://forum.sape.ru/
http://mastertalk.ru/

Предположительное время эксперимента – приблизительно месяц, но может меняться в зависимости от результатов (а вдруг попрет)).

Так что милости прошу подписаться на rss и следить за тем, что получится.

А для тех, кто себе тоже хочет нарисовать офигенную кнопочку подписки специально ссылочка на урок.

Мой блог находят по следующим фразам

robots.txt Каждый школьник стыкается с ситуацией, когда нужно спрятать любимую порнуху на компьютере от глаз родителей. Одни засовывают ее на глубину 15-ти директорий, вторые переименовывают расширение с .avi в .txt, и позже открывают с помощью проигрывателя, а третьи – просто делают файлик невидимым. Ровно также и веб-мастеру приходиться прятать страницы сайта от поисковика. Причиной может стать ненужность индексации временной информации, или cgi-директории. И подобно случаю со школьниками, у каждого администратора свои методы. Вася указывает в мета-тегах нуждается ли страница в анализе, Коля ставит <noindex></noindex> на «плохие» ссылки, а Миша создает robots.txt.

По сути robots.txt никогда не был официальным стандартом, и не гарантирует, что все пауки в обязательном порядке будут придерживаться его в дальнейшем. Тем не менее, неофициальный статус документа не уменьшает его важности. Большинство роботов, первым делом попав на сайт, ищут именно этот файлик, дабы узнать, что им позволено индексировать.

Структура файла выглядит следующим образом:

User-agent содержит название робота

User-agent: googlebot

Если нужно обратиться ко всем роботам, то строка будет выглядеть

User-agent: *

Следующая часть документа содержит в себе записи Disallow, запрещающие доступ к тем, или иным страницам

Disallow: admin.php

Или папкам

Disallow: /cgi-bin/

Запись

Disallow: /user

запретит поисковикам индексировать и директорию site.com/user и страницу user.htm

Disallow: - позволит анализировать все содержимое сайта

Disallow: / - запрещает роботам доступ ко все страницам и папкам

N.B. если указать Disallow: /image*/, то запрещается доступ ко всем папкам, название которых начинается с “image”. Если Disallow: *png – для всех файлов с расширением png

Вместе с простыми обращениями к поисковикам в robots.txt возможно вставлять и комментарии, которые должны начинаться с символа # и идти с новой строки

Помимо стандартных команд каждый робот может использовать и свои отдельные записи. Так Google использует Allow, чтобы обозначить файлы, к которым разрешен доступ, Яндекс, благодаря директиве Host определяет главное зеркало сайта и т.п.

N.B. Расширение стандарта robots.txt, введенное Яндексом, директива Host — это не команда считать зеркалами два любых сайта, это указание, какой сайт из группы, определенных автоматически как зеркала, считать главным. Следовательно, когда сайты будут идентифицированы как зеркала, директива Host сработает.

Пример

User-agent: Yandex

Disallow:

Host: site.com

# main domain is site.com

User-agent: googlebot

Disallow: /

Allow: /content/

User-agent: *

Disallow: /cgi-bin/notde

Disallow: /cgi-bin/html-KOI/vision/

Disallow: /cgi-bin/library/history.htm

В выше описанном примере запрещается доступ Гуглу ко всем фалам, кроме папки content, разрешается неограниченный анализ страниц Яндексу и запрещается индексирование папок nodte, vision и файла history.htm всем остальными поисковикам.

Правила

Существует несколько правил написания и размещения документа:

1. Находиться файл должен в корне сайта (http://site.com/robots.txt)

2. Имя должно бить robots.txt, а не Robots.txt или rObOTs.txt

3. Хост следует писать без слеша в конце и без http:// (правильно - Host: site.com)

4. Документ должен создаваться в текстовом формате Unix

5. Если нужно оставить открытым доступ ко всем файлам, оставьте поле Disallow пустым, но не упускайте его

Роботы

Яндекс – Yandex

Рамблер – StackRambler

Google – googlebot, Googlebot-Image (бот поиска картинок)

Yahoo - Yahoo! Slurp (одно название)

MSN – msnbot (главный), есть также msnbot-products, msnbot-news, msnbot-MM

Апорт– Aport

Webalta – Webalta

Webcrawler - Webcrawler

Lycra - Lycra

Запретить индексировать страницы поисковикам можно не только используя файл robots.txt, для этого подойдет также Мета-тег Robots.

NOFOLLOW/FOLLOW – запрещает/позволяет роботу переходить по внешним ссылкам

NOINDEX/INDEX – запрещает/позволяет индексировать страницу

Пример

<META NAME=”ROBOTS” CONTENT=”NOFOLLOW”> - тег запрещает всем поисковикам переходить по внешним ссылкам

<META NAME=”GOOGLEBOT” CONTENT=”INDEX, FOLLOW”> - тег позволяет гуглу индексировать страницу и переходить по внешним ссылкам

Чтобы запретить всем роботам переходить по внешним ссылкам на странице в шапку сайта нужно вставить мета-тег <META NAME=”ROBOTS” CONTENT=”NOFOLLOW”>, чтобы запретить индексировать страницу поисковику Гугла нужно прописать <META NAME=”GOOGLEBOT” CONTENT=”NOINDEX, NOFOLLOW”>

Пример файла robots.txt, взятый с Хабра

User-agent: Yandex
Disallow: /people/
Disallow: /search/
Disallow: /tag/
Disallow: /top/
Disallow: /live/
Host: habrahabr.ru
Crawl-delay: 0.3
 
User-agent: *
Disallow: /people/
Disallow: /search/
Disallow: /tag/
Disallow: /top/
Disallow: /live/
Crawl-delay: 0.3

Пример robots.txt с сайта CNN.com

Sitemap: http://www.cnn.com/sitemap_index.xml
Sitemap: http://www.cnn.com/sitemap_news.xml
Sitemap: http://www.cnn.com/sitemap_video_test.xml
User-agent: *
Disallow: /.element
Disallow: /editionssi
Disallow: /ads
Disallow: /aol
Disallow: /audio
Disallow: /audioselect
Disallow: /beta
Disallow: /browsers
Disallow: /cl
Disallow: /cnews
Disallow: /cnn_adspaces
Disallow: /cnnbeta
Disallow: /cnnintl_adspaces
Disallow: /development
Disallow: /NewsPass
Disallow: /NOKIA
Disallow: /partners
Disallow: /pipeline
Disallow: /pointroll
Disallow: /POLLSERVER
Disallow: /pr
Disallow: /PV
Disallow: /quickcast
Disallow: /Quickcast
Disallow: /QUICKNEWS
Disallow: /test
Disallow: /virtual
Disallow: /WEB-INF

Как видим в документе, для улучшения анализа, можно также указать путь к карте сайта

P.S. Интересно почему CNN закрыло индексацию каталога NOKIA))

Мой блог находят по следующим фразам

Эта статья в основном ориентирована на новичка, который только начинает свой путь SEO-мастера. В ней я попытаюсь максимально просто объяснить принцип роботы поисковой системы и попадания сайта в топ по ключевому запросу.

Первое, что нужно знать, это то, что вся оптимизация сайта делиться на две части: внешнюю и внутреннюю. К первой относятся ссылки на ваш ресурс из других каталогов, форумов и сайтов. Ко второй – сам HTML код документа, который в свою очередь состоит из тела и заголовка. Так, какой же раздел важнее – body или head?

Чтобы дать ответ на этот вопрос, нужно знать, как работает поисковая система. Давайте представим, что мы хотим найти информацию о фондовом рынке. И покажем это на простом примере.

1 шаг. После посылки запроса по словосочетанию «фондовый рынок» робот делит его на слова «фондовый» и «рынок». Затем ищет в своей базе страницы, в тексте которых есть эти два слова. Допустим, найдено 500 000 страниц.

2 шаг. Далее Яндекс (Гугл) ранжирует их на три группы: первую, где «фондовый рынок» находиться и в заголовке, и в тексте; вторую, где в заголовке есть только слово «фондовый» или «рынок»; и третью, где это словосочетание находиться только в тексте. И на первое место выводит именно сайты с первой группы. (20 000 страниц)

3 шаг. Поисковая система находит те ресурсы, в заголовке которых фондовый рынок стоит на первом месте. Пример: есть два заголовка «фондовый рынок Восточной Европы» и «В Америке потерпел крах фондовый рынок». Думаю, вы и сами понимаете, что выше будет стоять первая страница. (5 000)

4 шаг. Робот выводит в топ сайты, где плотность ключевых слов на странице оптимальна, (как он полагает) и где словосочетание «фондовый рынок» стоит как можно выше к началу документа. (600)

5 шаг. Яндекс отсевает ресурсы, не имеющих в разделе <BODY> синонимов и слов, связанных со словосочетанием «фондовый рынок», вроде «рынок ценных бумаг», «биржа», «торговля ценными бумагами» (40 страниц)

6 шаг. Определяет сайты, авторитет (читай тИЦ или Page Rank) которых выше остальных и ставит их на первые места.(2 страницы)

7 шаг. Выделяет ресурсы, стоящие на доменах первого уровня. Пример: есть два зеркала, с идентичным тИЦ, одно стоит на домене первого уровня (abcdefg.ru), второе – на второго (abcdefg.narod.ru). Нетрудно догадаться какой сайт будет первым.(1 страница)

Итак, со всего выше сказанного становиться понятно, что при поиске подходящего документа, робот в первую очередь анализирует его заголовок, потом текст и уже в конце его тИЦ. То есть, если у вас хорошо оптимизированный, ориентированный на низкочастотные запросы сайт, пусть даже на бесплатном хостинге и не имеющий тИЦ, то попадание в топ по НЗ вам обеспечено. Так однажды случилось и со мной, когда я создавал фан-сайт на бесплатном хостинге Народа. Сразу же после индексации он вышел на первое место по основному НЗ и продержался там полгода.

P.S. Выше описанные принципы хоть и являются основными, но это далеко не весь список. На положение сайта также влияют уникальность статей, частота обновления, и еще масса аспектов, известных только самому роботу. Кроме того каждая ПС имеет свои индивидуальные особенности.

Мой блог находят по следующим фразам

SEO-аналогии для чайниковВремя от времени мне приходится толковать принципы SEO людям далеким от этой темы. Поскольку неподготовленному человеку тяжело понять, что такое семантическое ядро, карта сайта или PR, я стараюсь использовать несколько аналогий для этого.

Преимущество собственного поля – обьясняет почему Яндекс любит «народные» сайты, а Гугл Блоггер.
Не вынуждайте меня думать – когда люди заходят на сайт, они не читают весь текст целиком, а лишь быстро сканируют содержимое страницы. Посетители не читают большие блоки текста, более оптимальным вариантом будет разбиение материала на небольшие абзацы, выделение ключевых фраз жирным шрифтом, подчеркиванием и курсивом.
Летящий без автопилота слепой– показывает, насколько важным является анализ.
Пирамида – показывает, почему некоторые фразы более конкурентоспособны, чем другие, и как структурировать сайт.
Приплыв поднимает все лодки – когда растет пузомерка главной страницы, увеличивается PR всех остальных страниц сайта.
Все люди ленивые – используется, когда нужно истолковать, почему первое место в выдаче поисковой системы получает намного больше трафика, чем 5-ое или 10-ое.
Тропинки и дороги – изображает принцип формирования PR. Когда несколько тропинок сходятся, они создают одну большую дорогу. Аналогично происходит и с делением большой трассы. Она начинает уменьшатся, когда от нее отходят ветки.
Поиск клада – указывает на то, насколько важна карта сайта для поисковой системы при индексации новых страниц.
Главы книги – объясняет, каким образом нужно давать названия разделам и организовывать структуру сайта.
Тверская улица в Москве – используется для толкования важности зоны .com

Оригинал

А вы смотрели открытие Олимпиады?

Мой блог находят по следующим фразам

KISS SEO
9 Август 2008 | SEO | Нет ответов »

Каждый день сотни сео-специалистов спорят о том, какими методами лучше продвигать сайты в сети. Постоянно ведутся дискуссии о правильном или неправильном способе оптимизации. Но на самом деле существует всего один принцип – принцип KISS (Keep it simple s… или же просто «не усложняйте это г…»).
Забудьте о плотности ключевых слов, не нужно спорить о том, сколько словосочетаний «пластиковые окна» должно быть в тексте – 5, 7 или же 10. Забудьте о «правильной» перелинковке и о «правильном» количестве страниц. Все SEO сводиться к нескольким простым пунктам:
1. TITLE - Уникальное название каждой страницы, содержащее ключевые слова и имя компании/сайта (если нужно).
2. META - Уникальное описание страницы, также с набором ключевых фраз.
3. Выделение слов в тексте тегами Н1, Н2 или Н4. Но помните, что тег Н1 не нужно использовать на странице более одного раза.
4. Контент – также уникальный, а еще информативный и полезный для целевого посетителя
5. URL – не динамические
6. Статическая структура сайта
7. Абсолютное внутреннее соединение (доступ к каждой странице)
8. Карта сайта
9. Блокирование в файле robots.txt любого дублирующего контента (к примеру, страниц для печати)
10. Использование 301 редиректа для объединения одинаковых страниц, доступных за разными адресами (к примеру http://www.site.com и http://site.com)
Не следует забывать, что все SEO может сводиться всего-навсего к простому дизайну, натуральным ссылкам и хорошему контенту. Творите качественные сайты, и тогда продвижение станет легче.

P.S. Перевод статьи Михаеля Мартина. Оригинал здесь

Мой блог находят по следующим фразам