7 октября 2007 г.

Проверка уникальности контента на раз-два-три, или, как я нашел наглый копипаст с сайта allseo.ru


При поддержке:

От нас без покупки не уходят. GlavMed.com

Удобная система! Закажи перевод текста.

Частенько ко мне обращаются копирайтеры-новички. Им выгодно со мной работать по многим причинам. Во-первых, все риски я беру на себя. Во-вторых, я плачу столько, сколько бы они брали с любого другого заказчика, а потому, работая со мной, люди не чувствуют себя неграми. Чаще всего моя оплата даже больше, чем их заявленная цена на свои услуги. В-третьих, я с удовольствием делюсь своим опытом, что гораздо важнее, чем остальные пункты. В-четвертых, я никого не держу — люди вольны брать заказы на стороне, когда и сколько угодно. В-пятых, я всегда поддержу своего сотрудника на форуме и оставлю положительный отзыв о его работе, но только, если он действительно того заслуживает.

Но пост не об этом, хотя и первый абзац может дать кое-кому пищу для размышлений. ;)

Новички часто не понимают или не хотят понять, что текст должен быть уникальным на 100 %. Пусть это будет очередное изложение на избитую тему, например — «туры в Болгарию». Никто не заставляет вас ехать туда, чтобы окунуться в Черное море и сказать: «Черт возьми! А ведь водичка и в самом деле теплая», но даже самый «неглубокий» рерайтинг должен на выходе давать уникальный текст на 100 %. Кстати, я до сих пор не могу определить, где находится грань между «глубоким» и «неглубоким» мине… тьфу, рерайтингом.

Господа оптимизаторы могут не согласиться, возможно, для размещения статей в каталогах достаточно и 50 % уникальности, но мои требования именно такие — ни одно предложение не должно быть копией. Бывало такое: человек напишет мне одну статью — я ее приму, напишет вторую, третью — разбираю с ним недочеты и принимаю; вдруг, в четвертой статье вижу — целые абзацы «скопитырены» из других источников. Ребята, так дело не пойдет!

Есть несколько способов проверки текста на уникальность, например, можно вбивать небольшие куски текста (приблизительно по 200 знаков без пробелов) последовательно в поисковики… Однако я заметил интересную особенность. Вот, например, интервью с Романом Пушкиным (если кто еще не знает, кто такой Роман Пушкин, то вот его блог. Есть очень неплохие просветляющие посты): беру фрагмент текста из интервью и пихаю его в Яндекс — «Мой бизнес довольно специфичный, и ему присущ некий элемент везения, который может кардинальным образом изменить намеченный курс. Поэтому сложно гадать, всё время необходимо быть начеку и быть открытым для изменений. Но в общих словах могу сказать одно - я обязательно добьюсь поставленных».

Результат — нет такого текста в Рунете! Глюк, да и только! Но стоит нам удалить последнее слово из этого фрагмента, как интервью находится там, где и должно быть. А точнее, не только там. Как мы видим, некто раз, некто два и некто три уже разместили интервью. Из них только «некто три» поставил ссылку на источник. Хе-хе-хе… Ушлых парней хватает.

Но вернемся к нашим баранам. Оказалось, что Яндекс не находит оригинал по слишком крупным фрагментам, а Google вообще отказывается работать с такими кусками текста и выдает нечто вроде: «fuck off stupid user!». Короче, 277 знаков с пробелами Яндекс хавает как надо, а с большим количеством начинает «троить». Хотя максимальный фрагмент для поиска равен 300 знаков с пробелами, лучше ограничиваться 250. Не будем мучиться с поисковиками и пойдем сразу сюда: http://www.copyscape.com/ Вставляем в окошечко линк страницы-источника с интервью: http://www.allseo.ru/archives/201

И что мы видем? «Некто три» отсутствует. Вот незадача! Мы прохлопали его! Одно радует — «некто три» поставил ссылку на источник, поэтому он нам не так интересен.

Черт возьми, я думал все будет пучком. Кто-нибудь объяснит мне, почему мы не видим ссылки на «некто три»? Может быть, все дело в том, что «некто три» поставил ссылку на источник? Честно говоря, я думал, что copyscape — пока что лучшее, что придумало человечество для борьбы с «копитырством». Ну, да и хрен с ним, все равно я не откажусь от работы с этим сервисом, ибо куда удобнее, чем вставлять фрагменты в поисковик.

Хотя этот эксперимент показал, что использовать Яндекс для поиска дубликатов весьма некисло! Но в случае, когда вам надо найти копии больших объемов текста, придется потратить огромное количество времени, ведь злоумышленник может «скопитырить» не весь текст, а последнюю его часть.

Так, как делаю я, сможет любой, даже самый зеленый, новичок, у которого нет ни хостинга, ни домена, ни собственно сайта… Как мы знаем, copyscape позволяет искать дубликаты текстов, расположенных на веб-страницах. Проверить на уникальность текст, просто набитый в Word, не получится, поэтому:

Первое, что мы делаем — идем на narod.ru, регистрируем там аккаунт и заходим в него.

Второе — тыцкаем сюда:

Третье — тыцкаем сюда:

Четвертое — пишем имя сайта, например, "proverka" и тыцкаем "Дальше".

Пятое — вставляем текст, который необходимо проверить и тыцкаем "Готово", а потом еще раз "Готово":

Шестое — перед вами готовая страница, адрес которой мы выкладываем на проверку в copyscape:

Седьмое — возвращаемся в мастерскую на narod.ru, удаляем текст из проверочного сайта, сохраняем.

В следующий раз, когда нужно будет проверить некий текст, просто зайдите в свой «народный» аккаунт, затем в «Моя мастерская», затем в «Управление файлами и HTML-редактор», найдете там свой проверочный сайт и наполните его контентом, который следует проверить.

На самом деле все эти операции делаются в течение 2-х минут. Так что, если вы наняли неопытного копирайтера, а он пишет вам не совсем уникальный контент, посоветуйте ему этот способ.

Вообще, иметь аккаунт на narod.ru бывает полезно. Можно наскоряк залить свою фотку, удобнее давать ссылку на нее, когда попросят, чем пересылать ее по e-mail. Если вы написали заказную статью, но по какой-то причине электронное письмо не доходит до заказчика (и такое бывает), то можно в считанные секунды залить текст на народовский хостинг и просто передать заказчику ссылку на архив. Да и вообще, можно хранить многие файлы, ведь места дают 100 мегабайт, а потом еще 100. Новичкам можно потренироваться в сайтостроении, если вы еще не освоили его азы, а денег нет ни на домен, ни на хостинг. Бесплатных хостингов существует масса, но я привык работать с «народом».

Ловлю себя на мысли, что иногда впадаю в словоблудие и пытаюсь разжевать все до мельчайших подробностей. Дурацкая привычка, не так ли? Всем добра!

Конкурсный линкодромчик:

Конкурс "подруга блогера", где вы можете увидеть подруг, жен, любовниц очень многих блогеров. Моя там тоже есть ;). Не стесняйтесь, принимайте участие. :)

Конкурс "стань интервьюером". Берите интервью у интересных людей. Во-первых — это интересный контент, во-вторых — возможность выиграть больше 1000 долларов! :)

Конкурс от MaulNet`a "придумай слоган". Его новый молочный проект набирает популярность, как снежный ком! Но не хватает отличного слогана. Придумай слоган и выиграй 202 бакса!

При поддержке: Здесь раздают деньги — уже 1600$

34 комментария:

Dr. LoL комментирует...

Хорошие рекомендации даёшь для поиска стыренных Копий, молодец!
Только вот один вопрос, эээ... а сколько за статью тебе заплатил Яндекс? ;)) :lol:

Kopernik комментирует...

Dr. LoL, рекомендации элементарные, расчитанные на новичков. Надеюсь, блог читают не только прожженные зубры. :)
Яндекс вряд ли станет рассматривать мой блог в качестве рекламной площадки. Хех! :)
Ну ладно, признаюсь, 200 000 рублей. :) Теперь я могу до Нового года не работать. :)

Dr. LoL комментирует...

Kopernik, ну я вроде зубром пока не являюсь, так что можешь считать, что один "непроженный" читатель у тебя есть ;)
А 200 000 это ты имхо мало запросил, столько только реклама стоит, а подробная инструкция к применению с картинками? Милльон надо было брать! :))

Анонимный комментирует...

http://antiplagiat.ru/

Анонимный комментирует...

очень сложно обойти этот антиплагиат. я в свое время в институте намучался.

Kopernik комментирует...

Антиплагиат не все ищет. Мне он жутко не нравится. Сколько раз эксперименты ставил — отстой. Может, он еще сырой? Не знаю. Но то что желание им пользоваться у меня пропало — факт.

Tod комментирует...

Достаточно интересно почитать, хоть я и не копирайтер)
В тексте есть такой фрагмент "Короче, 236 знаков без пробелов Яндекс хавает как надо, а с большим количеством начинает «троить». Короче, 277 знаков с пробелами Яндекс хавает как надо, а с большим количеством начинает «троить»." - это спецаильно так?

Kopernik комментирует...

Тод, спасибо! В очередной раз убеждаюсь, что вычитывать текст перед публикацией надо внимательнее.

Анонимный комментирует...

Copyscape ничего толком не показывает, только если страница реально старая, месяца 4 как минимум. Лучший вариант забивать фрагменты текста в поисковики.

Greignar комментирует...

В принципе, можно по тексту определить, какие фрагменты были написаны "автором", а какие другим человеком. Остается взять этот фрагмент и вставить в поисковик. Хотя если этот "автор" - профессионал, то становится намного сложнее, вопрос в том, зачем профессионалу что-то заимствовать?

Яндекс для поиска копипаста незаменим!

Smart комментирует...

А при каких делах Антоха Рожков к моему сайту? ;)
На самом деле тырили, тырят и будут тырить, а на письма о копирайтах нервно так реагируют.

Dmitry Davydov комментирует...

Коперний, хуй забей, когда тебя копируют. Это гут. Это значит, что ты что-то из себя представляешь. Мне лично похуй, что меня ретранслируют. Мне от этого вреда никакого

Андрей Зарубин комментирует...

Необязательно делать сайт на народе. Можно просто залить страничку с текстом на свой хостинг и скормить ее copyscape.com

Kopernik комментирует...

Smart, извини, что-то я попутал

Denis Sha комментирует...

Очень заинтерисовал первый азац.
Коперник, хотелось бы узнать, а как можно с тобой посотрудничать?

Kopernik комментирует...

Denis Sha - контакты указаны справа до пузомерок

Konkoff комментирует...

А я после этого поста начал юзать CopyScape,
полезная штука оказалась.

Спасибо тебе Kopernik за наше счастливое детство :)

Продавец букв комментирует...

Есть еще одна фича, которой я пользуюсь, когда надо проверить текст на антиплагиат (одно время сам писал мало, юзал услуги негров).
Схема такая - идем на textsale.ru, регаемся в качестве копирихтера.
Затем размещаем нужный текст в разделе "продать статью". Сервис сам пробивает копии в гугле и яндексе.

Андрей комментирует...

пошёл проверять сервис. А статья хорошая. С удовольствием читал.

Panfilova Elena комментирует...

Знать, что есть такая возможность проверить текст на уникальность - это полезно! Хотя, опять же, кому - только заказчику! А копирайтеру, наверное, только в том случае, если он копирует с печатного источника, чтобы проверить, нет ли уже подобного текста в сети...

Анонимный комментирует...

попробовал воспользоваться копискейпом, но у меня ничего не вышло

No results found for http://site.ru/page.htm

Your search could not be completed, since the Google API did not respond to Copyscape's requests.
Please try again or come back later if this keeps happening. We apologize for the inconvenience.

кто-нибудь ещё с подобным сталкивался?

Kopernik комментирует...

We are working to restore Copyscape service for our users as soon as possible.

То есть, у них неполадки в системе, но обещают починить так скоро, как только это возможно...

Анонимный комментирует...

да, не заметил.. красными буквами написанно на титульной странице )

ссылочка в тему http://mastertalk.ru/topic39738.html

Алена комментирует...

хм... а как быстро Яндекс индексирует свой карманный сервис народ.ру? Ведь как правило, основная цель рерайтинга - уникальность для поисковиков. Я в свое время думала о том, чтобы выкладывать текст на свой сайт для проверки копискейпом, но побоялась, что все-таки есть шанс попасть на ап и проиндексироваться раньше клиента..

Kopernik комментирует...

Алена, чтобы этого не произошло (индексация) просто стирайте страницу и сохраняйте после использования. :)

Анонимный комментирует...

Насчет раз - ссылка на статью стоит и я не претендую на ее уникальность:
ссылка на статью

Kopernik комментирует...

Анонимный, вижу. Но ума не приложу, как я ее мог сразу не заметить. Ведь тщательно смотрел. :(
Извини, если что. Ты оправдан :))))

BoG комментирует...

Привет, это номер 3. :-)
Яб конечно написал почему копискейп не считает репост в агрегаторе дубликатом, но учитывая количество сеошников которые это прочитают - лучше промолчу.

А вообще копискейп хорош. Но его параноя - раздражает. К примеру он может считать дубликатом статью содержащую цитаты из других источников. А учитывая лимиты - такие ложные срабатывания серьезный косяк.

Анонимный комментирует...

Т.е. для каждых 10 попыток надо делать новый аккаунт получаетя?

Анонимный комментирует...

Метод проверки текста в копискейпе через народ нерабочий. Проверяла и вчера и 2 месяца назад. Бесплатные сайты третьего уровня - это всего лишь под страничка "народа" (или др.). Поэтому вы сможете проверить свою страничку таким способом только если успеете 1го числа в 00.00 попасть в первую десятку желающих проверить.

Safaa

Cisco комментирует...

Спасибо за статью. Очень понятно и доступно записано. Респект и уважуха.

P.S. Вы мои спасители. Давно ломал голову над проверкой уникальности контента.

marks комментирует...

Попробовал сервис antiplagiat.ru - весьма и весьма качественная проверка на антиплагиат. Пробовал проверить рерайт-статьи со своего блога, выходило 90-95 процентов уникальности, сервис сразу показывал те сайты, откуда был взят первоначальный материал. Отлично. Спасибо за совет.

Multiengine комментирует...

Хороший пост, про Народ.сру зачот! :D
Тутор переноси в другой пост и ставь сцылку ;)

praide комментирует...

http://nado.su/downloads.html
попробуйте воспользоваться этой прогоу, и не мучайтесь. Отзывы
http://forum.searchengines.ru/showthread.php?t=252377