суббота, 18 февраля 2012 г.

Что такое "уникальность" и нужно ли с ней бороться?

Дорогие читатели, я не собирался писать про это явление (хотя это - характеристика). Поводом стало прочтение десятков блогов, которые имеют схожую с моим блогом тематику. Мне стало немного неприятно, так как не нашел ни одного правильного определения. Но и это бы не стало поводом для написания статьи. Покопавшись в интернете, я нашел много форумов, где студенты обсуждали это понятие. Соль их беседы заключалась в том, что теперь халява с рефератами и прочим учебных отчетным материалом не канала. Иными словами, скачать материал с интернета и распечатать было мало. "Преподы теперь проверяют каким-то антиплагиатом. Кто знает что-то про это?" - вот на что я наткнулся. И начав было писать ответ там, наткнулся на пост: "Там все просто, прога проверяет последовательность из трех слов подряд. Так что меняйте каждое 3-е и все!" Теперь мне окончательно стало не по себе и я решил все же раскрыть нормально, что же такое "уникальность"?

Сразу отмечу, что даже копирайтеры не знают правильного ответа. Почти все пишут: "...проверяет подряд три или четыре слова (в зависимости от алгоритма), на сходство таких же комбинаций в сети..." Чушь!

Из форумов: "...теперь нельзя будет воспользоваться готовым материалом. Прога все спалит..." Чушь!

Продолжение разговора: "...А я закинул реферат, который спер с сети, на сайт он-лайн проверки и показало уникальность 95%!!! Я нашел ресурс с "белыми" рефератами или обманул антиплагиат..." Чушь!

Там же где-то: "...меняем каждое третье слово и ву-а-ля!..." Чушь!

Запомните раз и на всегда, программы работают не совсем так! Писать с готового материала можно (забыли про рерайт)! И для этого не достаточно просто поменять 3-е слово (зачастую)!

Заинтересовало? Тогда расписываю. Уникальность - это качественная характеристика текста, количественно показывающая на сколько данный текст отличается от других текстов в сети. Для копирайта - это самая главная характеристика, измеряется в процентах и в идеале - 100%. Теперь задумайтесь, неужели интернет такой маленький, что еще есть такие логически связанные словосочетания, которые еще никто не писал? Подумайте пока, а я продолжу раскрывать это понятие...

Для копирайтеров существует два способа проверки этой самой уникальности:
1. Интернет-ресурсы (могут быть как он-лайн, так и нет).
2. Программы уникальности (не работают без интернета).
Все. Что пишут остальное - бред и хреновина! Я читал про супер-древний способ, дает 100% правильный результат. Берете кусочки текста (не более 300 сбп) и кидаете в поисковик. Далее видите где встречается, а где только отрывки. Адреса и прочее. Ну люди, ну сами подумайте, вот работаете вы с ВМ. Он работает не только с вами, т.е. есть еще авторы. Отсюда объем заказов. Теперь представьте ему сидеть и по 300 знаков кидать в Google... Ну кто до такого додумался? А чего тогда не по три словосочетания?))) Я вам скажу еще одно, поисковики несколько иначе ищут. Поэтому не гоните беса!

Теперь подробнее про интернет-ресурсы, позволяющие проверять текст на плагиат. Список таковых огромен. Сразу отмечу, что все они делятся на он-лайн сервисы и "типа" он-лайн. Также, и те, и другие могут разделяться на интернетовские и локальные.

Он-лайн сервисы дают возможность закинуть текст и проверить его на наличие копий в ту же минуту (пару секунд). Такие ресурсы могут как требовать регистрации, так и нет. К тому же, некоторые уважающие свой труд сайты, дают только несколько тестовых проверок. Дальше нужно платить.

"Типа" он-лайн сервисы позиционируют себя, как и вышеуказанные – «он-лайн». Беда в том, что они либо просто долго обрабатывают ваш запрос, либо - сразу говорят, что ждите столько-то часов. С регистрацией и халявой та же история.

Интернетовские ресурсы-антиплагиаторы - это сайты, работающие по всей сети интернет. Не важно к какому типу "-лайн" они относятся, но проверка идет глобально. Другое дело - на сколько они авторитетные? Т.е. их алгоритмы, хостинг и вообще положение в сети. К ним также относятся и ресурсы, имеющие модуль проверки (например некоторые биржи).

Локальные ресурсы-антикопии - это сайты, которые ищут только в определенной базе. Т.е., сайт имеет "базу знаний" и в ней, только в ней, копается. Это более дешевые алгоритмы, да и видать трудно получить разрешение на всеобщий поиск. Сделаны они были для того, чтобы люди видели копии из "авторитетных" (доверенных) ресурсов-архивов. В те времена столько информации в сети не лежало!

Теперь надеюсь ясно, почему ХХХХ проверил на сервисе и получил 95%. Но как же все-таки работает зверь-алгоритм? Это вопрос - секретный, как и любой качественный программный код. Но принцип я вам скажу, только позже... После обзора программ.

Рассмотрим программы антиплагиата. Кроме тех, что постоянно пестрят в сети - Адвего и ЕТХТ, есть еще не одна и не две. Но эти и правда лучшие. При этом, каждый раз они отбирают первенство друг у друга. Это и не удивительно. Одноименные ресурсы довольно популярные в сети. И для них престиж - своя программа. Поэтому и ведутся постоянные доработки. Кроме того, учтите, что ВМ пишут в ТЗ по какой проге будут проверять задание. А это - реклама на сторонних ресурсах. Особенно на конкурентных.

Думаю из этого ясно, что никакой сервис не сравнится с программой. В чем прикол? А в том, что программу необходимо инсталлировать, настраивать и постоянно переставлять настройки. А на ресурс зашел и не паришься. К тому же программу может блокировать другой программный продукт с вашего компа - антивирус, фаервол... Программа антиплагиата - это серьезный инструмент.

Теперь про то, как же эта штуковина ищет копии в сети? И тут определение применимо, и к программам, и к сайтам - запускается секретный алгоритм, который через все поисковые системы (которые заложены в коде) ищет копии из расчета тематики текста и совпадений словосочетаний. При этом, знаки препинания и табуляция не учитываются. Также по-моему, не учитываются определенные "общие слова", которые не несут особой смысловой нагрузки, а просто соединяют слова. Вот теперь правильное определение. Сразу вспомним про замену слов. Во-первых - получится чушь в текстовке, по смыслу. Во-вторых - можно апупеть и сидеть так менять. И в-третьих - из опыта, замена слова часто ничего не дает. Необходимо переделывать предложение. Вот так вот.

Также замечу, что программы не работают оф-лайн, из определения ясно. Сразу же отвечу на такой вопрос: "Если одна программа показала мне 100%, а другая - 95%. Кому верить?" Верить нужно минимальному значению. Если она нашла где-то 5% копии, то и ВМ найдет. Поэтому работайте в комплексе с несколькими программами. Такие программы могут хорошо отслеживать сделанный вами контент для различных целей, так как выдается адрес копии.

Выводы.

- программы антиплагиата сильнее сервисов
- использовать готовый материал можно, только если вы его перескажите и запишите (рерайт)
- программы показывают материалы, которые уже проиндексированы поисковиками
- работать нужно с минимум двумя антиплагиатами
- просто поменять каждое третье слово и добиться уникальности - не вариант
- пишите от себя и сами!

0 коммент.:

Отправить комментарий