Наскільки унікальний «унікальний контент»?

910

У застосуванні до мережі Інтернет контентом прийнято вважати те, чим наповнюють сайти. Виходячи з того, що в копирайтерстве прийнято вважати контентом текстову інформацію, обмежимося розглядом цієї інформації.

Є декілька різновидів контенту, яким наповнюють сайти, в основному, це графічна інформація. Крім графічних елементів використовують аудіо і відео на сторінках сайтів та іншу мультимедійну інформацію. Але, з точки зору представлення інформації, все-таки більший інтерес проявляється саме до текстового змісту сайтів.

Інтернет споконвічно був задуманий як сховище текстової інформації. І тільки з розвитком «світової павутини» (WWW), текстова інформація стала обростати графічними украшательствами. Однак переважне право за текстовим контентом так і збереглося. Залишилося і основна проблема, пов’язана з крадіжкою контенту.

Головним болем власників інтернет ресурсів став плагіат, який став складати всі великі і великі масштаби. Для авторів, які розміщують текстовий матеріал на сторінках сайтів, що це стало помітним втратою, особливо із зростанням популярності мережі Інтернет, куди пішла реклама. Заробіток, одержуваний власниками сайтів і порталів, або монетизація ресурсів, загострила конкуренцію.

Вартість будь-якої інформації не дорівнює нулю, це не потребує доказів, бо створення будь-якої інформації неодмінно вимагає матеріальних витрат. Тому нечесні підприємці все частіше почали запозичувати популярний матеріал, щоб заманювати відвідувачів на свої сайти, при цьому не витрачаючи кошти на придбання або створення матеріалу для наповнення сайту.

Пошукові системи, становлять невід’ємну частину мережі Інтернет. Без можливості легкого та швидкого знаходження інформації, що мережа перетворилася б у величезне сховище ресурсів, в яких всі з великим трудом можна було щось знаходити. Для того, щоб полегшити пошук необхідної інформації, пошукові системи индексирую інформацію, що розміщується на сайтах в мережі Інтернет. Тому має важливе значення як індексується інформація і наскільки точно відображається релевантність (відповідність) пошуку, запитуваної інформації.

Почасти, з завданням знаходження інформації пошукові системи справляються. Але, відстежувати плагіат, розміщується на сайтах, стали не відразу, а тоді, коли рівень вакханалії з безпардонною крадіжкою контенту досяг неприйнятних масштабів. Проблема плагіату пов’язана не тільки з текстовою інформацією, але і з усіма іншими видами контенту. Однак найбільше крадеться саме текстова інформація, яка в першу чергу необхідна людям, які шукають відповіді на ті питання, які вони передають в пошукові системи.

Пошукові системи почали натаскувати, як службових собак, не тільки на пошук інформації по запитах користувачів, але і на те, щоб точно визначалася належність інформації її власнику. Той, хто витратив гроші на самостійну підготовку або придбання текстової інформації, вкладає їх для отримання прибутку. Монетизація Інтернет ресурсу відбувається в основному за рахунок розміщується власної і сторонньої реклами на сторінках сайтів і від продажу товарів та послуг, представлених зі сторінок сайту.

Крадіжка контенту призводить до втрат та недоотримання запланованого прибутку. Тому і має важливість унікальність самого контенту. Не складно визначити, що контент був запозичений, тобто вкрадений з іншого сайту. Пошукова система індексує ресурси мережі Інтернет. Зустрічаючи інформацію в перший раз, пошукова система визначає це, порівнюючи інформацію з інформацією попередньої індексації ресурсів, що зберігається в базі даних, їй привласнюється визначений ранг і запам’ятовується її власник за URL-адресою ресурсу.

Якщо аналізована інформація вже є в базі індексації пошукової системи, то перевіряється вміст сайту на предмет зазначення посилання на той ресурс, який зафіксований як адреса власника інформації. Виходячи з результатів перевірки пошукова система вирішує, чи зарахувати індексований сторінку до легітимних або викрити його в плагіаті інформації.

Які наслідки настають для сайту, на якому виявляються незаконні копії вмісту, про це можна судити за численними відгуками про зниклих посилання на сторінки сайту в пошукових запитах. Пояснюється це просто: пошукова знижує ранг сайту, на якому був виявлений крадений контент. Санкції можуть виражатися не тільки в пошуковій видачі про неблагонадійному ресурсі, розміщується ближче до кінця переліку посилань, які видаються у відповіді на запит. Але, і у видаленні сайту з індексної бази пошукової системи, тобто приведення сайту до так званого БАНу або блокування в пошуковій видачі.

Сама «унікальність» текстового контенту визначається пошукачем на підставі порівняння текстової інформації на повне або часткове збіг ключових слів двох порівнюваних текстів. На відміну від того, що людина розуміє під унікальністю інформації, пошукові системи ще не здатні аналізувати інформацію за змістом, і тому роблять висновок про відповідність унікальності або плагіату, на підставі закладених алгоритмів в комп’ютерні програми, які працюють в пошуковій системі.

З точки зору людини, унікальність текстової інформації не може бути такою, як риба другої свіжості. Але, пошукові системи, оцінюють інформацію за більш простими алгоритмами, ніж людина, що використовує свої знання та інтелект. Спроби комп’ютерних фахівців створювати все нові алгоритми аналізу даних дозволяють розрізняти унікальність не лише текстової інформації, але, графічної і мультимедійної. Однак це тільки зачатки машинного інтелекту, яким оснащують комп’ютери пошукових систем.

У розумінні письменницького, але не копірайтерського майстерності, унікального контенту не існує, а мається лише компромісне поняття унікальності, яким і користуються пошукові системи для визначення відвертого плагіату. Будь-яке джерело інформації є власником і ніхто інший, воспроизведший інформацію у текстовому вигляді не може бути господарем унікального контенту. Це для людей може вважатися, тому, що відомі численні прецеденти викриття різних авторів у плагіаті.

Але, комп’ютери ще не володіють тим рівнем людського інтелекту і це добре хоча б з двох причин. По-перше, не комп’ютери управляють людьми, а поки що люди — ними. По-друге, недосконалість алгоритмів аналізу контенту на унікальність, дозволяє людям займатися письменницьким ремеслом і заробляти гроші на життя.

Є логіка в тому, що будь-яка праця має бути оплачена. Звичайно, не відверте злодійство контенту, тобто банальний плагіат, а праця переосмислення відомих фактів, щодо викладення в авторському викладі і іншому літературному піднесенні на суд громадськості. Тому крім копірайтингу, тобто авторської творчості, є і рерайтінг, що є творче виклад або перефразування тієї ж суті. І оплачується така праця по-різному, у відповідності з адекватними трудовими витратами.

Для пошукових систем, унікальність контенту в авторському викладі і викладена в перефразированном або синонимизированном вигляді, є однією суттю, незважаючи на те, що текст може бути повним плагіатом думок автора думок, що містяться в тексті. Оцінювати унікальність інформації, залишається на суд людини, якому в підсумку і вирішувати, чи відвідувати ресурс, сайт або портал в Інтернет, де розміщується плагіат думок, не виявлений пошуковою системою.

Існують і інші методи боротьби з таким плагіатом, як повідомити про крадіжці унікального контенту або поскаржитися на ресурс. Просто можна написати скаргу або відверту кляузу на виявлений неунікальний контент на якому-небудь ресурсі і передати це в пошукову систему, а там вже розберуться, як вчинити з таким Інтернет-ресурсом.

Розуміння того, що «унікальність» має різне значення для людини і комп’ютера, що дозволяє використовувати це недосконалість у дрібних корисливих інтересах. На жаль, такий стан справ, багато що тримається на неявному обмані і з цим легше миритися, ніж з цим боротися, як говориться. Людина не тільки живе заробітком з продажу реклами, але і має мозок, що володіє інтелектом, щоб розрізняти унікальність інформації та сприймати дійсність не так як комп’ютер, зроблений тим же людиною.

Всі ми є мимовільними користувачами мережі Інтернет. І складно собі уявити, як в сучасному світі обходитися без швидкого і легкого доступу до інформації. Справжня унікальність контенту від того, що інформацію підносять в різних інтерпретаціях, її актуальність не зменшується.