Часто требуется проверить определённый текст на подлинность. При чем требуется не только преподавателям, проверяющим курсовые, и редакторам периодических изданий, но и самым рядовым покупателям контента.

Сервисы

1. Антиплагиат — Хоть проект и ориентирован в первую очередь на ВУЗы, что сказывается на характере индекса, для SEO иногда может сослужить службу.

2. CopyScape — Один из лучших поисковиков плагиата.
Хоть и буржуйский сервис, но довольно неплохо определяет скопипижженый контент на русском языке.
Из минусов: Из источников текста понимает только URL; в бесплатной версии может проверить только 10 страниц (в сутки?). Дальнейшие запросы предлагается оплатить по таксе «Only $0.05 per search.» Оплату принимает картой Visa, что весьма удобно.
Есть кнопка для отпугивания крадунов, смысл которой, правда, не совсем понятен: Воруют-то обычно в автоматическом режиме.

3. Quote Finder — Весьма своебразный сервис как по дизайну, так и по практической функциональности. Есть мнение, что использует ресурсы предыдущего сервиса.

4. Plagiarism Checker — Отличная штука, хоть и использует только базу Google. «Плюс этого инструмента в том, что он автоматически копирует, заключая в кавычки и разделяя OR (”или”), две разные фразы с указанной веб-страницы и ищет их в Гугле. Да еще исключает при этом указанную страницу минусом. Дешево и сердито. Точнее, бесплатно и сердито.» При нахождении плагиата позволяет тут же сформировать и отправить Google Alerts.

5. ArticleChecker — Похож на предыдущий сервис, но более гибкий в вариантах плагиата.

6. Istio — Хоть и декларируется поиск копий, толку от этого нет.

7. PasteIt — Рускоязычный сервис с диким юзабилити: Предлагается проверить уникальность контента по заданному URL в одной из трех поисковых систем: Google, Яндекс, Рамблер. Какой-либо результативности не обнаружено.

8. Plagium — Выдает полный бред в качестве результата проверки.

9. DupeCop — Это вообще, что такое и как этим пользоваться?

10. PlagiarismDetect — Не проверял. Для буржунета.

11. Iplagiarismcheck — Для нерусских.

12. iThenticate — Коммерческая база из 10 тыс крупных зарубежных газет, журналов и сборников статей. Должно быть круто.

13. Turnitin — Коммерческая база поиска в западных научных академических изданиях. Наверняка круто.

14. Copy-scape.ru 1.0 — Русскоязычный закос под Copyscape с дополнительной проверки в поисковиках. Стоимость проверки текста 2.0 руб. через copyscape.com, через поисковые системы в данный момент бесплатно.
Дождаться какой-либо реакции на запрос я не смог.

Программы

1. Double Content Finder — ПО с сайта биржи контента TextBroker.
Поддерживается ручной ввод текста, загрузка из файла или URL.
С тестовым заданием не справилась.

2. Advego Plagiatus — Программа от создателей биржи контента AdVego.
Весьма сомнительная по функционалу. Как результат, выдает какие-то неведомые % уникальности контента без точного указания источника копии.

3. Детектор плагиата — Проверяет по базе Яндекса. Для использования требуется регистрация в Yandex XML

4. Плагиат-Информ — Авторы какбэ намекают, что это серьезная программа, но на сайте не удалось найти даже информацию по цене.

Больше ничего примечательного не нашел.

Исходя из сделанного обзора, пришел к выводу, что более-менее толковой системы проверки на плагиат ещё не сделано. По крайней мере, в открытом доступе. — Ни один из описанных сервисов и программ не нашли всех дублей текста, в том числе, оригинальный источник текста. Я уже не говорю о рерайте …
На массовую проверку текстов способен лишь Детектор плагиата , да и в нем я пока не уверен — не проверял. А вот так, чтобы взять весь сайт и проверить — такого нет. Разве что в недрах команды разработчкиов поисковых систем. Рядовому пользователю придется все делать руками.

Методы проверки плагиата

Что касается методов, то тут все не так просто, как может показаться. Из простейших могу отметить, что поисковый запрос из двух комбинаций, состоящих из трех идущих подрят слов позволяет с 40% вероятности обнаружить исходный текст. Описание более продвинуты алгоритмов можно найти на сайтах:

Проект о детекторах плагиата в исходных кодах программ
Проект по обнаружению плагиата в исходных кодах

Ну, и в качестве шутки, цитирую описание псевдоисторического научного труда А. Т. Фоменко:

В Приложении, написанном В.П.Фоменко и Т.Г.Фоменко, излагается новый статистический метод обнаружения плагиата, опирающийся на открытый ими «авторский инвариант» русских литературных текстов. На основе разработанного метода анализируется известная проблема: кто является подлинным автором «Тихого Дона». Отметим, что затем, в ХРОН4, Н. С. Келлин, Г.В.Носовский и А.Т. Фоменко устанавливают этим методом, что подлинным автором известной «Истории» М.В.Ломоносова, опубликованной лишь после его смерти, является, скорее всего, его оппонент историк Г.Ф.Миллер.
© А. Т. Фоменко Методы. Том 1

В дальнейшем планирую развить тему защиты своих трудов от кражи и наказание за уже осуществленное и обнаруженное воровство контента.

bookmarks Проверка контента на плагиат   Сервисы, программы, алгоритмы