Проверка контента на плагиат — Сервисы, программы, алгоритмы
Часто требуется проверить определённый текст на подлинность. При чем требуется не только преподавателям, проверяющим курсовые, и редакторам периодических изданий, но и самым рядовым покупателям контента.
Сервисы
1. Антиплагиат — Хоть проект и ориентирован в первую очередь на ВУЗы, что сказывается на характере индекса, для SEO иногда может сослужить службу.
2. CopyScape — Один из лучших поисковиков плагиата.
Хоть и буржуйский сервис, но довольно неплохо определяет скопипижженый контент на русском языке.
Из минусов: Из источников текста понимает только URL; в бесплатной версии может проверить только 10 страниц (в сутки?). Дальнейшие запросы предлагается оплатить по таксе «Only $0.05 per search.» Оплату принимает картой Visa, что весьма удобно.
Есть кнопка для отпугивания крадунов, смысл которой, правда, не совсем понятен: Воруют-то обычно в автоматическом режиме.
3. Quote Finder — Весьма своебразный сервис как по дизайну, так и по практической функциональности. Есть мнение, что использует ресурсы предыдущего сервиса.
4. Plagiarism Checker — Отличная штука, хоть и использует только базу Google. «Плюс этого инструмента в том, что он автоматически копирует, заключая в кавычки и разделяя OR (”или”), две разные фразы с указанной веб-страницы и ищет их в Гугле. Да еще исключает при этом указанную страницу минусом. Дешево и сердито. Точнее, бесплатно и сердито.» При нахождении плагиата позволяет тут же сформировать и отправить Google Alerts.
5. ArticleChecker — Похож на предыдущий сервис, но более гибкий в вариантах плагиата.
6. Istio — Хоть и декларируется поиск копий, толку от этого нет.
7. PasteIt — Рускоязычный сервис с диким юзабилити: Предлагается проверить уникальность контента по заданному URL в одной из трех поисковых систем: Google, Яндекс, Рамблер. Какой-либо результативности не обнаружено.
8. Plagium — Выдает полный бред в качестве результата проверки.
9. DupeCop — Это вообще, что такое и как этим пользоваться?
10. PlagiarismDetect — Не проверял. Для буржунета.
11. Iplagiarismcheck — Для нерусских.
12. iThenticate — Коммерческая база из 10 тыс крупных зарубежных газет, журналов и сборников статей. Должно быть круто.
13. Turnitin — Коммерческая база поиска в западных научных академических изданиях. Наверняка круто.
14. Copy-scape.ru 1.0 — Русскоязычный закос под Copyscape с дополнительной проверки в поисковиках. Стоимость проверки текста 2.0 руб. через copyscape.com, через поисковые системы в данный момент бесплатно.
Дождаться какой-либо реакции на запрос я не смог.
Программы
1. Double Content Finder — ПО с сайта биржи контента TextBroker.
Поддерживается ручной ввод текста, загрузка из файла или URL.
С тестовым заданием не справилась.
2. Advego Plagiatus — Программа от создателей биржи контента AdVego.
Весьма сомнительная по функционалу. Как результат, выдает какие-то неведомые % уникальности контента без точного указания источника копии.
3. Детектор плагиата — Проверяет по базе Яндекса. Для использования требуется регистрация в Yandex XML
4. Плагиат-Информ — Авторы какбэ намекают, что это серьезная программа, но на сайте не удалось найти даже информацию по цене.
Больше ничего примечательного не нашел.
Исходя из сделанного обзора, пришел к выводу, что более-менее толковой системы проверки на плагиат ещё не сделано. По крайней мере, в открытом доступе. — Ни один из описанных сервисов и программ не нашли всех дублей текста, в том числе, оригинальный источник текста. Я уже не говорю о рерайте …
На массовую проверку текстов способен лишь Детектор плагиата , да и в нем я пока не уверен — не проверял. А вот так, чтобы взять весь сайт и проверить — такого нет. Разве что в недрах команды разработчкиов поисковых систем. Рядовому пользователю придется все делать руками.
Методы проверки плагиата
Что касается методов, то тут все не так просто, как может показаться. Из простейших могу отметить, что поисковый запрос из двух комбинаций, состоящих из трех идущих подрят слов позволяет с 40% вероятности обнаружить исходный текст. Описание более продвинуты алгоритмов можно найти на сайтах:
Проект о детекторах плагиата в исходных кодах программ
Проект по обнаружению плагиата в исходных кодах
Ну, и в качестве шутки, цитирую описание псевдоисторического научного труда А. Т. Фоменко:
В Приложении, написанном В.П.Фоменко и Т.Г.Фоменко, излагается новый статистический метод обнаружения плагиата, опирающийся на открытый ими «авторский инвариант» русских литературных текстов. На основе разработанного метода анализируется известная проблема: кто является подлинным автором «Тихого Дона». Отметим, что затем, в ХРОН4, Н. С. Келлин, Г.В.Носовский и А.Т. Фоменко устанавливают этим методом, что подлинным автором известной «Истории» М.В.Ломоносова, опубликованной лишь после его смерти, является, скорее всего, его оппонент историк Г.Ф.Миллер.
© А. Т. Фоменко Методы. Том 1
В дальнейшем планирую развить тему защиты своих трудов от кражи и наказание за уже осуществленное и обнаруженное воровство контента.
6 Комментариев
мая 29, 2009
У буржуйского копискейпа лимит на проверку 10 раз с одного сайта в месяц… причем, пофиг, с какого количества айпи
января 11, 2010
Ну и хуля ты все обосрал? Разве это обзор? Долбоеб контуженный!
марта 21, 2012
http://antiplagiarismc.sf.net/
Anti-Plagiarism — software designed to effectively detect and thereby prevent plagiarism. It is a versatile tool to deal with World Wide Web copy-pasting information from the assignment of authorship.
The goal of this program is to help reduce the impact of plagiarism on education and educational institutions. At present, it distributes free software to detect plagiarism.
Checking documents in a format *.rtf, *.doc, *.docx, *.pdf
Check the source code C, C++, C#, Java, …
января 8, 2015
Повышайте уровень антиплагиата своих работ, сервис АнтиПлаг к Вашим услугам!
Трэкбеки
Добавить комментарий