Как Антиплагиат определяет, что текст сгенерирован нейросетью? И можно ли обойти алгоритм?
Так не узнают.
Контент, созданный нейросетями, становится реалистичнее с каждым днем. Вспомните про ту же Sora 2 – многие видео от этого ИИ выглядят как реальная съемка. Даже наметанному глазу не всегда удается определить работу робота. Но сервисы вроде «Антиплагиата» помогают решить эту проблему, по крайней мере, с текстом. Они замечают, что часть текста создана чат-ботом и помечают ее как подозрительную. Рассказываем про то, как они работают и можно ли обмануть систему.
Как «Антиплагиат» распознает тексты, созданные с помощью ИИ?
На самом деле так работает не только «Антиплагиат», но и другие сервисы. Принцип работы основан на «предсказуемости» следующих слов – ведь именно так и работают нейросети: генерируют следующее слово основываясь на его вероятности появления относительно предыдущих.
📌А узнать, как работают «мозги» нейросети простыми словами вы можете тут.
Системы проверки, в свою очередь, оценивают, насколько стандартны цепочки слов. Нейросети, особенно более старые версии, склонны создавать связные, но шаблонные фразы. Алгоритм сканирует текст на наличие фрагментов, созданных языковыми моделями, начиная с древних, вроде GPT-2, и заканчивая современными. При обнаружении таких фрагментов система выделяет их, а документ маркируется как подозрительный.
Чем отличается сгенерированный текст
Тексты, созданные ИИ, могут выглядеть хорошими, качественными и грамотными, но у них почти всегда есть ряд признаков, которые их выдают:
- Формальный и канцелярский стиль: обилие конструкций вроде «является», «предлагает возможность», «производить ремонт» и подобных.
- Повторы и тавтология: одни и те же слова или смыслы в соседних предложениях, однородная структура текста.
- Галлюцинации: нейросеть может выдумывать информацию, ссылаться на несуществующие события, термины или произведения.
- Отсутствие абстракции и глубины: алгоритм предсказывает следующее слово, а не рассуждает, поэтому ему сложно работать с абстрактными темами.
- Отсутствие личного мнения: текст от ИИ лишен авторского стиля, эмоций и личного опыта.
- Особые символы: нейросети пишут грамотно, и даже слишком грамотно. Они используют символы вроде длинного тире (—), которые большинство людей попросту не умеет писать. По подобным символам «палится» языковая модель, а люди которые учились грамотно печатать – грустят.
В отличие от машины, человеку свойственны творчество, непредсказуемость в построении фраз (например, чередование коротких и длинных предложений) и живая, нешаблонная речь.
Можно ли обойти проверку на вычисление текстов, написанных нейросетью?
Да, возможно, и для этого не надо писать весь текст с нуля. Достаточно осмысленного вмешательства в машинный текст. Самый эффективный способ – глубокая редактура.
Что поможет сделать текст «человечным»:
- Уберите канцеляризмы, замените повторяющиеся слова синонимами, разбейте или объедините предложения для естественного ритма.
- Вставьте собственные примеры, краткую историю или экспертное мнение.
- Переставьте абзацы или предложения местами, сохранив общую логику повествования.
- Используйте метафоры, сравнения и эпитеты, чтобы оживить повествование.
Как правильно работать с нейросетями при генерации текста
Нейросети – мощный инструмент для поиска идей, составления плана или черновика Однако доверять ей создание контента от и до, особенно в важных для вас темах, не стоит.
Чтобы текст выглядел человечнее:
- Грамотно ставьте задачу (пишите промпты): четко формулируйте запрос. Чтобы текст был менее формальным, можно добавить: «напиши человеческим языком» или «как обычный человек».
- Генерируйте текст частями: так вы сможете лучше контролировать логику и связность. Большие тексты, созданные ИИ целиком, часто теряют смысл.
- Проверяйте факты: всегда перепроверяйте цифры, имена, даты и цитаты, которые выдала нейросеть, так как она склонна выдумывать все, чтобы текст выглядел убедительнее.
- Редактируйте: не оставляйте текст в чистом виде. Ваша задача – придать материалу индивидуальность.
Как человек, постоянно работающий с текстами, хочу поделиться рабочим советом. Его суть в том, чтобы ответственные и творческие части – поиск и анализ нужной информации – проводил человек, а рутину – планирование и оформление – делала нейронка.
Сначала самостоятельно изучите информацию по теме, а после проанализируйте ее и сформируйте собственное мнение.
Дальше возьмите свои наброски – тезисы, мысли, идеи, и запишите их «в потоке», не утруждаясь над строгим оформлением и структурой. Попросите чат-бота составить на их основе план текста. Полученный план при необходимости дополните своими пунктами.
Затем раскидайте свои мысли по этому плану. Повторное написание своих выводов нужно потому, что в этот момент вы можете додумать что-то еще, убрать ненужные пункты или столкнуться с вопросом, при решении которого текст станет полнее и интереснее. Но все также, не занимайтесь прескриптивизмом – такую работу вы скинете на робота. После передайте материал ИИ с командой в духе «напиши текст по этому плану».
Нейросеть выдаст готовый текст, и здесь снова начинается ваша работа:
- Прочитайте результат.
- Уберите все, что вам не нравится, кажется чужим или неточным.
- Оживите текст: добавьте синонимы, метафоры, яркие обороты, как мы и советовали раньше.
- Уберите машинный язык, сделав повествование человеческим и естественным.
В итоге вы получаете текст, основанный на ваших оригинальных мыслях, но без затрат времени на их точное оформление.
P.S. Иронично, но весь этот совет был написан именно таким методом.
И как видите, способ рабочий.
Как проверить текст на нейросеть?
Для проверки текста на следы ИИ можно воспользоваться:
- Text.ru: популярная биржа контента с платным ИИ-детектором, который подсвечивает подозрительные фрагменты.
- PR·CY: бесплатный сервис, требующий регистрации. Но его качество работы ниже, поэтому некачественный человеческий текст может быть ошибочно принят за машинный.
- GPT-2 Output Detector: удобный бесплатный детектор, показывающий, что текст был сгенерирован ИИ.
- ChatGPT и другие языковые модели: можно загрузить текст прямо в чат и спросить, не является ли он сгенерированным. Однако стопроцентной точности этот метод не гарантирует.
Важно помнить, что ни один сервис не дает абсолютной гарантии, и результаты проверки могут быть ошибочными.
***
Подводя итоги, можно сделать несколько вывод, что наиболее надежный способ – использовать нейросеть как помощника для структуризации и оформления идей, с последующим редактированием и написанием значительной части работы вручную. Такой подход позволит обойти как системы проверки, так и не вызовет подозрений у читателей.
***
Как сгенерировать в Sora видео с самим собой? Добавляем себя в популярные мемы
Nano Banana пранкует: пользователи «приводят» домой бездомных и шокируют родных