7 мин.

Как Антиплагиат определяет, что текст сгенерирован нейросетью? И можно ли обойти алгоритм?

Так не узнают.

Контент, созданный нейросетями, становится реалистичнее с каждым днем. Вспомните про ту же Sora 2 – многие видео от этого ИИ выглядят как реальная съемка. Даже наметанному глазу не всегда удается определить работу робота. Но сервисы вроде «Антиплагиата» помогают решить эту проблему, по крайней мере, с текстом. Они замечают, что часть текста создана чат-ботом и помечают ее как подозрительную. Рассказываем про то, как они работают и можно ли обмануть систему.

Как «Антиплагиат» распознает тексты, созданные с помощью ИИ?

На самом деле так работает не только «Антиплагиат», но и другие сервисы. Принцип работы основан на «предсказуемости» следующих слов – ведь именно так и работают нейросети: генерируют следующее слово основываясь на его вероятности появления относительно предыдущих. 

📌А узнать, как работают «мозги» нейросети простыми словами вы можете тут.

Системы проверки, в свою очередь, оценивают, насколько стандартны цепочки слов. Нейросети, особенно более старые версии, склонны создавать связные, но шаблонные фразы. Алгоритм сканирует текст на наличие фрагментов, созданных языковыми моделями, начиная с древних, вроде GPT-2, и заканчивая современными. При обнаружении таких фрагментов система выделяет их, а документ маркируется как подозрительный.

Чем отличается сгенерированный текст

Тексты, созданные ИИ, могут выглядеть хорошими, качественными и грамотными, но у них почти всегда есть ряд признаков, которые их выдают:

  • Формальный и канцелярский стиль: обилие конструкций вроде «является», «предлагает возможность», «производить ремонт» и подобных.

  • Повторы и тавтология: одни и те же слова или смыслы в соседних предложениях, однородная структура текста.

  • Галлюцинации: нейросеть может выдумывать информацию, ссылаться на несуществующие события, термины или произведения.

  • Отсутствие абстракции и глубины: алгоритм предсказывает следующее слово, а не рассуждает, поэтому ему сложно работать с абстрактными темами.

  • Отсутствие личного мнения: текст от ИИ лишен авторского стиля, эмоций и личного опыта.

  • Особые символы: нейросети пишут грамотно, и даже слишком грамотно. Они используют символы вроде длинного тире (—), которые большинство людей попросту не умеет писать. По подобным символам «палится» языковая модель, а люди которые учились грамотно печатать – грустят.

В отличие от машины, человеку свойственны творчество, непредсказуемость в построении фраз (например, чередование коротких и длинных предложений) и живая, нешаблонная речь.

Можно ли обойти проверку на вычисление текстов, написанных нейросетью?

Да, возможно, и для этого не надо писать весь текст с нуля. Достаточно осмысленного вмешательства в машинный текст. Самый эффективный способ – глубокая редактура.

Что поможет сделать текст «человечным»:

  • Уберите канцеляризмы, замените повторяющиеся слова синонимами, разбейте или объедините предложения для естественного ритма.

  • Вставьте собственные примеры, краткую историю или экспертное мнение.

  • Переставьте абзацы или предложения местами, сохранив общую логику повествования.

  • Используйте метафоры, сравнения и эпитеты, чтобы оживить повествование.

Как правильно работать с нейросетями при генерации текста

Нейросети – мощный инструмент для поиска идей, составления плана или черновика Однако доверять ей создание контента от и до, особенно в важных для вас темах, не стоит.

Чтобы текст выглядел человечнее:

  • Грамотно ставьте задачу (пишите промпты): четко формулируйте запрос. Чтобы текст был менее формальным, можно добавить: «напиши человеческим языком» или «как обычный человек».

  • Генерируйте текст частями: так вы сможете лучше контролировать логику и связность. Большие тексты, созданные ИИ целиком, часто теряют смысл.

  • Проверяйте факты: всегда перепроверяйте цифры, имена, даты и цитаты, которые выдала нейросеть, так как она склонна выдумывать все, чтобы текст выглядел убедительнее.

  • Редактируйте: не оставляйте текст в чистом виде. Ваша задача – придать материалу индивидуальность.

Как человек, постоянно работающий с текстами, хочу поделиться рабочим советом. Его суть в том, чтобы ответственные и творческие части – поиск и анализ нужной информации – проводил человек, а рутину – планирование и оформление – делала нейронка.

Сначала самостоятельно изучите информацию по теме, а после проанализируйте ее и сформируйте собственное мнение.

Дальше возьмите свои наброски – тезисы, мысли, идеи, и запишите их «в потоке», не утруждаясь над строгим оформлением и структурой. Попросите чат-бота составить на их основе план текста. Полученный план при необходимости дополните своими пунктами.

Затем раскидайте свои мысли по этому плану. Повторное написание своих выводов нужно потому, что в этот момент вы можете додумать что-то еще, убрать ненужные пункты или столкнуться с вопросом, при решении которого текст станет полнее и интереснее. Но все также, не занимайтесь прескриптивизмом – такую работу вы скинете на робота. После передайте материал ИИ с командой в духе «напиши текст по этому плану».
Нейросеть выдаст готовый текст, и здесь снова начинается ваша работа:

  • Прочитайте результат.

  • Уберите все, что вам не нравится, кажется чужим или неточным.

  • Оживите текст: добавьте синонимы, метафоры, яркие обороты, как мы и советовали раньше.

  • Уберите машинный язык, сделав повествование человеческим и естественным.

В итоге вы получаете текст, основанный на ваших оригинальных мыслях, но без затрат времени на их точное оформление.

P.S. Иронично, но весь этот совет был написан именно таким методом.

И как видите, способ рабочий.

Как проверить текст на нейросеть?

Для проверки текста на следы ИИ можно воспользоваться:

  • Text.ru: популярная биржа контента с платным ИИ-детектором, который подсвечивает подозрительные фрагменты.

  • PR·CY: бесплатный сервис, требующий регистрации. Но его качество работы ниже, поэтому некачественный человеческий текст может быть ошибочно принят за машинный.

  • GPT-2 Output Detector: удобный бесплатный детектор, показывающий, что текст был сгенерирован ИИ.

  • ChatGPT и другие языковые модели: можно загрузить текст прямо в чат и спросить, не является ли он сгенерированным. Однако стопроцентной точности этот метод не гарантирует.

Важно помнить, что ни один сервис не дает абсолютной гарантии, и результаты проверки могут быть ошибочными.

***

Подводя итоги, можно сделать несколько вывод, что наиболее надежный способ – использовать нейросеть как помощника для структуризации и оформления идей, с последующим редактированием и написанием значительной части работы вручную. Такой подход позволит обойти как системы проверки, так и не вызовет подозрений у читателей.

***

Как сгенерировать в Sora видео с самим собой? Добавляем себя в популярные мемы

Nano Banana пранкует: пользователи «приводят» домой бездомных и шокируют родных