J'ai testé des «humanisateurs» de l'IA pour voir à quel point ils déguisent réellement l'écriture de l'IA

Les outils «Humanizer» de l’IA sont censés vaincre les détecteurs d’IA afin que vos trucs générés par le chatbot passent. Mais fonctionnent-ils?

L’intelligence artificielle (IA) ne peut pas tout faire (ou du moins elle ne peut pas tout faire Bien), mais une chose des outils d’IA génératifs utilisant de grands modèles de langage sont Très bon à créer du texte. Si vous avez bombardé la partie verbale du test SAT et que vous écrivez quelque chose de plus qu’un texte est terrifiant, toute l’expérience peut sembler assez magique; Être capable de générer un e-mail, un essai ou une lettre de motivation sans avoir à regarder une page vierge pendant des heures et s’inquiéter de chaque choix de vocabulaire est un outil puissant. C’est pourquoi on estime que près de 20% des adultes aux États-Unis ont utilisé l’IA pour rédiger des e-mails ou des essais.

Une fois que cet e-mail ou cet essai est poli (et fait des faits, non?), Cependant, il y a un obstacle imminent: des détecteurs d’IA, allant des humains étant conscients des «races» derrière l’écriture générée par l’IA aux outils en ligne qui prétendent scanner du texte et identifier s’il a été écrit par les êtres humains ou l’IA. La précision de ces détecteurs est doute pas Écrit par ai.

Entrez dans le «Humanizer» de l’IA, un outil conçu pour prendre votre copie de l’IA et en faire quelque chose, eh bien, plus humain en supprimant et en reformulant des IA et des phrases communes. C’est une idée attrayante: vous obtenez l’IA pour générer votre essai, vous le faites passer par l’humaniseur, et le résultat final semble être écrit à partir de zéro par un humain (vraisemblablement, vous). Mais fonctionnent-ils?

Le test

Pour le savoir, j’ai mené une petite expérience. Bien que ce ne soit pas exactement une enquête exhaustive, cela m’a certainement donné un sentiment solide pour savoir si l’un de ces outils mérite d’être utilisé si vous insistez pour que l’IA écrive secrètement toute votre correspondance, vos affectations scolaires ou vos e-mails sincères à de vieux amis.

Tout d’abord, j’avais créé un essai sur … comment rendre l’écriture AI plus humanisée. Il a tourné un essai en quelques secondes, et le résultat a été parfaitement cohérent. Je ne l’ai pas vérifié ou ne massait en aucune façon le texte; Son seul but est d’être testé dans des outils d’humanisation.

Ensuite, j’ai parcouru l’essai à travers quelques détecteurs d’IA pour m’assurer que c’était un bel exemple d’écriture médiocre d’IA. Les résultats étaient comme prévu: Quillbot l’a noté à 94% d’IA, Zerogpt l’a noté à 97% et Copyleaks l’a obtenu un robuste 100% généré par l’AI. Le monde des détecteurs d’IA a convenu: cet essai de Chatgpt se lit comme s’il a été écrit par Chatgpt.

Les résultats

Maintenant, les outils AI Humanizer pourraient-ils résoudre ce problème? Il y a beaucoup d’humaniseurs là-bas – l’explosion des chatbots d’IA a inspiré une guerre entre les détecteurs et les outils conçus pour les tromper. J’ai donc choisi quelques populaires à tester.

Tout d’abord, cependant, je voulais un peu plus d’étalonnage, alors j’ai fait quelque chose d’évident: j’ai rendu le texte de Chatgpt dedans et j’ai demandé il pour humaniser le texte. Tous ces outils sont basés sur l’IA, après tout, donc peut-être que la chose la plus simple au monde est de demander à Chatgpt d’être moins comme lui-même.

Ensuite, j’ai pris le texte original généré par ChatGpt et l’ai nourri à quatre autres outils de l’humaniseur: paraphraser.io, stealthwriter, grammaire et gpthuman.

Maintenant, j’avais cinq versions «humanisées» d’un essai que trois détecteurs d’IA avaient marqué comme assez évidemment l’IA. Leurs scores s’amélioreraient-ils? La réponse est à peu près non, bien qu’un outil ait montré comment vous pourriez généreusement appeler «promesse»:

Paraphraser.io: A été assassiné. Quillbot a marqué sa version à 83% généré par l’AI, des copyleaks à un 100% assez ferme et un zérogpt à 99,94% avec une spécifique spécifique.
Chatgpt: Bombardé, bien que pour être juste, ce n’est pas spécifiquement un humaniseur, et peut-être qu’une invite plus approfondie aurait donné de meilleurs résultats. Quillbot et Copyleaks l’ont noté à 100% AI-GEN, tandis que Zerogpt lui a donné 87,77%.
Grammaire: Également bombardé de manière assez approfondie, Quillbot, Copyleaks et Zerogpt marquant respectivement sa version 99%, 97,1% et 99,97%.
Gpthuman: Celui-ci avait des résultats mitigés. Quillbot était totalement dupe, le marquant à 0% AI-Gen, et Zerogpt n’était pas sûr de lui-même, ne le marquant que de 60,96%. Mais Copyleaks n’avait aucun doute, le giflant avec un score de 100%.
Furtivité: Le plus efficace testé ici. Alors que Zerogpt était suspect, le marquant comme (encore une fois, curieusement spécifique) 64,89% AI-GEN, Copyleaks l’a marqué à seulement 3% et Quillbot a été totalement dupe avec un score de 0%.

Un aspect de stealthwriter qui a peut-être aidé son efficacité était la capacité de continuer à faire fonctionner l’humaniseur à travers le texte encore et encore. La première course, Stealthwriter a affirmé qu’elle marquerait à 65% humain, donc je l’ai couru une deuxième fois, et le score a sauté dans les années 80, alors je l’ai fait à nouveau, et il a atteint 95%. Après cela, le score n’a pas bougé lorsque j’ai couru l’outil Humanizer sur le texte.

Tous ces outils indiquent assez clairement que vous devez passer en revue les résultats et faire vos propres ajustements, et je n’ai pas examiné le texte humanisé pour la qualité de l’écriture ou de la précision. Je voulais juste voir s’ils tromperaient les détecteurs d’IA, et la réponse est: probablement pas, mais Stealthwriter pourrait aider.

Enfin, considérez qu’il y a un parcelle Des outils de détection d’IA là-bas, ce qui signifie que la variabilité des scores (même avec StealthWriter) est une préoccupation: vous ne pouvez pas toujours savoir quel outil de détection que quelqu’un utilise. S’ils utilisent un détecteur que je n’ai pas utilisé ici et qu’il vaut mieux détecter ce que fait Stealthwriter, par exemple, vous serez toujours cloué. Si vous vous inquiétez de la détection de votre texte généré par l’IA, votre meilleur pari reste à faire vous-même, ou du moins à réviser très bien le texte généré par l’IA.