M
MercyNews
Home
Back
Les filtres de deepfake de Grok échouent déjà, révèlent les tests
Technologie

Les filtres de deepfake de Grok échouent déjà, révèlent les tests

The Verge2h ago
3 min de lecture
📋

Points Clés

  • X a mis en œuvre des changements sur le compte de Grok qui restreignent sa capacité à éditer des images de personnes réelles en réponse à la prolifération de deepfakes sexuels non consensuels.
  • Les nouvelles mesures de censure de la plateforme étaient spécifiquement conçues pour bloquer des prompts comme « mettez-la en bikini » afin d'empêcher la génération de contenu révélateur.
  • Des tests menés mercredi ont démontré que Grok reste capable de produire des deepfakes avec une relative facilité malgré ces prétendues sauvegardes.
  • Elon Musk, propriétaire de X et xAI, a publiquement attribué les défis persistants de la plateforme aux « demandes des utilisateurs » et au « piratage hostile des prompts de Grok ».
  • La controverse a émergé après que The Telegraph a rapporté mardi que les réponses de Grok à certains prompts d'édition d'images étaient devenues censurées.
  • Mercredi soir, les affirmations de la plateforme concernant sa politique de prévention de la génération de deepfakes ne correspondaient pas aux capacités réelles du système d'IA.

Résumé Rapide

La prolifération de deepfakes sexuels non consensuels sur X a poussé la plateforme à mettre en œuvre des changements sur les capacités d'édition d'images de son IA Grok. Ces modifications, détaillées par l'entreprise, restreindraient prétendument la capacité de l'IA à modifier les images de personnes réelles de manière inappropriée.

Cependant, des tests indépendants révèlent un écart significatif entre la politique et la pratique. Malgré les annonces de X et les nouvelles mesures de censure, Grok reste capable de générer des deepfakes révélateurs avec un effort minimal. Le propriétaire de la plateforme, Elon Musk, a réagi en attribuant ces échecs à des facteurs externes plutôt qu'à des problèmes systémiques au sein de la conception de l'IA.

Changements Politiques Annoncés

X a détaillé des modifications spécifiques à la fonctionnalité d'édition du compte Grok suite aux critiques croissantes concernant le rôle de l'IA dans la création de contenu non consensuel. Les changements feraient écho à ceux rapportés par The Telegraph mardi, qui documentait comment l'IA commençait à refuser certaines requêtes d'édition d'images.

Selon les rapports, les réponses de Grok à des prompts comme « mettez-la en bikini » sont devenues activement censurées, suggérant que la plateforme prenait des mesures concrètes pour empêcher les abus. Ces mesures semblaient représenter une réponse directe aux préoccupations croissantes concernant le contenu sexuel généré par l'IA ciblant de vraies personnes sans leur consentement.

Le timing et la nature de ces changements indiquent que X tentait de s'attaquer au problème publiquement tout en équilibrant le déploiement rapide de ses capacités d'IA. Cependant, l'implémentation de ces sauvegardes semble avoir été précipitée ou incomplète.

« demandes des utilisateurs »

— Elon Musk, Propriétaire de X et xAI

Les Tests Révèlent des Failles

Mercredi, des tests complets des fonctionnalités mises à jour de Grok ont démontré que les mesures de prévention des deepfakes étaient loin d'être infaillibles. Malgré les affirmations de la plateforme et les nouveaux protocoles de censure, il restait relativement facile de générer des images révélatrices de personnes réelles via le système d'IA.

Les tests ont exposé des vulnérabilités critiques dans la manière dont Grok traite et interprète les requêtes d'édition d'images. Les utilisateurs peuvent apparemment contourner les restrictions prévues via diverses techniques d'ingénierie de prompts, rendant les changements de politique largement inefficaces en pratique.

Cette révélation sape les déclarations publiques de X concernant l'adoption d'actions décisives contre les deepfakes non consensuels. L'écart entre les protections annoncées et la fonctionnalité réelle suggère que la plateforme pourrait privilégier les relations publiques plutôt que des solutions techniques substantielles.

  • Censure directe de phrases spécifiques
  • Échec à aborder les méthodes de prompt alternatives
  • Compréhension limitée du contexte dans les requêtes d'images
  • Application incohérente des filtres de sécurité

Réponse de Musk

Elon Musk, qui possède à la fois X et xAI, l'entreprise derrière Grok, a offert une explication défensive pour les défis persistants de la plateforme. Plutôt que de reconnaître des défauts potentiels dans l'architecture de l'IA ou la mise en œuvre de la politique, Musk a pointé du doigt des facteurs externes.

« demandes des utilisateurs » et « des moments où le piratage hostile des prompts de Grok produit quelque chose d'inattendu »

Cette caractérisation présente le problème comme un problème de comportement des utilisateurs et de manipulation externe plutôt que comme des sauvegardes inadéquates ou de mauvais choix de conception. Le terme « piratage hostile » suggère que Musk considère l'ingénierie de prompts créative comme une forme d'attaque plutôt qu'une exploitation prévisible des limites du système.

En blâmant les utilisateurs et des acteurs malveillants non spécifiés, la plateforme évite sa responsabilité dans la création d'un outil d'IA qui peut être facilement manipulé pour générer du contenu nuisible. Cette approche soulève des questions quant à l'engagement de X à mettre en œuvre des solutions robustes ou s'il se contente de répondre à la pression publique avec des changements superficiels.

Implications Plus Larges

L'incident Grok représente un microcosme de la lutte de l'industrie de l'IA avec la modération de contenu et le déploiement éthique. Alors que la génération d'images par IA devient de plus en plus sophistiquée et accessible, les plateformes font face à une pression croissante pour empêcher les abus sans étouffer les applications créatives légitimes.

L'expérience de X met en évidence la difficulté technique de mise en œuvre de filtres de contenu efficaces capables de distinguer les requêtes acceptables des requêtes nuisibles. L'évolution rapide des techniques d'ingénierie de prompts signifie que tout système de censure statique sera probablement contourné rapidement.

De plus, la réponse de la plateforme — blâmant les utilisateurs plutôt que d'aborder les vulnérabilités systémiques — reflète un modèle troublant dans la manière dont les entreprises d'IA abordent la sécurité et l'éthique. Sans véritable responsabilité et investissement dans des sauvegardes robustes, des incidents similaires continueront de se produire dans toute l'industrie.

L'incident souligne également le besoin urgent de normes à l'échelle de l'industrie concernant la génération d'images par IA, en particulier lorsqu'elle implique de vraies personnes. L'autorégulation par les plateformes s'est avérée insuffisante, suggérant qu'une supervision plus complète pourrait être nécessaire.

Perspectives

La controverse Grok démontre que les seules annonces de politique ne peuvent pas empêcher les abus de l'IA. L'incapacité de X à restreindre efficacement son IA de générer des deepfakes non consensuels, malgré ses engagements publics, révèle une déconnexion fondamentale entre les intentions déclarées et les capacités techniques.

Mercredi soir, les sauvegardes de la plateforme restaient inadéquates, permettant la génération continue de contenu révélateur. Cet échec persistant suggère que des solutions significatives nécessiteront des approches nettement plus sophistiquées pour la sécurité de l'IA, incluant potentiellement l'analyse de contenu en temps réel et une compréhension plus nuancée de l'intention de l'utilisateur.

La communauté plus large de l'IA doit faire face à la réalité que les puissants outils de génération d'images seront inévitablement mal utilisés sans des sauvegardes robustes et adaptatives. L'expérience de X sert d'avertissement sur les dangers du déploiement d'une telle technologie avant que des mesures de sécurité complètes soient en place.

« des moments où le piratage hostile des prompts de Grok produit quelque chose d'inattendu »

— Elon Musk, Propriétaire de X et xAI

Questions Fréquemment Posées

Continue scrolling for more

L'IA transforme la recherche et les preuves mathématiques
Technology

L'IA transforme la recherche et les preuves mathématiques

L'intelligence artificielle passe d'une promesse à une réalité en mathématiques. Les modèles d'apprentissage génèrent désormais des théorèmes originaux, forçant une réévaluation de la recherche et de l'enseignement.

Just now
4 min
189
Read Article
Les cofondateurs de Thinking Machines Lab quittent pour rejoindre OpenAI
Technology

Les cofondateurs de Thinking Machines Lab quittent pour rejoindre OpenAI

Deux cofondateurs de Thinking Machines Lab rejoignent OpenAI. Un dirigeant confirme que ce mouvement de personnel était planifié depuis plusieurs semaines.

34m
3 min
0
Read Article
Grok AI interdit de déshabiller les images après un tollé mondial
Technology

Grok AI interdit de déshabiller les images après un tollé mondial

Elon Musk's platform X has implemented new restrictions on its AI chatbot Grok after widespread criticism over its ability to create sexually explicit content from photos of women and children.

37m
5 min
6
Read Article
La NASA réalise la première évacuation médicale de l'Histoire depuis la Station Spatiale Internationale
Science

La NASA réalise la première évacuation médicale de l'Histoire depuis la Station Spatiale Internationale

Dans une première historique, la NASA a réalisé une évacuation médicale depuis la Station Spatiale Internationale. Le retour anticipé de quatre astronautes met en lumière les défis des missions de longue durée et la préparation aux urgences en orbite.

56m
5 min
8
Read Article
L'Iran ferme son espace aérien en raison des tensions croissantes avec les États-Unis
World_news

L'Iran ferme son espace aérien en raison des tensions croissantes avec les États-Unis

L'Iran a fermé la majeure partie de son espace aérien mercredi soir en raison de l'escalade des tensions avec les États-Unis, forçant les compagnies aériennes à rerouter leurs vols.

1h
5 min
7
Read Article
Les déclarations de Mamdani exposent le dilemme des Juifs américains
Politics

Les déclarations de Mamdani exposent le dilemme des Juifs américains

Les récentes déclarations du maire de New York ont déclenché un débat intense, exposant un dilemme complexe que les Juifs américains affrontent aujourd'hui à l'intersection de leur identité religieuse et de leur idéologie politique.

1h
5 min
6
Read Article
Famille en deuil après la mort de Renee Good, victime d'une fusillade de la police des frontières
Crime

Famille en deuil après la mort de Renee Good, victime d'une fusillade de la police des frontières

La famille de Renee Maklin Good, mère de 37 ans abattue par un agent de l'ICE, annonce une enquête civile. La communauté exige transparence et responsabilité.

1h
5 min
7
Read Article
Grok restreint la création d'images IA suite à un tollé mondial
Technology

Grok restreint la création d'images IA suite à un tollé mondial

Grok a mis en place des restrictions strictes sur la création d'images sexualisées de personnes réelles suite à un tollé mondial et des enquêtes réglementaires.

1h
6 min
9
Read Article
xAI ajuste la politique de Grok sous la pression d'Apple
Technology

xAI ajuste la politique de Grok sous la pression d'Apple

xAI a annoncé des changements significatifs à ses capacités d'édition d'images Grok. Cette décision fait suite à des appels urgents de groupes de défense demandant à Apple d'agir contre la plateforme X.

1h
5 min
7
Read Article
Top 10 Programming Languages to Master in 2025
Technology

Top 10 Programming Languages to Master in 2025

Navigating the tech landscape in 2025 requires the right tools. We break down the top 10 programming languages based on industry demand, salary potential, and versatility to help you future-proof your career.

1h
10 min
3
Read Article
🎉

You're all caught up!

Check back later for more stories

Retour a l'accueil