M
MercyNews
Home
Back
Un seul LLM peut faire voler un drone avec succès
Technologie

Un seul LLM peut faire voler un drone avec succès

Hacker News7h ago
3 min de lecture
📋

Points Clés

  • SnapBench est un nouveau benchmark conçu pour tester les grands modèles de langage sur leur capacité à faire voler des drones en utilisant des données visuelles.
  • GPT-4o était le seul modèle parmi tous ceux testés à avoir réussi le défi de vol de drone.
  • Le benchmark met en évidence un écart significatif entre les capacités de raisonnement de l'IA et sa capacité à effectuer des tâches physiques.
  • Ces découvertes suggèrent que les LLM actuels ne sont pas encore prêts pour une utilisation généralisée dans les applications de robotique autonome.

Le Défi du Drone

Un nouveau benchmark a révélé une limitation surprenante dans l'intelligence artificielle actuelle : un seul grand modèle de langage a démontré la capacité de faire voler un drone avec succès. Les résultats proviennent de SnapBench, un nouveau cadre de test conçu pour évaluer la capacité des systèmes d'IA à interpréter des données visuelles et à exécuter des tâches physiques.

Le benchmark a été récemment partagé sur Hacker News, déclenchant des discussions sur la préparation de l'IA aux applications de robotique. Bien que les LLM aient montré des capacités impressionnantes dans la génération de texte et le raisonnement, leur performance dans le monde physique reste un obstacle important. Ce dernier test fournit des preuves concrètes de cet écart.

À l'intérieur de SnapBench

SnapBench représente une nouvelle frontière dans l'évaluation de l'IA, allant au-delà des benchmarks traditionnels basés sur le texte pour tester des applications réelles. Le cadre présente aux modèles un défi spécifique : interpréter des instantanés visuels et émettre des commandes pour naviguer un drone à travers un parcours. Cela nécessite une combinaison de compréhension visuelle, de raisonnement spatial et de génération d'instructions précises.

Le test est conçu pour être rigoureux, simulant le type de prise de décision dynamique requise pour la robotique autonome. Contrairement aux problèmes statiques, le vol de drone exige une adaptation continue aux conditions changeantes. Les résultats du benchmark indiquent que la plupart des modèles actuels échouent à combler l'écart entre les connaissances abstraites et l'exécution pratique.

Les aspects clés du benchmark incluent :

  • Exigences de traitement visuel en temps réel
  • Tâches complexes de navigation spatiale
  • Génération continue de commandes
  • Contraintes de sécurité et de précision

"Seul 1 LLM peut faire voler un drone"

— Découvertes de SnapBench

L'Histoire du Seul Succès

Parmi tous les modèles testés, GPT-4o est apparu comme le seul candidat réussi. Sa capacité à traiter les entrées visuelles et à générer des commandes de vol précises l'a distingué de ses concurrents. Ce succès met en lumière les capacités avancées du modèle en compréhension multimodale et son potentiel pour l'intégration en robotique.

Le succès d'un seul modèle souligne la difficulté de la tâche. Bien que de nombreux LLM excellent dans les tâches linguistiques, traduire cette capacité en action physique nécessite un niveau de compréhension plus profond. La performance de GPT-4o suggère qu'il a fait des progrès significatifs dans ce domaine, bien que le fait qu'il soit le seul modèle à réussir indique à quel point ce domaine reste difficile.

Seul 1 LLM peut faire voler un drone

La réalité brutale de cette affirmation reflète l'état actuel de l'IA en robotique. Bien que des progrès soient réalisés, le chemin vers des agents IA autonomes répandus dans le monde physique en est encore à ses débuts.

Implications pour l'IA

Les résultats de SnapBench ont des implications importantes pour l'avenir de la robotique d'IA. Ils suggèrent que simplement augmenter l'échelle des modèles de langage peut ne pas être suffisant pour résoudre des tâches physiques complexes. Au lieu de cela, de nouvelles approches qui intègrent les capacités visuelles, spatiales et de contrôle moteur pourraient être nécessaires.

Cette découverte est particulièrement pertinente pour les industries explorant l'automatisation, de la logistique à la défense. La capacité de l'IA à faire fonctionner des drones de manière fiable pourrait transformer de nombreux secteurs, mais la technologie n'est pas encore assez mature pour un déploiement à grande échelle. Le benchmark sert de contrôle de réalité, tempérant les attentes tout en fournissant une mesure claire pour l'amélioration.

Les domaines qui nécessiteront une attention incluent :

  • Raisonnement visuel-spatial amélioré
  • Intégration des boucles de rétroaction sensorielle
  • Protocoles de sécurité pour l'autonomie physique
  • Formation sur des scénarios réels diversifiés

La Voie à Suivre

La conversation autour de SnapBench et des capacités de vol de drone fait partie d'une discussion plus large sur les limitations de l'IA. À mesure que des benchmarks comme celui-ci deviennent plus courants, les développeurs auront de meilleurs outils pour mesurer les progrès et identifier les faiblesses. Ce processus itératif est crucial pour faire avancer le domaine.

Alors que les résultats actuels peuvent sembler décevants, ils fournissent une base précieuse. Les futurs modèles peuvent être conçus en tenant compte de ces défis spécifiques, menant potentiellement à des avancées dans la façon dont l'IA comprend et interagit avec le monde physique. Le succès de GPT-4o offre un aperçu de ce qui est possible, tandis que l'échec des autres souligne le travail qui reste à faire.

Points Clés

Le test de drone SnapBench révèle que la technologie de l'IA actuelle a encore beaucoup de chemin à parcourir avant de pouvoir gérer de manière fiable des tâches physiques complexes. Un seul modèle, GPT-4o, a réussi à relever le défi, montrant que la plupart des LLM manquent de l'intégration nécessaire des compétences visuelles et motrices.

Pour l'industrie de la robotique, cela représente à la fois un défi et une opportunité. L'écart clair de performance fournit une direction pour la recherche et le développement futurs. À mesure que l'IA continue d'évoluer, des benchmarks comme SnapBench seront essentiels pour suivre les progrès vers des systèmes véritablement autonomes.

Questions Fréquemment Posées

Quelle est la découverte principale du test SnapBench ?

La découverte principale est qu'un seul grand modèle de langage, GPT-4o, a réussi à faire voler un drone sur la base d'instructions visuelles. Tous les autres modèles testés ont échoué à accomplir la tâche, révélant une limitation majeure dans la technologie de l'IA actuelle.

Pourquoi est-ce important pour le développement de l'IA ?

C'est important car cela montre que bien que les LLM soient bons dans les tâches linguistiques, ils peinent avec l'intégration complexe des données visuelles et de l'exécution physique requise pour la robotique. Cela met en évidence un domaine critique où l'IA doit s'améliorer avant de pouvoir être utilisée de manière fiable dans des systèmes autonomes réels.

Que signifie cela pour l'avenir de l'IA en robotique ?

Les résultats suggèrent que de nouvelles approches sont nécessaires pour combler l'écart entre le raisonnement de l'IA et l'action physique. Le développement futur se concentrera probablement sur une meilleure intégration du raisonnement visuel-spatial et du contrôle moteur, en utilisant des benchmarks comme SnapBench pour mesurer les progrès.

Continue scrolling for more

L'IA transforme la recherche et les preuves mathématiques
Technology

L'IA transforme la recherche et les preuves mathématiques

L'intelligence artificielle passe d'une promesse à une réalité en mathématiques. Les modèles d'apprentissage génèrent désormais des théorèmes originaux, forçant une réévaluation de la recherche et de l'enseignement.

Just now
4 min
410
Read Article
Europe must stop ‘dreaming’ about defence without US, Rutte warns
World_news

Europe must stop ‘dreaming’ about defence without US, Rutte warns

Nato chief says continent cannot afford to replace American security umbrella

30m
3 min
0
Read Article
Real_estate

Zoom's 'hidden gem' investment in Anthropic could be worth $2 billion to $4 billion, analysts say

Anthropic revealed that Zoom Ventures had invested in the AI startup in May 2023.

33m
3 min
0
Read Article
Billie Eilish Concert Doc Release Pushed to May; James Cameron Says ‘We’re Dialing in Cool, New 3D Tech’
Technology

Billie Eilish Concert Doc Release Pushed to May; James Cameron Says ‘We’re Dialing in Cool, New 3D Tech’

James Cameron revealed on Monday that the release of the Billie Eilish 3D concert documentary “Billie Eilish: Hit Me Hard and Soft,” which he co-directed with Eilish, has been pushed two more months to May 8 via Paramount. “We’re refining the cut; dialing in cool, new 3D tech; adding some special behind-the-scenes we know you’ll […]

44m
3 min
0
Read Article
Jensen Huang says it's 'ridiculous' to say Nvidia's $2 billion investment in CoreWeave is another circular deal
Technology

Jensen Huang says it's 'ridiculous' to say Nvidia's $2 billion investment in CoreWeave is another circular deal

Nvidia CEO Jensen Huang Markus Schreiber/AP Nvidia CEO Jensen Huang pushed back on criticism of the chipmaker's investment structures. Huang said its latest investment in CoreWeave was not a circular deal. Chipmakers' investments in leading tech companies, which are also customers, have raised worries about an AI bubble. Nvidia CEO Jensen Huang is done with the questions about circular financing. Huang called it "ridiculous" to suggest that Nvidia's latest deal, a $2 billion investment in CoreWeave, is the latest circular deal between AI chipmakers and tech companies, a trend that has sparked some concern among some investors. "These are generational companies — the investments that we make is confidence in them," Huang told Bloomberg News. "But it's a small percentage of the amount of money that they ultimately have to go raise, and so the idea that it is circular is — it's ridiculous." As part of the arrangement, Nvidia is expanding its previous investment in the cloud company by buying $2 billion worth of its shares. According to a joint statement, the money will assist CoreWeave's "procurement of land, power, and shell to build AI factories." The future AI factories will then be powered by Nvidia's chips. Huang portrayed the latest deal and past arrangements with the likes of OpenAI, Anthropic, and Elon Musk's xAI as just a small portion of what the companies need to raise to finance their massive AI expansion plans. For example, OpenAI is committed to spending roughly $1.4 trillion over the next eight years, largely on data centers. "Whatever we decide to invest is a small percentage, very small percentage of the overall amount of infrastructure, capital they're going to have to raise," Huang told CNBC in a separate interview. This is far from the first time Nvidia has bristled at concerns about its deals. In November, the world's largest company by market cap sent a letter to Wall Street analysts in response to investor Michael Burry of "The Big Short" fame, who has questioned whether Nvidia was on solid financial footing. "Nvidia's underlying business is economically sound, our reporting is complete and transparent, and we care about our reputation for integrity," the memo said. Burry has said he stands behind his analysis of the company, comparing it to one of Silicon Valley's giants before the Dotcom crash. "I am not claiming Nvidia is Enron," he wrote on his Substack. "It is clearly Cisco." Read the original article on Business Insider

46m
3 min
0
Read Article
watchOS 26.2.1 now available for Apple Watch, here’s what’s new
Technology

watchOS 26.2.1 now available for Apple Watch, here’s what’s new

Apple has just released watchOS 26.2.1, a new software update for Apple Watch users. Here’s what the update includes. more…

48m
3 min
0
Read Article
World_news

Google Books has been effectively killed by the last algorithm update

Article URL: https://old.reddit.com/r/google/comments/1qn1hk1/google_has_seemingly_entirely_removed_search/ Comments URL: https://news.ycombinator.com/item?id=46769201 Points: 3 # Comments: 0

50m
3 min
0
Read Article
How to generate AI images using ChatGPT
Technology

How to generate AI images using ChatGPT

Since March 2025, ChatGPT has been capable of generating images. Following a period where it briefly wasn't available to free users, you now don't even pay for one of OpenAI's subscriptions to use this feature. And while making images inside of ChatGPT is easy, there are some nuances worth explaining. For example, did you know you can ask ChatGPT to edit photos you've taken? It's more powerful than you might think. Here’s everything you need to know about generating AI images with ChatGPT. How to create images with ChatGPT using text prompts To begin making an image in ChatGPT, you can start by typing in the prompt bar. Igor Bonifacic for Engadget You can start generating images in ChatGPT simply by typing in the prompt bar what you want to see. There's no need to overthink things; as long as you have some version of "generate an image" followed by a description of your idea, ChatGPT will do the rest. Depending on the complexity of the prompt and whether you pay for ChatGPT, it may take a minute or two for the chatbot to complete your image request. Sometimes the process can take longer if OpenAI's servers are experiencing greater traffic than usual. At the end of last year, OpenAI updated the model powering image generation to make it faster, as well as better at rendering text and following instructions. At the same time, it added a dedicated "Images" section to ChatGPT's sidebar. Here you can see all the images you've made, alongside sample prompts and suggestions for styles to try out, making it a great place to start if you've never used an image generator before. How to create images with ChatGPT using existing photos You can also upload images to ChatGPT. Igor Bonifacic for Engadget In addition to generating images from text prompts, ChatGPT can modify existing photos or images you upload. This is my preferred way of making images with ChatGPT; I don't need to describe the composition, I can use an existing one to guide the chatbot. To use an existing image as a starting point for a new generation, follow these steps: Tap the "+" icon, located to the left of the prompt bar. Select Add photos & files. Select the image you want ChatGPT to edit. If uploading an image from your phone, you'll first need to grant ChatGPT access to your camera roll. Write a prompt describing the changes you want. If generating from the Images section, tap "Add photos" instead. Keep in mind any photos you upload to OpenAI's servers may be used by the company to train future models. You can opt out of allowing your data to be used for training by following these steps: Open the sidebar menu. On mobile, tap the two lines on the top left of the interface; on desktop, click instead on the OpenAI logo. Tap your name to access account settings. Tap Data controls. Toggle off Improve the model for everyone. How to edit the images ChatGPT generates ChatGPT gives you a few different ways to edit images. Igor Bonifacic for Engadget If you're unhappy with ChatGPT's output, you have two options. You can either prompt it to create an entirely new image, or edit parts of the picture it just generated. As always, the process for both involves simply typing what you want in the prompt bar. On mobile, OpenAI gives users a few different ways of accomplishing the same task. To generate an entirely new image: Tap the three dots icon below the image ChatGPT created. Select Retry. To edit part of an existing image generation: Tap the image ChatGPT created. Tap Select area. Use your finger to mask the section of the image you want ChatGPT to tweak. The slider on the left allows you to adjust the size of the masking brush. On desktop, masking is also available if you click on an image and then click on the paintbrush icon on the top right. Describe what you want ChatGPT to add, remove or replace through the prompt bar. ChatGPT can also blend one of your photos with an image it has generated. To do this: Tap an image ChatGPT created. Tap Blend in a photo. Upload the photo you wish Like all AI systems, ChatGPT is non-deterministic, meaning even if you prompt it in the same way multiple times, it won't generate the exact same response each time. Tips to create better images with ChatGPT The best advice I can offer is to be specific when prompting ChatGPT. The more detail you can provide when describing what you want from it, the better the results. And remember: ChatGPT can hallucinate — as you may have noticed from one of the example pictures I included above. In the image of the tortoiseshell cat, not only is the tortie not sitting on the window sill as instructed, it's sitting on a table that doesn't make much sense. So, most of all, be patient. Prompting an AI model is not exact science, and it can take a few tries before it creates the result you want. FAQs How do you access ChatGPT? ChatGPT is available on the web, desktop and mobile. To access it on your computer, open your preferred browser and navigate to chatgpt.com. OpenAI also offers dedicated Mac and Windows apps you can download from the company's website. On iOS and Android, you'll need to download the ChatGPT app from either the App Store or Google Play before you can start using the chatbot. Since ChatGPT runs on OpenAI's servers, as long as you can access the chatbot, you'll be able to use it to create images no matter the age of your phone or computer. Can ChatGPT generate images for free? Yes, ChatGPT can generate images for free, as long as you create an OpenAI account. However, there is a daily rate cap and GPT-5 will take longer to make a free image. Following March 27, 2025, OpenAI briefly limited free users to three image generations per day. The company has since relaxed that restriction, though it doesn't list a specific limit on its website. In my experience, you'll be able to generate about six to seven images every 24 hours. OpenAI offers three different subscription plans, each with their own set of image generation perks. ChatGPT Go, which costs $8 per month, offers "more image creation." ChatGPT Plus, which costs $20 per month, offers "expanded and faster image creation." ChatGPT Pro, which costs $200 per month, offers "unlimited and faster image creation." Note: ChatGPT Go will be included in OpenAI's forthcoming ads pilot, which will see the company display sponsored content alongside organic responses from ChatGPT. The company does not plan to display ads to Plus and Pro users. Can ChatGPT generate an existing photo? No. For copyright reasons, ChatGPT can't replicate photos or exact real world events. For example, when I asked it to recreate the photo of Zinedine Zidane's iconic 2006 World Cup headbutt, ChatGPT refused. "I can make an artistic reinterpretation inspired by the emotion or energy of that moment — for example, a stylized painting showing the tension and intensity of competition, without depicting real individuals," it told me. This article originally appeared on Engadget at https://www.engadget.com/ai/how-to-generate-ai-images-using-chatgpt-120000560.html?src=rss

50m
3 min
0
Read Article
World_news

House of Lords Votes to Ban UK Children from Using Internet VPNs

Article URL: https://www.ispreview.co.uk/index.php/2026/01/house-of-lords-votes-to-ban-uk-children-from-using-internet-vpns.html Comments URL: https://news.ycombinator.com/item?id=46769131 Points: 5 # Comments: 1

54m
3 min
0
Read Article
MCP unites Claude chat with apps like Slack, Figma, and Canva
Technology

MCP unites Claude chat with apps like Slack, Figma, and Canva

Anthropic's Claude got a bit livelier today thanks to a new extension to MCP, the open-source protocol that allows AI agents to easily access tools and data across the internet. Users will now be able to interact with apps directly inside the Claude chatbot, letting you draft and format Slack messages to colleagues and create presentations for clients in Canva without having to switch tabs. As of today, Anthropic said tools like Asana, Figma, Slack, and Canva will "open as interactive apps right inside of chat." While users could previously connect tools like Slack and Asana to the AI assistant, doing so meant getting text back. The company … Read the full story at The Verge.

55m
3 min
0
Read Article
🎉

You're all caught up!

Check back later for more stories

Retour a l'accueil