M
MercyNews
Home
Back
نموذج واحد فقط قادر على الطيران الآلي للطائرات بدون طيار
تكنولوجيا

نموذج واحد فقط قادر على الطيران الآلي للطائرات بدون طيار

Hacker News7h ago
3 دقيقة قراءة
📋

حقائق رئيسية

  • يُعد SnapBench معياراً جديداً مصمماً لاختبار نماذج اللغة الكبيرة على قدرتها على الطيران الآلي للطائرات باستخدام البيانات البصرية.
  • كان GPT-4o هو النموذج الوحيد من بين جميع النماذج التي تم اختبارها الذي أكمل بنجاح تحدي الطيران الآلي للطائرات.
  • يسلط المعيار الضوء على فجوة كبيرة بين قدرات الذكاء الاصطناعي على التفكير وقدرته على أداء المهام الجسدية.
  • تشير هذه النتائج إلى أن نماذج اللغة الكبيرة الحالية ليست جاهزة بعد للاستخدام الواسع في تطبيقات الروبوتات المستقلة.

تحدي الطائرات بدون طيار

كشف معيار جديد عن قيد مقلق في الذكاء الاصطناعي الحالي: نموذج واحد فقط من نماذج اللغة الكبيرة أظهر القدرة على الطيران الآلي للطائرات بنجاح. تأتي هذه النتائج من SnapBench، إطار اختبار جديد مصمم لتقييم مدى قدرة أنظمة الذكاء الاصطناعي على تفسير البيانات البصرية وتنفيذ المهام الجسدية.

تم مشاركة المعيار مؤخراً على Hacker News، مما أثار نقاشاً حول جاهزية الذكاء الاصطناعي لتطبيقات الروبوتات. بينما أظهرت نماذج اللغة الكبيرة قدرات مذهلة في توليد النصوص والتفكير، تظل أداؤها في العالم الجسدي عقبة كبيرة. يوفر هذا الاختبار الأخير دليلاً ملموساً على هذه الفجوة.

داخل SnapBench

SnapBench يمثل حدوداً جديدة في تقييم الذكاء الاصطناعي، متجاوزاً معايير النص التقليدية لاختبار التطبيق في العالم الحقيقي. يتحدى الإطار النماذج بتحدي محدد: تفسير لقطات بصرية وإصدار أوامر لتنقل طائرة بدون طيار عبر مسار. يتطلب هذا مزيجاً من الفهم البصري، والتفكير المكاني، وإنشاء التعليمات الدقيقة.

تم تصميم الاختبار ليكون صارماً، محاكياً نوع اتخاذ القرار الديناميكي المطلوب للروبوتات المستقلة. على عكس المشكلات الثابتة، يتطلب طيران الطائرات بدون طيار تكيفاً مستمراً مع الظروف المتغيرة. تشير نتائج المعيار إلى أن معظم النماذج الحالية تفشل في سد الفجوة بين المعرفة المجردة والتنفيذ العملي.

الجوانب الرئيسية للمعيار تشمل:

  • متطلبات المعالجة البصرية في الوقت الحقيقي
  • مهام الملاحة المكانية المعقدة
  • إنشاء الأوامر المستمر
  • قيود السلامة والدقة

"نموذج واحد فقط يمكنه الطيران الآلي للطائرات بدون طيار"

— نتائج SnapBench

قصة النجاح الفريدة

من بين جميع النماذج التي تم اختبارها، برز GPT-4o كمرشح النجاح الوحيد. قدرته على معالجة المدخلات البصرية وإصدار أوامر طيران دقيقة ميزته عن المنافسين. يسلط هذا الإنجاز الضوء على قدرات النموذج المتقدمة في الفهم متعدد الوسائط وإمكانية دمجه مع الروبوتات.

يؤكد نجاح نموذج واحد صعوبة المهمة. بينما تتفوق العديد من نماذج اللغة الكبيرة في مهام اللغة، فإن تحويل هذه القدرة إلى إجراء جسدي يتطلب مستوى أعمق من الفهم. يشير أداء GPT-4o إلى أنه حقق تقدماً كبيراً في هذا المجال، رغم أن حقيقة أنه كان النموذج الوحيد الذي نجح تشير إلى مدى صعوبة هذا المجال.

نموذج واحد فقط يمكنه الطيران الآلي للطائرات بدون طيار

يعكس هذا الواقع القاسي حالة الذكاء الاصطناعي الحالي في الروبوتات. بينما يتم تحقيق التقدم، لا يزال الطريق إلى الوكلاء الذكيين المستقلين على نطاق واسع في العالم الجسدي في مراحله الأولى.

الآثار على الذكاء الاصطناعي

لنتائج SnapBench آثار كبيرة على مستقبل روبوتات الذكاء الاصطناعي. تشير إلى أن مجرد توسيع نطاق نماذج اللغة قد لا يكون كافياً لحل المهام الجسدية المعقدة. بدلاً من ذلك، قد تكون هناك حاجة إلى نهج جديد يجمع بين القدرات البصرية والمكانية والتحكم الحركي.

هذا الاكتشاف ذي صلة خاصة بالصناعات التي تستكشف الأتمتة، من اللوجستيات إلى الدفاع. يمكن لقدرة الذكاء الاصطناعي على تشغيل الطائرات بدون طيار بشكل موثوق تحويل العديد من القطاعات، لكن التكنولوجيا ليست ناضجة بما يكفي للنشر الواسع. يخدم المعيار كتحقق من الواقع، مما يخفف التوقعات بينما يوفر مؤشراً واضحاً للتحسين.

المجالات التي ستتطلب التركيز تشمل:

  • تعزيز التفكير البصري المكاني
  • دمج حلقات التغذية الراجعة الحسية
  • بروتوكولات السلامة للاستقلالية الجسدية
  • التدريب على سيناريوهات واقعية متنوعة

الطريق إلى الأمام

النقاش حول SnapBench وقدرات الطيران الآلي للطائرات بدون طيار هو جزء من نقاش أكبر حول قيود الذكاء الاصطناعي. مع أصبح مثل هذه المعايير أكثر شيوعاً، سيكون لدى المطورين أدوات أفضل لقياس التقدم وتحديد نقاط الضعف. هذه العملية المتكررة حيوية لتقدم المجال.

بينما قد تبدو النتائج الحالية محبطّة، فإنها توفر أساساً قيماً. يمكن تصميم النماذج المستقبلية مع هذه التحديات المحددة في الاعتبار، مما قد يؤدي إلى اختراقات في كيفية فهم الذكاء الاصطناعي وتفاعله مع العالم الجسدي. يوفر نجاح GPT-4o لمحة عما هو ممكن، بينما يسلط فشل الآخرين الضوء على العمل المتبقي.

النقاط الرئيسية

كشف اختبار SnapBench للطائرات بدون طيار أن تكنولوجيا الذكاء الاصطناعي الحالية لا تزال بعيدة عن القدرة على التعامل مع المهام الجسدية المعقدة بشكل موثوق. نموذج واحد فقط، GPT-4o، تمكن من إكمال التحدي بنجاح، مما يظهر أن معظم نماذج اللغة الكبيرة تفتقر إلى دمج المهارات البصرية والحركية اللازمة.

بالنسبة لصناعة الروبوتات، يمثل هذا تحدياً وفرصة معاً. توفر الفجوة الواضحة في الأداء توجيهاً للبحث والتطوير المستقبلي. مع استمرار تطور الذكاء الاصطناعي، ستكون معايير مثل SnapBench أساسية لتتبع التقدم نحو أنظمة مستقلة حقاً.

الأسئلة الشائعة

ما هو الاكتشاف الرئيسي لاختبار SnapBench؟

الاكتشاف الرئيسي هو أن نموذج واحد فقط من نماذج اللغة الكبيرة، GPT-4o، كان قادراً على الطيران الآلي للطائرات بنجاح بناءً على تعليمات بصرية. فشلت جميع النماذج الأخرى التي تم اختبارها في إكمال المهمة، مما كشف قيداً رئيسياً في تكنولوجيا الذكاء الاصطناعي الحالية.

لماذا هذا مهم لتطوير الذكاء الاصطناعي؟

هذا مهم لأنه يظهر أنه بينما تكون نماذج اللغة الكبيرة جيدة في مهام اللغة، فإنها تكافح مع الدمج المعقد للبيانات البصرية والتنفيذ الجسدي المطلوب للروبوتات. يسلط الضوء على مجال حاسم يحتاج فيه الذكاء الاصطناعي إلى تحسين قبل أن يمكن استخدامه بشكل موثوق في أنظمة مستقلة في العالم الحقيقي.

ماذا يعني هذا لمستقبل الذكاء الاصطناعي في الروبوتات؟

تشير النتائج إلى أن هناك حاجة إلى نهج جديد لسد الفجوة بين تفكير الذكاء الاصطناعي والإجراء الجسدي. من المرجح أن يركز التطوير المستقبلي على دمج أفضل للتفكير البصري المكاني والتحكم الحركي، باستخدام معايير مثل SnapBench لقياس التقدم.

Continue scrolling for more

الذكاء الاصطناعي يحول البحث والبراهين الرياضية
Technology

الذكاء الاصطناعي يحول البحث والبراهين الرياضية

لقد انتقل الذكاء الاصطناعي من وعد متقطع إلى واقع ملموس في الرياضيات، حيث تستخدم نماذج التعلم الآلي الآن لدعم استنباط براهين أصلية. يجبر هذا التطور على إعادة تقييم طرق البحث والتدريس في هذا التخصص.

Just now
4 min
410
Read Article
Europe must stop ‘dreaming’ about defence without US, Rutte warns
World_news

Europe must stop ‘dreaming’ about defence without US, Rutte warns

Nato chief says continent cannot afford to replace American security umbrella

30m
3 min
0
Read Article
Real_estate

Zoom's 'hidden gem' investment in Anthropic could be worth $2 billion to $4 billion, analysts say

Anthropic revealed that Zoom Ventures had invested in the AI startup in May 2023.

32m
3 min
0
Read Article
Billie Eilish Concert Doc Release Pushed to May; James Cameron Says ‘We’re Dialing in Cool, New 3D Tech’
Technology

Billie Eilish Concert Doc Release Pushed to May; James Cameron Says ‘We’re Dialing in Cool, New 3D Tech’

James Cameron revealed on Monday that the release of the Billie Eilish 3D concert documentary “Billie Eilish: Hit Me Hard and Soft,” which he co-directed with Eilish, has been pushed two more months to May 8 via Paramount. “We’re refining the cut; dialing in cool, new 3D tech; adding some special behind-the-scenes we know you’ll […]

44m
3 min
0
Read Article
Jensen Huang says it's 'ridiculous' to say Nvidia's $2 billion investment in CoreWeave is another circular deal
Technology

Jensen Huang says it's 'ridiculous' to say Nvidia's $2 billion investment in CoreWeave is another circular deal

Nvidia CEO Jensen Huang Markus Schreiber/AP Nvidia CEO Jensen Huang pushed back on criticism of the chipmaker's investment structures. Huang said its latest investment in CoreWeave was not a circular deal. Chipmakers' investments in leading tech companies, which are also customers, have raised worries about an AI bubble. Nvidia CEO Jensen Huang is done with the questions about circular financing. Huang called it "ridiculous" to suggest that Nvidia's latest deal, a $2 billion investment in CoreWeave, is the latest circular deal between AI chipmakers and tech companies, a trend that has sparked some concern among some investors. "These are generational companies — the investments that we make is confidence in them," Huang told Bloomberg News. "But it's a small percentage of the amount of money that they ultimately have to go raise, and so the idea that it is circular is — it's ridiculous." As part of the arrangement, Nvidia is expanding its previous investment in the cloud company by buying $2 billion worth of its shares. According to a joint statement, the money will assist CoreWeave's "procurement of land, power, and shell to build AI factories." The future AI factories will then be powered by Nvidia's chips. Huang portrayed the latest deal and past arrangements with the likes of OpenAI, Anthropic, and Elon Musk's xAI as just a small portion of what the companies need to raise to finance their massive AI expansion plans. For example, OpenAI is committed to spending roughly $1.4 trillion over the next eight years, largely on data centers. "Whatever we decide to invest is a small percentage, very small percentage of the overall amount of infrastructure, capital they're going to have to raise," Huang told CNBC in a separate interview. This is far from the first time Nvidia has bristled at concerns about its deals. In November, the world's largest company by market cap sent a letter to Wall Street analysts in response to investor Michael Burry of "The Big Short" fame, who has questioned whether Nvidia was on solid financial footing. "Nvidia's underlying business is economically sound, our reporting is complete and transparent, and we care about our reputation for integrity," the memo said. Burry has said he stands behind his analysis of the company, comparing it to one of Silicon Valley's giants before the Dotcom crash. "I am not claiming Nvidia is Enron," he wrote on his Substack. "It is clearly Cisco." Read the original article on Business Insider

46m
3 min
0
Read Article
watchOS 26.2.1 now available for Apple Watch, here’s what’s new
Technology

watchOS 26.2.1 now available for Apple Watch, here’s what’s new

Apple has just released watchOS 26.2.1, a new software update for Apple Watch users. Here’s what the update includes. more…

47m
3 min
0
Read Article
World_news

Google Books has been effectively killed by the last algorithm update

Article URL: https://old.reddit.com/r/google/comments/1qn1hk1/google_has_seemingly_entirely_removed_search/ Comments URL: https://news.ycombinator.com/item?id=46769201 Points: 3 # Comments: 0

49m
3 min
0
Read Article
How to generate AI images using ChatGPT
Technology

How to generate AI images using ChatGPT

Since March 2025, ChatGPT has been capable of generating images. Following a period where it briefly wasn't available to free users, you now don't even pay for one of OpenAI's subscriptions to use this feature. And while making images inside of ChatGPT is easy, there are some nuances worth explaining. For example, did you know you can ask ChatGPT to edit photos you've taken? It's more powerful than you might think. Here’s everything you need to know about generating AI images with ChatGPT. How to create images with ChatGPT using text prompts To begin making an image in ChatGPT, you can start by typing in the prompt bar. Igor Bonifacic for Engadget You can start generating images in ChatGPT simply by typing in the prompt bar what you want to see. There's no need to overthink things; as long as you have some version of "generate an image" followed by a description of your idea, ChatGPT will do the rest. Depending on the complexity of the prompt and whether you pay for ChatGPT, it may take a minute or two for the chatbot to complete your image request. Sometimes the process can take longer if OpenAI's servers are experiencing greater traffic than usual. At the end of last year, OpenAI updated the model powering image generation to make it faster, as well as better at rendering text and following instructions. At the same time, it added a dedicated "Images" section to ChatGPT's sidebar. Here you can see all the images you've made, alongside sample prompts and suggestions for styles to try out, making it a great place to start if you've never used an image generator before. How to create images with ChatGPT using existing photos You can also upload images to ChatGPT. Igor Bonifacic for Engadget In addition to generating images from text prompts, ChatGPT can modify existing photos or images you upload. This is my preferred way of making images with ChatGPT; I don't need to describe the composition, I can use an existing one to guide the chatbot. To use an existing image as a starting point for a new generation, follow these steps: Tap the "+" icon, located to the left of the prompt bar. Select Add photos & files. Select the image you want ChatGPT to edit. If uploading an image from your phone, you'll first need to grant ChatGPT access to your camera roll. Write a prompt describing the changes you want. If generating from the Images section, tap "Add photos" instead. Keep in mind any photos you upload to OpenAI's servers may be used by the company to train future models. You can opt out of allowing your data to be used for training by following these steps: Open the sidebar menu. On mobile, tap the two lines on the top left of the interface; on desktop, click instead on the OpenAI logo. Tap your name to access account settings. Tap Data controls. Toggle off Improve the model for everyone. How to edit the images ChatGPT generates ChatGPT gives you a few different ways to edit images. Igor Bonifacic for Engadget If you're unhappy with ChatGPT's output, you have two options. You can either prompt it to create an entirely new image, or edit parts of the picture it just generated. As always, the process for both involves simply typing what you want in the prompt bar. On mobile, OpenAI gives users a few different ways of accomplishing the same task. To generate an entirely new image: Tap the three dots icon below the image ChatGPT created. Select Retry. To edit part of an existing image generation: Tap the image ChatGPT created. Tap Select area. Use your finger to mask the section of the image you want ChatGPT to tweak. The slider on the left allows you to adjust the size of the masking brush. On desktop, masking is also available if you click on an image and then click on the paintbrush icon on the top right. Describe what you want ChatGPT to add, remove or replace through the prompt bar. ChatGPT can also blend one of your photos with an image it has generated. To do this: Tap an image ChatGPT created. Tap Blend in a photo. Upload the photo you wish Like all AI systems, ChatGPT is non-deterministic, meaning even if you prompt it in the same way multiple times, it won't generate the exact same response each time. Tips to create better images with ChatGPT The best advice I can offer is to be specific when prompting ChatGPT. The more detail you can provide when describing what you want from it, the better the results. And remember: ChatGPT can hallucinate — as you may have noticed from one of the example pictures I included above. In the image of the tortoiseshell cat, not only is the tortie not sitting on the window sill as instructed, it's sitting on a table that doesn't make much sense. So, most of all, be patient. Prompting an AI model is not exact science, and it can take a few tries before it creates the result you want. FAQs How do you access ChatGPT? ChatGPT is available on the web, desktop and mobile. To access it on your computer, open your preferred browser and navigate to chatgpt.com. OpenAI also offers dedicated Mac and Windows apps you can download from the company's website. On iOS and Android, you'll need to download the ChatGPT app from either the App Store or Google Play before you can start using the chatbot. Since ChatGPT runs on OpenAI's servers, as long as you can access the chatbot, you'll be able to use it to create images no matter the age of your phone or computer. Can ChatGPT generate images for free? Yes, ChatGPT can generate images for free, as long as you create an OpenAI account. However, there is a daily rate cap and GPT-5 will take longer to make a free image. Following March 27, 2025, OpenAI briefly limited free users to three image generations per day. The company has since relaxed that restriction, though it doesn't list a specific limit on its website. In my experience, you'll be able to generate about six to seven images every 24 hours. OpenAI offers three different subscription plans, each with their own set of image generation perks. ChatGPT Go, which costs $8 per month, offers "more image creation." ChatGPT Plus, which costs $20 per month, offers "expanded and faster image creation." ChatGPT Pro, which costs $200 per month, offers "unlimited and faster image creation." Note: ChatGPT Go will be included in OpenAI's forthcoming ads pilot, which will see the company display sponsored content alongside organic responses from ChatGPT. The company does not plan to display ads to Plus and Pro users. Can ChatGPT generate an existing photo? No. For copyright reasons, ChatGPT can't replicate photos or exact real world events. For example, when I asked it to recreate the photo of Zinedine Zidane's iconic 2006 World Cup headbutt, ChatGPT refused. "I can make an artistic reinterpretation inspired by the emotion or energy of that moment — for example, a stylized painting showing the tension and intensity of competition, without depicting real individuals," it told me. This article originally appeared on Engadget at https://www.engadget.com/ai/how-to-generate-ai-images-using-chatgpt-120000560.html?src=rss

50m
3 min
0
Read Article
World_news

House of Lords Votes to Ban UK Children from Using Internet VPNs

Article URL: https://www.ispreview.co.uk/index.php/2026/01/house-of-lords-votes-to-ban-uk-children-from-using-internet-vpns.html Comments URL: https://news.ycombinator.com/item?id=46769131 Points: 5 # Comments: 1

54m
3 min
0
Read Article
MCP unites Claude chat with apps like Slack, Figma, and Canva
Technology

MCP unites Claude chat with apps like Slack, Figma, and Canva

Anthropic's Claude got a bit livelier today thanks to a new extension to MCP, the open-source protocol that allows AI agents to easily access tools and data across the internet. Users will now be able to interact with apps directly inside the Claude chatbot, letting you draft and format Slack messages to colleagues and create presentations for clients in Canva without having to switch tabs. As of today, Anthropic said tools like Asana, Figma, Slack, and Canva will "open as interactive apps right inside of chat." While users could previously connect tools like Slack and Asana to the AI assistant, doing so meant getting text back. The company … Read the full story at The Verge.

55m
3 min
0
Read Article
🎉

You're all caught up!

Check back later for more stories

العودة للرئيسية