انویدیا با رونمایی از مدلهای منبع باز هوش مصنوعی فیزیکی و دیجیتال در کنفرانس NeurIPS، عصر جدیدی از توسعه در روباتیک و خودروهای خودران را آغاز کرد. مدل برجسته AR۱، اولین مدل استدلال باز بینایی-زبان-عمل جهان، به وسایل نقلیه خودران امکان میدهد تا در شرایط پیچیده شهری، با قضاوت و استدلال گام به گام، ایمنترین مسیر را انتخاب و اجرا کنند.
انویدیا؛ غول پردازشگر و فرمانروای هوش مصنوعی
انویدیا (NVIDIA) که در ابتدا به عنوان پیشگام در تولید واحدهای پردازش گرافیکی (GPU) برای بازیهای ویدیویی شناخته میشد، در دهههای اخیر به یک نیروی محرکه کلیدی در انقلاب هوش مصنوعی (AI) تبدیل شده است. دلیل این تحول، ساختار موازی پردازندههای گرافیکی است که آنها را به طور منحصربهفردی برای انجام محاسبات سنگین و همزمان مورد نیاز در یادگیری عمیق (Deep Learning) و آموزش مدلهای هوش مصنوعی مناسب میسازد. امروزه، تراشههای انویدیا قلب تپنده بزرگترین مراکز داده، سوپرکامپیوترها و زیرساختهای ابری مورد استفاده برای توسعه و استقرار هوش مصنوعی در سطح جهان هستند.
تمرکز انویدیا تنها بر سختافزار نیست؛ این شرکت با توسعه اکوسیستم نرمافزاری قوی مانند CUDA، مجموعهای از ابزارها، کتابخانهها و پلتفرمها را ارائه میدهد که به محققان، توسعهدهندگان و شرکتها امکان میدهد تا به راحتی از قدرت GPUها برای نوآوریهای هوش مصنوعی استفاده کنند. این موقعیت استراتژیک، انویدیا را نه تنها یک تولیدکننده تراشه، بلکه یک معمار برای آینده هوش مصنوعی و کاربردهای آن در زمینههایی چون خودروهای خودران، روباتیک، مراقبتهای بهداشتی و شبیهسازیهای پیشرفته تبدیل کرده است.
جهش انویدیا در هوش مصنوعی منبع باز برای روباتیک و رانندگی خودران
انویدیا در کنفرانس معتبر NeurIPS، یکی از مهمترین گردهماییهای جهانی در حوزه هوش مصنوعی، پرده از مجموعه جدیدی از مدلهای بنیادین (Foundation Models) منبع باز برداشت. این رونمایی نه تنها نشاندهنده پیشرفتهای فنی عظیم انویدیا است، بلکه تأکیدی بر استراتژی این شرکت در ترویج توسعه باز (Open-Source Development) در حوزههای حیاتی هوش مصنوعی فیزیکی و دیجیتال است. با ارائه این مدلها، انویدیا عملاً دروازههای نوآوری سریعتر را در صنایع کلیدی مانند خودروهای خودران، روباتیک پیشرفته و پردازش گفتار باز کرده است.
معرفی مدل پیشگام «AR۱» برای رانندگی خودران
جذابترین بخش این دستاورد، معرفی مدل آلپامایو آر-یک (AR۱) است. انویدیا این مدل را به عنوان اولین مدل استدلال باز بینایی-زبان-عمل (VLA) در جهان برای حوزه رانندگی خودران معرفی کرده است. AR۱ به گونهای طراحی شده که قابلیتهای منحصر به فردی برای ترکیب استدلال زنجیره افکار (Chain-of-Thought Reasoning) با برنامهریزی مسیر (Path Planning) دارد. برخلاف سیستمهای خودران سنتی که صرفاً بر الگوهای داده تکیه میکنند، AR۱ به وسیله نقلیه اجازه میدهد تا در شرایط پیچیده رانندگی، قضاوتهای انسانمانندی انجام دهد و یک لایه هوشمندی عمیقتر را ارائه کند.
هوشمندی AR۱ در موقعیتهای چالشبرانگیز
توانایی واقعی AR۱ در تجزیه و تحلیل سناریوهای پیچیده و استدلال گام به گام نهفته است. این مدل قادر است مسیرهای ممکن را بهطور همزمان ارزیابی کرده و با بهرهگیری از پایهای غنی از دادهها، ایمنترین مسیر را انتخاب کند. این قابلیت به ویژه در محیطهای شهری شلوغ بسیار حیاتی است؛ AR۱ میتواند بهطور مؤثری خودرو را در مواجهه با تقاطعهای پرتردد، حضور ناگهانی عابران پیاده، خودروهای دوبل پارک شده و خطوط مسدود شده کنترل کند. به عبارت دیگر، AR۱ بهجای واکنش صرف، پیشبینی و استدلال میکند.
اهمیت فلسفه منبع باز و اکوسیستم Cosmos Reason
انتشار این مدلها بهصورت منبع باز، یک عنصر محوری در استراتژی بزرگتر انویدیا است. مدل AR۱ بر پایه پلتفرم Cosmos Reason انویدیا توسعه یافته و محققان میتوانند برای اهداف غیرتجاری، آن را سفارشیسازی کرده و بهبود دهند. این چارچوب نرمافزاری، یک مجموعه ابزار جامع برای توسعه هوش مصنوعی فیزیکی است که شامل ابزارهایی مانند Lidar Gen برای تولید دادههای لیدار با کیفیت بالا جهت شبیهسازی خودروهای خودران میشود. این رویکرد، توسعه سریعتر، تستهای گستردهتر و دموکراتیزه شدن فناوریهای پیشرفته هوش مصنوعی را در سطح جهانی تسهیل میکند. همچنین، اشاره به یادگیری تقویتی پس از آموزش (Reinforcement Learning after Pre-training) نشاندهنده تعهد انویدیا به بهبود مستمر قابلیتهای استدلالی مدل است.
تأثیر گسترده بر صنعت و مشارکت شرکای کلیدی
تأییدیه و مشارکت گسترده شرکای اکوسیستم انویدیا، وزن این دستاوردها را دو چندان میکند. شرکتهای پیشرو در حوزههای روباتیک و رانندگی خودران، از جمله Voxel51، 1X، Figure AI، Foretellix، Gatik، Oxa، PlusAI و X-Humanoid، هماکنون از مدلهای بنیادین پلتفرم Cosmos در پروژههای خود استفاده میکنند. این پذیرش گسترده و سریع نشان میدهد که مدلهای جدید انویدیا نه تنها نویدبخش هستند، بلکه بهطور عملی نیازهای سطح بالای صنعتی را برآورده میسازند و پتانسیل تعریف مجدد استانداردهای توسعه در این حوزهها را دارند. برای ارزیابی عملکرد مدلها، محققان میتوانند از چارچوب AlpaSim استفاده کنند که یک بستر قوی برای آزمایشهای شبیهسازی فراهم میآورد.