ابزارهای هوش مصنوعی رتبه بندی میشوند
براساس سرعت پاسخگویی؛
معیارهای جدید هوش مصنوعی سرعت پاسخ این فناوری به پرسشهای عادی و تخصصی کاربران را آزمایش میکند.
به گزارش خبرگزاری علم و فناوری آنا به نقل از رویترز، شرکت صنعتی «ام ال کامانز» MLCommons که تعدادی از استانداردهای محک سختافزاری مرتبط با هوش مصنوعی را انجام میدهد، مجموعه جدیدی از آزمایشهایی را منتشر کرده که سرعت اجرای سخت افزارهای برتر را در اجرای برنامههای هوش مصنوعی و پاسخگویی به کاربران ارزیابی میکند.
دو معیار جدید اضافه شده توسط این شرکت صنعتی سرعتی را که تراشهها و سیستمهای هوش مصنوعی میتوانند از مدلهای قدرتمند هوش مصنوعی مملو از دادهها پاسخ دهند، اندازهگیری میکند. یکی از معیارهای جدید، قابلیت اندازه گیری سرعت سناریوی پرسش و پاسخ را برای مدلهای زبانی بزرگ اضافه کرده است. این ابزار جدید «لاما۲» (Llama ۲) نام دارد و شامل ۷۰ میلیارد پارامتر است که توسط متاپلتفرم توسعه یافته است.
نتایجی که تاکنون به دست آمده تقریباً نشان داده که برنامهای نظیر چتجیپیتی با چه سرعتی میتواند به درخواست کاربران پاسخ دهد.
عملکرد خام تنها معیاری نیست که هنگام استقرار برنامههای هوش مصنوعی بسیار مهم است. تراشههای هوش مصنوعی پیشرفته مقادیر زیادی انرژی جذب میکنند و یکی از مهمترین چالشهای شرکتهای هوش مصنوعی استقرار تراشههایی است که عملکرد بهینهای را برای حداقل مقدار انرژی ارائه میکنند. یک بنچمارک هوش مصنوعی جدید به نام آزمایشگاه قابلیتهای هوش مصنوعی(AI Benchmark) ابداع شده است که به طور خاص سرعت پاسخ به پرسشهای کاربر را مورد ارزیابی قرار میدهد. این آزمایشگاه با هدف اندازهگیری اینکه چقدر یک سیستم هوش مصنوعی میتواند به درستی و سریع پاسخ به پرسشهای کاربران داد، توسعه یافته است.
این بنچمارک شامل چندین تست مختلف است که به طور خاص بر روی بعضی از ویژگیها تمرکز دارد. یکی از این تستها تست سرعت پاسخ به پرسش معمولی است که زمانی که سیستم میتواند به تعداد زیادی از پرسشهای معمولی پاسخ دهد را اندازهگیری میکند. تست دیگر سرعت پاسخ به سوالات تخصصی است که میزان توانایی سیستم در پاسخ به سوالات پیچیده و تخصصی را تعیین میکند.
از آنجا که سرعت پاسخ به پرسشهای کاربران مهم تلقی میشود، این بنچمارک میتواند به شرکتها و توسعه دهندگان هوش مصنوعی کمک کند تا عملکرد سیستمهای خود را بهبود بخشند و به کاربران خود پاسخ دقیق و سریعی ارائه دهند و درنهایت بهبود عملکرد هوش مصنوعی و افزایش رضایت کاربران را به دنبال دارد.