شفقنارسانه- مدلهای جدید اپل بهصورت متنباز اکنون برای محققان در دسترس هستند.
به گزارش شفقنارسانه از دیجیاتو، درحالیکه توجه علاقهمندان هوش مصنوعی اخیراً به مدل جدید و ارزان GPT-4o mini جلب شده، اپل تصمیم گرفته است خانواده مدلهای کوچک خود را گسترش دهد. بهتازگی محققان اپل چند مدل متنباز را تحت پروژهای موسوم به DCLM منتشر کردند.
براساس گزارش AppleInsider، خانواده هوش مصنوعی جدید اپل، شامل دو مدل اصلی است: یکی با ۷ میلیارد پارامتر و دیگری با ۱.۴ میلیارد پارامتر. هر دوی آنها در بنچمارکها عملکرد بسیار خوبی دارند، بهخصوص نمونه بزرگتر که بهتر از مدل Mistral-7B است و میتواند با سایر مدلهای متنباز پیشرو مانند Llama 3 از متا و Gemma از گوگل رقابت کند.
محققان اپل این مدلهای جدید را بهعنوان مدلهای متنباز با بهترین عملکرد توصیف کردهاند. نکته مهم این است که در این پروژه با انتشار کد آموزشی و مجموعه دادههای دیگر، مدلها به صورت متنباز در Hugging Face در دسترس هستند. همچنین هر دو مدل در بنچمارکهای MMLU امتیاز خوبی کسب کردند تا در برابر مدلهای تجاری دیگر رقابت کنند.
به گفته محققان اپل، مدل بزرگتر یک بهبود ۶.۶ درصدی در بنچمارکها در مقایسه با MAP-Neo (پیشرفتهترین مدل متنباز قبلی اپل) داشته است درحالیکه تا ۴۰ درصد از محاسبات کمتری برای آموزش آن استفاده شده است. از سوی دیگر، درست مانند مدل بزرگتر DCLM-7B، نسخه کوچکتر ۱.۴B این مدل که روی ۲.۶ تریلیون توکن آموزش دیده است، عملکرد قابلتوجهی را در تستهای MMLU ،Core و Extended ارائه میدهد.
اپل در اردیبهشتماه نیز از مدلهای متنباز OpenELM رونمایی کرد که در چهار مدل مختلف ۲۷۰ میلیون پارامتری، ۴۵۰ میلیون پارامتری، ۱.۱ میلیارد پارامتری و ۳ میلیارد پارامتری منتشر شد. به گفته اپل این مدلها در وظایف مربوط به پردازش متن مانند نوشتن ایمیل عملکرد خوبی دارند.
مدلهایی که محققان اپل منتشر کرده است، ظاهراً در هیچ یک از محصولات آینده اپل بهکار گرفته نمیشوند و بیشتر باید آنها را به عنوان پروژههای تحقیقاتی متنباز در نظر گرفت.
source