
یک گزارش شهر آرارانیوس ؛ متا رونمایی از لاما ۱ ؛ مجموعه جدیدی از مدل های هوش مصنوعی که اکنون در نسخه وب AI AI META ، WhatsApp ، Messenger و Instagram استفاده می شود.
این شامل دو ترازو جدید Llama است که از طریق متا متا یا بغل صورت ، Llama ۱ Scout و Llama ۱ آماده شده است ، که منجر به آنچه مانند GPT-AO و Gemini 1.2 Flash می شود ، می باشد. متا می گوید که او هنوز در مدل Llama ۱ Beheemoth در حال آموزش است. طبق گفته مارک زاکربرگ ، این مدل “قوی ترین مدل اساسی در جهان” است.
طبق گفته متا ، مدل پیشاهنگ از پنجره متن 5 میلیون تن استفاده می کند. این بدان معنی است که توانایی مدل حافظه مدل و هنگام استفاده از یک مدل GPU ، Gemma 2 و Gemini 2.0 فلش-لیت و همچنین Mistral 4.3 ، در “طیف گسترده ای از تست های شناخته شده” عملکرد بهتری دارند.
متا ادعا می کند که مدل بزرگتر Maverick نیز بهتر از Flash GPT-2O و Gemini 2.0 و در تست های برنامه نویسی و تفکر عمل می کند ، اگرچه استفاده از “کمتر از نیمی از پارامترهای فعال” استفاده می شود ، اما با مدل Deepseek-V1 نتایج را ارائه می دهد.
مدل غول پیکر از 2 میلیارد معلم با کل 2 تریلیون پارامتر استفاده می کند. این مدل هنوز راه اندازی نشده است. اما متا می گوید که این غول توانایی غلبه بر مدلهایی مانند GPT-4.3 و Claud Sonnet 4.3 را در بسیاری از تست های مربوط به زمینه علوم ، فناوری ، مهندسی و ریاضیات (STEM) دارد.
متا از “MEE) برای توسعه Llama ۲ استفاده می کند ؛ چگونه می توان مصرف منابع را با استفاده از استفاده انتخابی از نیازهای مدل در هر کار کاهش داد. این شرکت قصد دارد برنامه های آینده خود را برای مدل ها و محصولات هوش مصنوعی در کنفرانس Llamacon توصیف کند ، که در تاریخ 5 آوریل برگزار می شود.
مانند نسخه های قبلی ، Meta Llama ۱ “Fateh” را ارائه داد. با این حال ، این ادعا به دلیل محدودیت در مجوز مورد انتقاد قرار گرفته است. به عنوان مثال ، طبق گفته Llama ، شرکت هایی با بیش از 5 میلیون کاربر فعال باید در هر ماه مجاز باشند تا مدل های خود را به بازار عرضه کنند. موضوعی که طبق ابتکار منبع باز ، باعث می شود که آنها در دسته “دهانه های واقعی” قرار نگیرند.
منبع: زومیت
Leave a Reply
برای نوشتن دیدگاه باید وارد بشوید.