هوش مصنوعي آزمايشي وانيلا ماوريك متا از رقبايش عقب ماند
متا طي روزهاي گذشته به دليل استفاده از يك نسخه آزمايشي و منتشر نشده از هوش مصنوعي مدل Llama 4 Maverick براي دستيابي به امتياز بالاتري در يك بنچمارك با انتقادات زيادي روبرو شد.
متا طي روزهاي گذشته به دليل استفاده از يك نسخه آزمايشي و منتشر نشده از هوش مصنوعي مدل Llama 4 Maverick براي دستيابي به امتياز بالاتري در يك بنچمارك با انتقادات زيادي روبرو شد. به گزارش مهر به نقل از تك كرانچ، اين رويداد سبب شد نگهدارندگان اين بنچمارك عذرخواهي كنند و سياستهايشان را تغيير دهند و به vanilla Maverick اصلاح نشده امتياز دهند. نسخه اصلاح نشده ماوريك در ردهاي پايينتر از مدلهاي جي پي تي ۴-o اوپناي آي، كلاود ۳.۵ سونت شركت آنتروپيك و جميناي ۱.۵ گوگل قرار گرفته است. بسياري از اين مدلهاي هوش مصنوعي فقط چند ماه از عرضه شان گذشته است، LM Arena به دلايل مختلف معياري معتبر براي عملكرد يك مدل هوش مصنوعي به حساب نميآيد. اما ساخت يك مدل براي عملكرد در يك بنچمارك علاوه بر آنكه گمراهكننده است، سبب ميشود توسعهدهندگان نرمافزار براي پيش بيني آنكه هوش مصنوعي در بسترهاي مختلف چقدر عملكرد مناسبي دارد، با چالش روبرو شوند. سخنگوي متا در بيانيهاي در اين باره نوشت متا نسخههاي مختلفي از انواع سفارشي مدلهاي هوش مصنوعي را آزمايش ميكند. وي در اين باره گفت مدل Llama 4 Maverickدر حقيقت يك نسخه بهينه چت بات است كه ما آن را آزمايش كرديم كه در بنچمارك LM Arena نيز عملكرد خوبي داشت. ما نسخه منبع باز اين مدل را اكنون ارايه كردهايم و منتظريم تا ببينيم توسعهدهندگان نرمافزار چگونه Llama4 را براي موارد استفاده خود شخصيسازي ميكنند.