Mohamed Seyam

احدث نماذج نفيديا

الكام يوم الي فاتو شركه nvidea قررت تفاجئ الكل وتدخل سباق ال ai مع google و openai واعلنت عن احدث نماذج الذكاء الاصطناعي الخاص بيها الا وهو Llama 3.1 70b instruct model

والنموذج ده هيكون open souce وانو مصمم عشان ينافس راس براس مع chatgpt 4 وغيره من النماذج المسيطره علي الساحه ومش بس بينافسهم ده تفوق عليهم في المنافسه.

النموذج مبني علي llama 3.1 وبيحتو علي 70 بليون بارامتر والنتايج الاوليه للموديل بعد ما تم اختباره كانت مفاجأه!!!

نيفديا اعلنت انو نتايج اختبار Arena Heart Benchmark وهو احد الbenchamarka الي بسستخدم في ال evaluation بتاع ال ai models ان الموديل حقق 85% متفوق علي open ai GPT-4o الي حقق 78%

كمان نيفديا اعلنت انو تفوق علي نظيره llama 3.1 405B -instruct الي احرز 69% ولك ان تتخيل الفرق في عدد الparameters

طب ايه الي يخلي الموديل الجديد يتفوق علي القديم بالرغم ان عدد ال parameters اقل ؟

كلنا عارفين ان كل ما عدد البارامترز زاد كل ما كان النموذج احسن ولكن نيفيديا هنا غيرت المعادلة. النموذج الجديد بتاعهم مش بيعتمد على زيادة حجم الـ parameters، بل على تحسين جودة تدريبه وكفاءة البيانات المستخدمة فيه. نموذج Llama 3.1 بيستخدم أساليب تدريب متقدمة زي alignment ، وبيعتمد على مجموعات بيانات مصممة بشكل خاص عشان تخليه أكثر دقة وتوافق مع طلبات المستخدمين.

ده معناه إنه بدل ما النموذج يبقى أكبر وأثقل، نيفيديا ركزت على تحسين فهم النموذج للسياق وتفاعله الذكي مع المدخلات اللي بياخدها. النتيجة النهائية كانت نموذج خفيف وأسرع لكنه بنفس الوقت بيقدم أداء متفوق حتى على نماذج أكبر منه بكتير في عدد الـ parameters.

طيب ايه هو ال alignment ؟

هو طريقة بتخلي النموذج مش بس يرد ردود تقنية صحيحة، لكن كمان يرد بطريقة متوافقة مع نية واحتياجات المستخدم. عشان يحقق ده، نيفيديا بتستخدم طرق تدريب متقدمة زي الـ reinforcement learning مع مجموعات بيانات مخصوصة زي HELM وHelPSteer.

مجموعات البيانات دي بتدي النموذج feedback ، بتعلمه يفرق بين الاختلافات اللغوية الدقيقة ويفهم تفضيلات المستخدمين المتنوعة. مثلاً، مجموعة بيانات HelPSteer بتركز على تدريب النموذج إنه يختار الرد المناسب من بين اختيارات متعددة ويراعي تفضيلات مختلفة.

الميزة الكبيرة كمان هي وجود feedback loops، بتخلي النموذج يتحسن بعد كل تفاعل جديد. ده بيخليه يقدر يتكيف بشكل سريع ويصحح أي خطأ ممكن يحصل، وده مهم في المجالات الحساسة زي الخدمات المالية أو القانونية، اللي أي خطأ بسيط فيها ممكن يسبب مشاكل كبيرة.

بكده، نيفيديا قدرت تعمل نموذج مش بس قوي، لكن كمان متكيّف وسهل في التعامل معاه في مواقف حقيقية.

في النهاية، خطوة نيفيديا بإطلاق نموذج Llama 3.1-70B Instruct المفتوح المصدر بتضع الشركات الكبرى ادام امرين اما انهم يشاركوا بجهد اكبر في النماذج مفتوحه المصدر او انهم يتمسكو بالنماذج المغلقه ؟