الخميس 06 فبراير 2025
الايام المصرية
رئيس التحرير
رضـــا حبيشى
رئيس التحرير
رضـــا حبيشى

مقارنة شاملة بين نموذج OpenAI o3-mini وDeepSeek-R1

مقارنة شاملة بين
مقارنة شاملة بين نموذج OpenAI o3-mini وDeepSeek-R1

مقارنة شاملة بين نموذج OpenAI o3-mini وDeepSeek-R1، أطلقت شركة OpenAI مؤخرًا نموذجها الجديد o3-mini، الذي تم تصميمه ليكون بديلًا متقدمًا في مجال الذكاء الاصطناعي، ويأتي هذا الإطلاق بعد فترة قصيرة من إطلاق نموذج DeepSeek-R1، الذي أثار ضجة كبيرة في الوسط التقني بفضل قدراته المتطورة وتكلفته المنخفضة، وسنقوم بمقارنة بين النموذجين استنادًا إلى نتائج بعض الاختبارات العالمية.

نظرة عامة على النماذج

نموذج o3-mini من OpenAI يهدف إلى تقديم أداء متفوق في مجموعة متنوعة من المهام، بينما يركز DeepSeek-R1 على تقديم نموذج اقتصادي مع أداء جيد، كلا النموذجين يستهدفان تلبية احتياجات المطورين والمستخدمين في مجالات متعددة.

اختبار LiveBench .. الأداء في المهام المختلفة

اختبار LiveBench هو معيار لتقييم أداء النماذج اللغوية الكبيرة (LLMs) في مجالات مثل الرياضيات، البرمجة، التفكير المنطقي، واللغة، وإليكم نتائج الاختبارات:

مقارنة شاملة بين نموذج OpenAI o3-mini وDeepSeek-R1

متوسط الأداء العام

  • o3-mini: 73.94
  • DeepSeek-R1: 71.38
  • التفوق: o3-mini

متوسط الأداء في التفكير والاستدلال:

  • o3-mini: 89.58
  • DeepSeek-R1: 83.17
  • التفوق: o3-mini

متوسط الأداء في البرمجة

متوسط الأداء في الرياضيات

  • o3-mini: 65.65
  • DeepSeek-R1: 79.54
  • التفوق: DeepSeek-R1

متوسط الأداء في تحليل البيانات

  • o3-mini: 70.64
  • DeepSeek-R1: 69.78
  • التفوق: o3-mini
مقارنة شاملة بين نموذج OpenAI o3-mini وDeepSeek-R1

اختبارات إضافية: حل الألغاز ودقة الإجابات

  • في اختبار NYT Connections، حصل o3-mini على 72.4 نقطة، مما يجعله من أفضل النماذج في حل الألغاز، بينما حصل DeepSeek-R1 على 54.4 نقطة.
  • في اختبار Humanity’s Last Exam، الذي يقيس دقة النموذج، حصل o3-mini على دقة تبلغ 13.0%، بينما حصل DeepSeek-R1 على 9.4%.

التكلفة: أيهما أكثر اقتصادية؟

O3-mini:

  • السعر لكل مليون رمز إدخال: 55 سنتًا
  • السعر لكل مليون رمز إخراج: 4 دولارات و40 سنتًا

DeepSeek-R1:

  • السعر لكل مليون رمز إدخال: 14 سنتًا
  • السعر لكل مليون رمز إخراج: 2 دولار و19 سنتًا
مقارنة شاملة بين نموذج OpenAI o3-mini وDeepSeek-R1

تشير هذه الأرقام إلى أن DeepSeek-R1 هو الخيار المناسب لمن يبحثون عن نموذج اقتصادي.

يتفوق نموذج OpenAI o3-mini في معظم الاختبارات، خاصة في الاستدلال والبرمجة والأداء العام. ومع ذلك، يتفوق DeepSeek-R1 في الرياضيات، ومن حيث التكلفة، فإن DeepSeek-R1 أكثر اقتصادية، مما يجعله خيارًا مناسبًا لمن يبحثون عن نموذج منخفض التكلفة.

تم نسخ الرابط