نسخه جدید هوش مصنوعی دیپ سیک با بهبودهای قابل توجه معرفی شد

نسخه جدید هوش مصنوعی دیپ سیک با پیشرفت‌های قابل‌توجهی عرضه شده که سبب می‌شود رقیب سرسخت‌تری برای چت‌بات‌های معروفی مانند ChatGPT و گراک باشد.

دیپ سیک با معرفی مدل جدید R1-0528، گام بزرگ دیگری برای رقابت با برترین مدل‌های هوش مصنوعی از جمله ChatGPT و جمینای برداشته است.

نسخه جدید هوش مصنوعی دیپ سیک با کاهش خطاهای منطقی و عملکرد بهتر در بنچمارک‌های معتبر، حالا رقیب بسیار دشوارتری برای برترین چت‌بات‌های هوش مصنوعی است.

ویژگی‌های نسخه جدید هوش مصنوعی دیپ سیک R1-0528

شرکت دیپ سیک نسخه جدید مدل زبان بزرگ خود را با نام DeepSeek-R1-0528 منتشر کرده است. این مدل نسخه به‌روزشده‌ای از مدل R1 اصلی به‌شمار می‌رود و طبق اعلام رسمی، دارای توانایی استدلال بهتر، کاهش خطاهای توهمی (hallucination)، و عملکرد بهینه‌تر در آزمون‌های هوش مصنوعی مختلف است.

دیپ‌سیک که پیش‌تر با عرضه مدل‌های V3 و R1 با زمان و هزینه آموزش کمتر نسبت به رقبا توانسته بود در میان ۱۰ مدل برتر جهان قرار گیرد، حالا با نسخه R1-0528 سعی دارد جایگاه خود را تثبیت کند.

بنچمارک‌های نسخه جدید هوش مصنوعی دیپ سیک
بنچمارک‌های نسخه جدید هوش مصنوعی دیپ سیک

گفتنی است، مدل جدید دیپ‌سیک در چندین آزمون معتبر ارزیابی شده است، از جمله:

  • • آزمون ریاضی AIME سال ۲۰۲۴ و ۲۰۲۵
  • • آزمون Google-Proof Q&A (GPQA)
  • • LiveCodeBench برای بررسی توانایی کدنویسی
  • • پلتفرم Aider AI برای کدنویسی تعاملی
  • • آزمون Humanity’s Last Exam؛ یکی از سخت‌ترین تست‌های استدلال انسانی

نتایج نشان می‌دهد که عملکرد DeepSeek-R1-0528 نسبت به نسخه اصلی R1 در تمامی این آزمون‌ها بهبود یافته است. با این حال، در آزمون بسیار دشوار Humanity’s Last Exam، این مدل تنها به ۱۷٪ از پرسش‌ها پاسخ صحیح داده است. این موضوع نشان می‌دهد که پیشرفت‌های نسخه جدید بیشتر ناشی از بهینه‌سازی‌های آموزشی و زمان تمرین بیشتر است، نه یک جهش بنیادین در معماری هوش مصنوعی.

یکی از ویژگی‌های برجسته در مدل R1-0528، کاهش قابل توجه پاسخ‌های اشتباه و گمراه‌کننده است. این بهبود در جلوگیری از اطلاعات نادرست، گامی کلیدی در مسیر افزایش اعتماد به سیستم‌های مبتنی بر هوش مصنوعی محسوب می‌شود.

بنچمارک‌های نسخه جدید هوش مصنوعی دیپ سیک
بنچمارک‌های نسخه جدید هوش مصنوعی دیپ سیک

دیپ‌سیک اعلام کرده که علاقه‌مندان می‌توانند نسخه منبع‌باز و فشرده‌شده این مدل را که دارای ۸ میلیارد پارامتر است، با کارت گرافیک Nvidia RTX 4090 با حافظه ۲۴ گیگابایتی اجرا کنند. این موضوع امکان آزمایش و توسعه مدل را برای محققان و توسعه‌دهندگان مستقل فراهم می‌کند.

منبع: ترنجی

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

نوشته های مشابه

دکمه بازگشت به بالا