DeepSeek-R2؛ هوش مصنوعی چینی با هزینه آموزش ۹۷ درصد کمتر از GPT-4

مدل جدید DeepSeek-R2 با بهره‌گیری از تراشه‌های داخلی هواوی و معماری پیشرفته، هزینه آموزش را به‌شدت کاهش داده و می‌تواند رقابت جهانی هوش مصنوعی را تحت تأثیر قرار دهد.

ظهیر کیانی۲۲ مرداد ۱۴۰۴آخرین بروزرسانی: ۲۲ مرداد ۱۴۰۴

DeepSeek-R2؛ هوش مصنوعی چینی با هزینه آموزش ۹۷ درصد کمتر از GPT-4

ظاهراً هزینه‌ی آموزش جدیدترین مدل هوش مصنوعی دیپ‌سیک، ۹۷ درصد کمتر از مدل GPT-4 است.

براساس جدیدترین گزارش‌ها، مدل زبانی بزرگ بعدی دیپ‌سیک بین تاریخ ۱۵ تا ۳۰ آگوست (بین ۲۴ مرداد تا ۸ شهریور) و با نام DeepSeek-R2 از راه خواهد رسید.

انتظار می‌رود با استفاده از نسخه‌ی پیشرفته‌تر سیستم Mixture of Experts، جهش قابل‌توجهی در معماری و عملکرد هوش مصنوعی دیپ‌سیک صورت بگیرد. گفته می‌شود DeepSeek-R2 حدود ۱٫۲ تریلیون پارامتر خواهد داشت، یعنی تقریباً دو برابر DeepSeek-R1 با ۶۷۱ میلیارد پارامتر.

همچنین بخوانید: چرا نباید از هوش مصنوعی درباره اشتباهاتش چیزی بپرسیم

هزینه‌ی آموزش DeepSeek-R2 حدود ۹۷ درصد کمتر از مدل GPT-4 است

در راستای کاهش وابستگی چین به آمریکا، مدل DeepSeek-R2 کاملاً با تراشه‌های Ascend 910B هواوی آموزش دیده است. این تراشه با عملکرد ۵۱۲ پتافلاپسی و بهره‌وری ۸۲ درصدی، معادل ۹۱ درصد از کارایی تراشه‌ی A100 انویدیا را ارائه می‌دهد.

گفته می‌شود به‌دلیل استفاده از سخت‌افزار داخلی و تکینک‌های بهینه‌سازی، هزینه‌ی آموزش DeepSeek-R2 حدود ۹۷ درصد کمتر از مدل GPT-4 است. انتشار مدل جدید دیپ‌سیک می‌تواند به‌شدت مدل‌های فعلی OpenAI و Anthropic را تحت تأثیر قرار بدهد.

خبر‌های پیرامون DeepSeek-R2 باعث رشد ۲۰ درصدی سهام شرکت Cambricon شده‌‌اند و ارزش بازار این شرکت اکنون به حدود ۴۹٫۷ میلیارد دلار رسیده است. شرکت نام‌برده در حوزه‌ی توسعه‌ی پردازنده‌های هوش مصنوعی فعالیت می‌کند.

منبع: زومیت

ظهیر کیانی۲۲ مرداد ۱۴۰۴آخرین بروزرسانی: ۲۲ مرداد ۱۴۰۴