DeepSeek-R2؛ هوش مصنوعی چینی با هزینه آموزش ۹۷ درصد کمتر از GPT-4
مدل جدید DeepSeek-R2 با بهرهگیری از تراشههای داخلی هواوی و معماری پیشرفته، هزینه آموزش را بهشدت کاهش داده و میتواند رقابت جهانی هوش مصنوعی را تحت تأثیر قرار دهد.

براساس جدیدترین گزارشها، مدل زبانی بزرگ بعدی دیپسیک بین تاریخ ۱۵ تا ۳۰ آگوست (بین ۲۴ مرداد تا ۸ شهریور) و با نام DeepSeek-R2 از راه خواهد رسید.
انتظار میرود با استفاده از نسخهی پیشرفتهتر سیستم Mixture of Experts، جهش قابلتوجهی در معماری و عملکرد هوش مصنوعی دیپسیک صورت بگیرد. گفته میشود DeepSeek-R2 حدود ۱٫۲ تریلیون پارامتر خواهد داشت، یعنی تقریباً دو برابر DeepSeek-R1 با ۶۷۱ میلیارد پارامتر.
همچنین بخوانید: چرا نباید از هوش مصنوعی درباره اشتباهاتش چیزی بپرسیم
هزینهی آموزش DeepSeek-R2 حدود ۹۷ درصد کمتر از مدل GPT-4 است
در راستای کاهش وابستگی چین به آمریکا، مدل DeepSeek-R2 کاملاً با تراشههای Ascend 910B هواوی آموزش دیده است. این تراشه با عملکرد ۵۱۲ پتافلاپسی و بهرهوری ۸۲ درصدی، معادل ۹۱ درصد از کارایی تراشهی A100 انویدیا را ارائه میدهد.
گفته میشود بهدلیل استفاده از سختافزار داخلی و تکینکهای بهینهسازی، هزینهی آموزش DeepSeek-R2 حدود ۹۷ درصد کمتر از مدل GPT-4 است. انتشار مدل جدید دیپسیک میتواند بهشدت مدلهای فعلی OpenAI و Anthropic را تحت تأثیر قرار بدهد.
خبرهای پیرامون DeepSeek-R2 باعث رشد ۲۰ درصدی سهام شرکت Cambricon شدهاند و ارزش بازار این شرکت اکنون به حدود ۴۹٫۷ میلیارد دلار رسیده است. شرکت نامبرده در حوزهی توسعهی پردازندههای هوش مصنوعی فعالیت میکند.
منبع: زومیت