تحلیل شباهت‌های سبک دیپ‌سیک و ChatGPT و پیامدهای قانونی آن

نتایج تحقیق جدید نشان می‌دهد که 74.2 درصد از متن‌هایی که مدل هوش مصنوعی دیپ‌سیک تولید می‌کند، شباهت زیادی به پاسخ‌های تولیدی ChatGPT دارند. این تحقیق می‌تواند پیامدهای مهمی برای حقوق مالکیت فکری، قانون‌گذاری و توسعه هوش مصنوعی در آینده داشته باشد.

شباهنگ نوروزی۱۵ اسفند ۱۴۰۳آخرین بروزرسانی: ۱۵ اسفند ۱۴۰۳

تحلیل شباهت‌های سبک دیپ‌سیک و ChatGPT و پیامدهای قانونی آن

بر اساس گزارش سایت Forbes، این تحقیق توسط شرکت Copyleaks، متخصص در شناسایی محتوای مبتنی‌بر هوش مصنوعی، انجام شده است. هدف از این تحقیق شناسایی شباهت‌های سبکی بین مدل‌های مختلف هوش مصنوعی بوده است. به گفته Copyleaks، نتایج این تحقیق می‌تواند سؤالات جدی درباره منابع داده و فرایندهای آموزشی مدل‌های هوش مصنوعی ایجاد کند.

بررسی شباهت‌های سبکی بین دیپ‌سیک و ChatGPT

در این تحقیق، از فناوری غربالگری و الگوریتم‌های دسته‌بندی برای شناسایی اثر انگشت سبکی (Stylistic Fingerprint) مدل‌های زبانی مختلف از جمله OpenAI، کلود، جمینای، LLaMA و DeepSeek استفاده شده است. نتایج نشان می‌دهند که بیشتر مدل‌ها سبک‌های خاص و منحصر به‌فردی دارند، اما بخش قابل توجهی از خروجی‌های DeepSeek شباهت زیادی به مدل‌های تولیدی OpenAI دارند.

«شای نیسان»، رئیس بخش علم داده Copyleaks، این تحقیق را شبیه به تحلیل دست‌نویس‌ها توسط کارشناسان خط‌شناسی می‌داند، که با مقایسه دست‌خط‌ها سعی در شناسایی نویسنده اصلی دارند. وی اظهار داشت که این نتایج غیرمنتظره و مهم هستند.

احتمال نقض حقوق مالکیت فکری OpenAI

این شباهت‌های سبک، سؤالات جدی درباره فرایند آموزش مدل DeepSeek و استفاده از داده‌های OpenAI بدون مجوز ایجاد کرده است. اگر ثابت شود که DeepSeek از متون تولیدی OpenAI برای آموزش مدل خود استفاده کرده است، این موضوع می‌تواند نقض حقوق مالکیت فکری و تخلف از شرایط خدمات OpenAI باشد.

کمبود شفافیت در داده‌های آموزشی صنعت هوش مصنوعی نیاز به قوانین و چارچوب‌های نظارتی روشن برای افشای منابع آموزشی را برجسته می‌کند. این موضوع در آینده می‌تواند تبعات حقوقی جدی داشته باشد.

چالش‌های اخلاقی و قانونی در صنعت هوش مصنوعی

اگرچه OpenAI نیز به دلیل استفاده از محتوای وب بدون مجوز با انتقاداتی مواجه بوده است، شباهت بین سبک نگارش دیپ‌سیک و ChatGPT ابعاد جدیدی به این بحث افزوده است. در حالی که در حال حاضر، پیگیری قانونی این موضوعات به دلیل نبود رویه‌های حقوقی مشخص دشوار است، ابزارهایی مانند شناسایی اثر انگشت سبکی می‌توانند ابزاری مؤثر در ردیابی تخلفات احتمالی باشند.

مطالعات انجام‌شده توسط Copyleaks نشان می‌دهد که این شباهت‌ها نمی‌توانند صرفاً ناشی از هم‌پوشانی داده‌ها باشند. هر مدل هوش مصنوعی به‌ویژه از نظر معماری، روش‌های تنظیم دقیق (Fine-tuning) و تکنیک‌های تولید محتوا منحصربه‌فرد است، که باعث ایجاد اثر انگشت سبکی متفاوت در هر مدل می‌شود.

در حال حاضر، مشخص نیست که آیا DeepSeek واقعاً از خروجی‌های OpenAI بدون مجوز استفاده کرده یا خیر، اما این پرسش‌ها قطعاً بخشی از مباحث جدی آینده در حوزه توسعه و تنظیم‌گری هوش مصنوعی خواهند بود. تاکنون، DeepSeek به درخواست‌ها برای توضیح پاسخ نداده است.

منبع: دیجیاتو

شباهنگ نوروزی۱۵ اسفند ۱۴۰۳آخرین بروزرسانی: ۱۵ اسفند ۱۴۰۳