تحلیل شباهتهای سبک دیپسیک و ChatGPT و پیامدهای قانونی آن
نتایج تحقیق جدید نشان میدهد که 74.2 درصد از متنهایی که مدل هوش مصنوعی دیپسیک تولید میکند، شباهت زیادی به پاسخهای تولیدی ChatGPT دارند. این تحقیق میتواند پیامدهای مهمی برای حقوق مالکیت فکری، قانونگذاری و توسعه هوش مصنوعی در آینده داشته باشد.

بر اساس گزارش سایت Forbes، این تحقیق توسط شرکت Copyleaks، متخصص در شناسایی محتوای مبتنیبر هوش مصنوعی، انجام شده است. هدف از این تحقیق شناسایی شباهتهای سبکی بین مدلهای مختلف هوش مصنوعی بوده است. به گفته Copyleaks، نتایج این تحقیق میتواند سؤالات جدی درباره منابع داده و فرایندهای آموزشی مدلهای هوش مصنوعی ایجاد کند.
بررسی شباهتهای سبکی بین دیپسیک و ChatGPT
در این تحقیق، از فناوری غربالگری و الگوریتمهای دستهبندی برای شناسایی اثر انگشت سبکی (Stylistic Fingerprint) مدلهای زبانی مختلف از جمله OpenAI، کلود، جمینای، LLaMA و DeepSeek استفاده شده است. نتایج نشان میدهند که بیشتر مدلها سبکهای خاص و منحصر بهفردی دارند، اما بخش قابل توجهی از خروجیهای DeepSeek شباهت زیادی به مدلهای تولیدی OpenAI دارند.
«شای نیسان»، رئیس بخش علم داده Copyleaks، این تحقیق را شبیه به تحلیل دستنویسها توسط کارشناسان خطشناسی میداند، که با مقایسه دستخطها سعی در شناسایی نویسنده اصلی دارند. وی اظهار داشت که این نتایج غیرمنتظره و مهم هستند.
احتمال نقض حقوق مالکیت فکری OpenAI
این شباهتهای سبک، سؤالات جدی درباره فرایند آموزش مدل DeepSeek و استفاده از دادههای OpenAI بدون مجوز ایجاد کرده است. اگر ثابت شود که DeepSeek از متون تولیدی OpenAI برای آموزش مدل خود استفاده کرده است، این موضوع میتواند نقض حقوق مالکیت فکری و تخلف از شرایط خدمات OpenAI باشد.
کمبود شفافیت در دادههای آموزشی صنعت هوش مصنوعی نیاز به قوانین و چارچوبهای نظارتی روشن برای افشای منابع آموزشی را برجسته میکند. این موضوع در آینده میتواند تبعات حقوقی جدی داشته باشد.
چالشهای اخلاقی و قانونی در صنعت هوش مصنوعی
اگرچه OpenAI نیز به دلیل استفاده از محتوای وب بدون مجوز با انتقاداتی مواجه بوده است، شباهت بین سبک نگارش دیپسیک و ChatGPT ابعاد جدیدی به این بحث افزوده است. در حالی که در حال حاضر، پیگیری قانونی این موضوعات به دلیل نبود رویههای حقوقی مشخص دشوار است، ابزارهایی مانند شناسایی اثر انگشت سبکی میتوانند ابزاری مؤثر در ردیابی تخلفات احتمالی باشند.
مطالعات انجامشده توسط Copyleaks نشان میدهد که این شباهتها نمیتوانند صرفاً ناشی از همپوشانی دادهها باشند. هر مدل هوش مصنوعی بهویژه از نظر معماری، روشهای تنظیم دقیق (Fine-tuning) و تکنیکهای تولید محتوا منحصربهفرد است، که باعث ایجاد اثر انگشت سبکی متفاوت در هر مدل میشود.
در حال حاضر، مشخص نیست که آیا DeepSeek واقعاً از خروجیهای OpenAI بدون مجوز استفاده کرده یا خیر، اما این پرسشها قطعاً بخشی از مباحث جدی آینده در حوزه توسعه و تنظیمگری هوش مصنوعی خواهند بود. تاکنون، DeepSeek به درخواستها برای توضیح پاسخ نداده است.
منبع: دیجیاتو
هر دو طرح و ایده منه پیامک قانونی نداره