رقابت ChatGPT و Gemini در «تحقیق عمیق»: کدام بهتر است؟

یکی از نویسندگان حوزه فناوری تجربه خود را از استفاده از ویژگی «تحقیق عمیق» در ChatGPT و Gemini به اشتراک گذاشته و آن‌ها را در سه سناریو آزمایش کرده است.

سهیل سهیلی‌زاد۲۱ اردیبهشت ۱۴۰۴آخرین بروزرسانی: ۲۶ شهریور ۱۴۰۴

رقابت ChatGPT و Gemini در «تحقیق عمیق»: کدام بهتر است؟

تحریریه حرف مرد: مدتی است که از قابلیت «تحقیق عمیق» Gemini استفاده می‌کنم و هر دو نسخه اصلی و بهبودیافته آن را آزمایش کرده‌ام. از آنجا که ChatGPT نیز ویژگی مشابهی دارد، تصمیم گرفتم آن را نیز امتحان کنم و با Gemini مقایسه کنم تا ببینم کدام یک عملکرد بهتری دارد.

تحقیق عمیق یا Deep Research اصلاً چیست؟

اگر از قبل با عملکرد تحقیق عمیق و نحوه کار آن آشنا هستید، می‌توانید این بخش را نادیده بگیرید. در غیر این صورت، ادامه مطلب را بخوانید.

تحقیق عمیق در واقع دستیار پژوهشی هوش مصنوعی شماست که می‌تواند در عرض چند دقیقه گزارش جامعی درباره تقریباً هر موضوعی تولید کند. هدف اصلی آن صرفه‌جویی در زمان شماست؛ زیرا تحقیق دستی درباره همان موضوع احتمالاً ساعتها طول می‌کشد، چرا که باید خودتان تمام منابع را بررسی کنید.

وقتی این ویژگی طبق وعده‌اش عمل کند، زمان زیادی را برای شما ذخیره می‌کند. به عنوان مثال، فرض کنید می‌خواهید تحقیق کنید که چه لپ‌تاپی بخرید. معمولاً این فرآیند با یک جستجوی گوگل شروع می‌شود و شما را به لیست‌های بی‌شمار «بهترین‌ها»، بررسی‌ها و مطالب مقایسه‌ای هدایت می‌کند. حتی پس از این فرآیند وقت‌گیر، ممکن است هنوز سوالاتی بی‌پاسخ باقی مانده باشند.

در عوض، می‌توانید از عملکرد تحقیق عمیق استفاده کنید. کافی است جزئیاتی درباره نوع لپ‌تاپ مورد نظرتان، بودجه، برندهای مورد علاقه و ویژگی‌های ضروری را به هوش مصنوعی ارائه دهید، و هوش مصنوعی یک گزارش دقیق برای شما گردآوری می‌کند. اگر سوالات بیشتری درباره یک محصول خاص یا مقایسه دو محصول از لیست کوتاه خود دارید، می‌توانید مستقیماً از Gemini یا ChatGPT بپرسید.

انتظار این است که تمام اطلاعات مورد نیاز خود را در یک پیام واحد دریافت کنید و زمان زیادی را صرفه‌جویی نمایید. حداقل، این ایده رو کاغذ اینطور بنظر می‌رسد. به تجربه من، نسخه اول Gemini همیشه در موضوعات خاص یا تخصصی عملکرد خوبی نداشت، در حالی که نسخه بهبودیافته اکنون بسیار بهتر است. اما آیا از ChatGPT هم بهتر است؟ بیایید ببینیم.

همچنین بخوانید: تحقق رویای دیرین بشر: دانشمندان راهی برای تبدیل فلزات دیگر به طلا پیدا کردند!

مقایسه عملی

برای اولین آزمایشم، وانمود کردم که می‌خواهم یک گوشی جدید بخرم تا ببینم هر دو چت‌بات چه مدل‌هایی را توصیه می‌کنند. برای هر دو چت‌بات از یک دستور(پرامپت) یکسان استفاده کردم که در ادامه آمده است:

می‌خواهم یک گوشی جدید بخرم. به مدل‌های جدیدی که تمام مشخصات و ویژگی‌های روز را دارند علاقه‌مندم. همچنین به پشتیبانی نرم‌افزاری و شارژ سریع اهمیت می‌دهم. صفحه نمایش نباید خیلی بزرگ باشد — حداکثر ۶٫۳ اینچ — و نمی‌خواهم بیش از ۸۰۰ دلار برای آن هزینه کنم.

خروجی Gemini

Gemini گزارشی جامع ارائه داد که بیش از ۷۵۰۰ کلمه بود. این گزارش به ۵۵ منبع استناد کرده و اشاره کرد که ۲۷ منبع دیگر را نیز بررسی کرده که مستقیماً در گزارش نهایی گنجانده نشده‌اند.

من از ساختار گزارش تحت تأثیر قرار گرفتم. گزارش با معرفی فضای فعلی گوشی‌های هوشمند شروع شد و سپس معیارهای من را با جزئیات بیشتری تعریف کرد — برای مثال، توضیح داد که «پشتیبانی نرم‌افزاری طولانی‌مدت» و «شارژ سریع» در بازار امروز به چه معناست. سپس چهار گوشی هوشمند را که با معیارهای من سازگار بودند فهرست کرد و تحلیل را به بخش‌های مهم برای من تقسیم کرد، از جمله شارژ، قیمت، پشتیبانی نرم‌افزاری و سایر ویژگی‌ها. نکته کلیدی این بود که برای هر دستگاه مزایا و معایب را نیز فهرست کرد.

گزارش همچنین شامل جدولی بود که تمام گوشی‌ها را در کنار هم مقایسه می‌کرد و مقایسه مشخصات را آسان می‌ساخت. به طور خاص بر حوزه‌هایی که در دستورالعمل من مورد توجه بود تمرکز کرد و مقایسه‌ای جانبی برای هر گوشی در مورد آن پارامترها ارائه داد (مثلاً تفاوت چهار مدل در سرعت شارژ، قیمت و تعهدات به‌روزرسانی نرم‌افزاری).

آنچه من به ویژه قدردان آن بودم این بود که گزارش یک قدم فراتر رفت و تمام مدل‌ها را از یک تا چهار رتبه‌بندی کرد، به طوری که رتبه اول مطابق معیارهای من مناسب‌ترین بود. و عملکرد عالی داشت — من خودم هم گوشی‌ها را دقیقاً به همان ترتیب رتبه‌بندی می‌کردم.

با این حال، یک مشکل وجود داشت: لیست گوشی‌ها کامل نبود. این لیست شامل Pixel 9a، Galaxy S24، Xiaomi 14 و iPhone 16 بود. این یعنی Pixel 9 را که در معیارهای من می‌گنجید، از قلم انداخته بود. همچنین در مقدمه به Galaxy S25 به عنوان مدلی «آینده» اشاره کرده بود، با وجود اینکه ماه‌ها قبل عرضه شده بود (و بنابراین باید به جای S24 مدنظر قرار می‌گرفت).

پس هرچند ساختار گزارش عالی بود و Gemini واقعاً به جزئیات تمام معیارهای مطرح شده پرداخته بود، اما لیست نهایی گوشی‌ها — که شاید مهم‌ترین بخش باشد — چندان مطلوب نبود.

خروجی ChatGPT

آیا ChatGPT می‌توانست بهتر عمل کند؟ از برخی جنبه‌ها بله، اما از برخی دیگر خیر. در مورد لیست گوشی‌ها، آن هم چهار مدل را پیشنهاد داد، اما انتخابی متفاوت داشت: Pixel 9، Galaxy S25، Pixel 8a و iPhone 16. بنابراین، هرچند به درستی Galaxy S25 جدیدتر را به جای مدل قدیمی‌تر S24 فهرست کرد (برخلاف Gemini)، اما به طرز عجیبی Pixel 8a قدیمی‌تر را به جای مدل جدیدتر Pixel 9a آورد و اساساً همان اشتباه را به شکلی دیگر تکرار کرد.

در مورد خود گزارش، در مقایسه با Gemini بسیار خلاصه بود. تنها حدود ۱۷۰۰ کلمه داشت و بیشتر شبیه یک پست وبلاگی بود تا یک گزارش تحقیقاتی عمیق. به سادگی تمام گوشی‌ها را با توضیحی کوتاه برای هر یک فهرست کرد. گزارش به بخش‌های تفصیلی تقسیم نشده بود و تحلیل مزایا و معایب هر دستگاه را نیز شامل نمی‌شد.

یک جدول مقایسه وجود داشت، اما جدولی پایه‌ای بود که تمام ویژگی‌های مطرح شده در دستورالعمل من را پوشش نمی‌داد. همچنین گزارش هیچ گوشی را به عنوان گزینه برتر پیشنهاد نکرده بود. منابع بسیار کمتری نیز ذکر شده بود — ۳۸ منبع در مقایسه با ۵۵ منبع Gemini (به علاوه ۲۷ منبع بررسی شده اضافی). همچنین کندتر بود و تهیه گزارش ۱۷ دقیقه طول کشید، در حالی که Gemini تنها ۱۲ دقیقه زمان نیاز داشت. تنها مزیت جزئی ChatGPT این بود که گزارش آن برای هر گوشی یک تصویر داشت که از نظر بصری جذاب بود.

ChatGPT Deep Reserach

آزمایش‌های بیشتر: مقایسه گوشی‌ها و بازار سهام

من دو گزارش دیگر نیز از هر دو چت‌بات درخواست کردم تا ببینم آیا ChatGPT عملکرد بهتری دارد یا خیر. اول، از آنها خواستم مقایسه‌ای دقیق بین Galaxy S25 و Pixel 9 انجام دهند تا بتوانم تصمیم بگیرم کدام یک را بخرم. Gemini به طرز عجیبی اصرار داشت که Galaxy S25 هنوز عرضه نشده است، که اشتباه بزرگی بود. با این حال، خود گزارش ساختار خوبی داشت و نسبتاً طولانی بود. با وجود اشتباه اولیه درباره وضعیت عرضه گوشی، نتیجه نهایی به طرز غافلگیرکننده‌ای خوب بود، چرا که همچنان تمام مشخصات و ویژگی‌های شناخته شده آن را برای مقایسه به درستی ذکر کرده بود.

این بار ChatGPT عملکرد بسیار بهتری داشت و گزارشی جامع و عمیق تولید کرد. احتمالاً در این مورد به ChatGPT امتیاز بهتری می‌دادم، عمدتاً به این دلیل که به درستی تأیید کرد که S25 قبلاً عرضه شده است. با این حال، نتیجه‌گیری نهایی و نقاط مقایسه بسیار شبیه به Gemini بود.

به عنوان شخصی که به امور مالی علاقه‌مند است، از هر دو درخواست کردم گزارشی درباره عملکرد بازار سهام روز قبل تهیه کنند. از آنها خواستم داده‌هایی درباره عملکرد شاخص‌های اصلی، بزرگ‌ترین برنده‌ها و بازنده‌ها، تحلیلی از عوامل تأثیرگذار بر روز معاملاتی بعد و موارد بیشتر ارائه دهند.

داستان در اینجا مشابه درخواست اولیه «بهترین گوشی‌ها» بود. هر دو چند اشتباه داشتند، مثلاً برخی شرکت‌ها را که از بزرگ‌ترین برنده‌ها بودند، از قلم انداختند. بنابراین، هیچ‌یک کامل نبودند. با این حال، Gemini به طور کلی بهتر بود و گزارشی عمیق‌تر ارائه داد که شامل جدول‌هایی نیز می‌شد و این امر به درک سریع‌تر و آسان‌تر داده‌ها کمک شایانی می‌کرد.

Google Gemini logo on smartphone stock photo (7)

برنده کیست؟

اعلام یک برنده نهایی چالش‌برانگیز است، زیرا هیچ‌یک از این پلتفرم‌ها بی‌عیب نیستند. با این حال، بر اساس آزمایش‌های من، Gemini در حال حاضر در وظایف تحقیق عمیق برتری دارد، عمدتاً به دلیل کیفیت و عمق بالاتر گزارش‌هایش. این گزارش‌ها معمولاً طولانی‌تر هستند، بینش‌های بیشتری ارائه می‌دهند و اطلاعات ساختار بهتری دارند، با عناصر مفیدی مانند جدول‌های تفصیلی و رتبه‌بندی‌ها.

با این حال، این عمق گاهی اوقات هزینه‌ای دارد. در آزمایش‌های من، Gemini کمی بیشتر از ChatGPT مستعد اشتباهات واقعی بود، مانند اشتباه مداوم درباره وضعیت عرضه Galaxy S25. اما ChatGPT، هرچند گزارش‌های ساده‌تری تولید می‌کرد، گاهی اوقات در بعضی اطلاعات قابل‌اعتمادتر بود. با این حال، آن هم اشتباهاتی مانند پیشنهاد یک مدل قدیمی‌تر به جای مدل جدیدتر داشت. نکته مهم این است که این موضوع در تمام گزارش‌ها یکسان نبود، بنابراین ممکن است تجربه شما بسته به موضوع تحقیق متفاوت باشد. هر دو چت‌بات، وقتی اشتباهاتشان را به آنها گوشزد کردم، آن را تصدیق کردند.

Samsung Galaxy A26 5G review image showing Google Gemini interface

من فرآیند تحقیق Gemini را ترجیح می‌دهم

فراتر از کیفیت گزارش، من فرآیند تحقیق Gemini را بیشتر می‌پسندم. Gemini قبل از تولید یک گزارش کامل، یک «طرح بازی» یا چارچوب ارائه می‌دهد که به شما فرصت می‌دهد آن را مرور کرده و درخواست تغییراتی در محدوده یا تمرکز آن داشته باشید. این رویکرد پیشگیرانه می‌تواند در زمان صرفه‌جویی کند و به خروجی متناسب‌تری منجر شود. از سوی دیگر، ChatGPT تمایل دارد یک سری سوالات شفاف‌سازی (حدود پنج سوال) بپرسد تا ترجیحات را مشخص کند. این سوالات همیشه مؤثر به نظر نمی‌رسند و گاهی اطلاعاتی را که قبلاً در دستورالعمل اولیه ارائه شده بود، دوباره می‌پرسند.

سرعت حوزه دیگری است که Gemini در آن مزیت دارد. به تجربه من، این چت‌بات حدود ۴۰٪ سریع‌تر از ChatGPT در تولید این گزارش‌های تفصیلی عمل می‌کند. وقتی برخی گزارش‌ها می‌توانند بیش از ۱۰ دقیقه طول بکشند (ChatGPT برای گزارش گوشی ۱۷ دقیقه زمان صرف کرد)، این تفاوت زمانی به وضوح حس می‌شود.

در نهایت، مهم است که به خروجی‌های عملکرد تحقیق عمیق در هر چت‌باتی با کمی تردید نگاه کنید. گاهی اوقات گزارش‌ها به طرز چشمگیری دقیق و بینش‌مند هستند، و گاهی اوقات مشکلاتی وجود دارد که باعث می‌شود شما به اطمینان به این ابزار شک کنید، خصوصاً برای تصمیمات مهم و بدون اعتبارسنجی متقابل.

پس با وجود برخی بی‌دقتی‌های گاه‌به‌گاه، تحقیق عمیق Gemini به طور کلی تجربه‌ای قدرتمندتر و بینش‌مندتر ارائه می‌دهد. عمق تحلیل، ارائه بهتر داده‌ها و ویژگی مفید «طرح بازی» آن را به انتخاب ترجیحی من در مقایسه با ChatGPT تبدیل کرده است.

این بدان معنا نیست که ویژگی ChatGPT بی‌ارزش است. گزارش‌های ساده‌تر و شبیه به پست وبلاگی آن ممکن است برای کاربرانی که نیاز به بررسی خیلی عمیق یک موضوع ندارند یا می‌خواهند یک مرور سریع داشته باشند، کاملاً مناسب یا حتی مطلوب باشد.

و در مورد مشکلات و اشتباهات این چت‌بات‌ها، من خوشبین هستم که با به‌روزرسانی‌های آینده رفع خواهند شد و قابلیت اطمینان آنها برای وظایف تحقیقاتی روزمره و حیاتی افزایش خواهد یافت. اگر روند فعلی ادامه یابد، وقتی آن روز فرا برسد، احتمالاً من برای نیازهای تحقیق عمیق‌ام همچنان به Gemini وفادار خواهم ماند.

منبع: android authority

سهیل سهیلی‌زاد۲۱ اردیبهشت ۱۴۰۴آخرین بروزرسانی: ۲۶ شهریور ۱۴۰۴

۲ دیدگاه

جواد گفت:
۲۳ اردیبهشت ۱۴۰۴ در ۱۱:۱۰ ق٫ظ
دوست عزیز دیپ سیک قابلیت Deep Research را ندارد، این برسی عملکرد Deep Research برای ChatGPT و Gemini است، نه برسی کلی هوش های مصنوعی.
پاسخ
امین گفت:
۲۲ اردیبهشت ۱۴۰۴ در ۳:۴۲ ب٫ظ
به نظر من Deepseek نسبت به دو چت بات ذکر شده مقایسه، جمع بندی و نکات جامعی می دهد. هر چند برای محصولات و اقلامی که وجود ندارند یا در دسترس نیستند اشتباه می کند. در کل سخاوتمندانه اطلاعات متنی را در اختیار کاربر قرار می دهد. حتی در مواردی اضافه تر هم فکر می کند.
پاسخ