رقابت ChatGPT و Gemini در «تحقیق عمیق»: کدام بهتر است؟
یکی از نویسندگان حوزه فناوری تجربه خود را از استفاده از ویژگی «تحقیق عمیق» در ChatGPT و Gemini به اشتراک گذاشته و آنها را در سه سناریو آزمایش کرده است.

تحریریه حرف مرد: مدتی است که از قابلیت «تحقیق عمیق» Gemini استفاده میکنم و هر دو نسخه اصلی و بهبودیافته آن را آزمایش کردهام. از آنجا که ChatGPT نیز ویژگی مشابهی دارد، تصمیم گرفتم آن را نیز امتحان کنم و با Gemini مقایسه کنم تا ببینم کدام یک عملکرد بهتری دارد.
تحقیق عمیق یا Deep Research اصلاً چیست؟
اگر از قبل با عملکرد تحقیق عمیق و نحوه کار آن آشنا هستید، میتوانید این بخش را نادیده بگیرید. در غیر این صورت، ادامه مطلب را بخوانید.
تحقیق عمیق در واقع دستیار پژوهشی هوش مصنوعی شماست که میتواند در عرض چند دقیقه گزارش جامعی درباره تقریباً هر موضوعی تولید کند. هدف اصلی آن صرفهجویی در زمان شماست؛ زیرا تحقیق دستی درباره همان موضوع احتمالاً ساعتها طول میکشد، چرا که باید خودتان تمام منابع را بررسی کنید.
وقتی این ویژگی طبق وعدهاش عمل کند، زمان زیادی را برای شما ذخیره میکند. به عنوان مثال، فرض کنید میخواهید تحقیق کنید که چه لپتاپی بخرید. معمولاً این فرآیند با یک جستجوی گوگل شروع میشود و شما را به لیستهای بیشمار «بهترینها»، بررسیها و مطالب مقایسهای هدایت میکند. حتی پس از این فرآیند وقتگیر، ممکن است هنوز سوالاتی بیپاسخ باقی مانده باشند.
در عوض، میتوانید از عملکرد تحقیق عمیق استفاده کنید. کافی است جزئیاتی درباره نوع لپتاپ مورد نظرتان، بودجه، برندهای مورد علاقه و ویژگیهای ضروری را به هوش مصنوعی ارائه دهید، و هوش مصنوعی یک گزارش دقیق برای شما گردآوری میکند. اگر سوالات بیشتری درباره یک محصول خاص یا مقایسه دو محصول از لیست کوتاه خود دارید، میتوانید مستقیماً از Gemini یا ChatGPT بپرسید.
انتظار این است که تمام اطلاعات مورد نیاز خود را در یک پیام واحد دریافت کنید و زمان زیادی را صرفهجویی نمایید. حداقل، این ایده رو کاغذ اینطور بنظر میرسد. به تجربه من، نسخه اول Gemini همیشه در موضوعات خاص یا تخصصی عملکرد خوبی نداشت، در حالی که نسخه بهبودیافته اکنون بسیار بهتر است. اما آیا از ChatGPT هم بهتر است؟ بیایید ببینیم.
همچنین بخوانید: تحقق رویای دیرین بشر: دانشمندان راهی برای تبدیل فلزات دیگر به طلا پیدا کردند!
مقایسه عملی
برای اولین آزمایشم، وانمود کردم که میخواهم یک گوشی جدید بخرم تا ببینم هر دو چتبات چه مدلهایی را توصیه میکنند. برای هر دو چتبات از یک دستور(پرامپت) یکسان استفاده کردم که در ادامه آمده است:
میخواهم یک گوشی جدید بخرم. به مدلهای جدیدی که تمام مشخصات و ویژگیهای روز را دارند علاقهمندم. همچنین به پشتیبانی نرمافزاری و شارژ سریع اهمیت میدهم. صفحه نمایش نباید خیلی بزرگ باشد — حداکثر ۶٫۳ اینچ — و نمیخواهم بیش از ۸۰۰ دلار برای آن هزینه کنم.
خروجی Gemini
Gemini گزارشی جامع ارائه داد که بیش از ۷۵۰۰ کلمه بود. این گزارش به ۵۵ منبع استناد کرده و اشاره کرد که ۲۷ منبع دیگر را نیز بررسی کرده که مستقیماً در گزارش نهایی گنجانده نشدهاند.
من از ساختار گزارش تحت تأثیر قرار گرفتم. گزارش با معرفی فضای فعلی گوشیهای هوشمند شروع شد و سپس معیارهای من را با جزئیات بیشتری تعریف کرد — برای مثال، توضیح داد که «پشتیبانی نرمافزاری طولانیمدت» و «شارژ سریع» در بازار امروز به چه معناست. سپس چهار گوشی هوشمند را که با معیارهای من سازگار بودند فهرست کرد و تحلیل را به بخشهای مهم برای من تقسیم کرد، از جمله شارژ، قیمت، پشتیبانی نرمافزاری و سایر ویژگیها. نکته کلیدی این بود که برای هر دستگاه مزایا و معایب را نیز فهرست کرد.
گزارش همچنین شامل جدولی بود که تمام گوشیها را در کنار هم مقایسه میکرد و مقایسه مشخصات را آسان میساخت. به طور خاص بر حوزههایی که در دستورالعمل من مورد توجه بود تمرکز کرد و مقایسهای جانبی برای هر گوشی در مورد آن پارامترها ارائه داد (مثلاً تفاوت چهار مدل در سرعت شارژ، قیمت و تعهدات بهروزرسانی نرمافزاری).
آنچه من به ویژه قدردان آن بودم این بود که گزارش یک قدم فراتر رفت و تمام مدلها را از یک تا چهار رتبهبندی کرد، به طوری که رتبه اول مطابق معیارهای من مناسبترین بود. و عملکرد عالی داشت — من خودم هم گوشیها را دقیقاً به همان ترتیب رتبهبندی میکردم.
با این حال، یک مشکل وجود داشت: لیست گوشیها کامل نبود. این لیست شامل Pixel 9a، Galaxy S24، Xiaomi 14 و iPhone 16 بود. این یعنی Pixel 9 را که در معیارهای من میگنجید، از قلم انداخته بود. همچنین در مقدمه به Galaxy S25 به عنوان مدلی «آینده» اشاره کرده بود، با وجود اینکه ماهها قبل عرضه شده بود (و بنابراین باید به جای S24 مدنظر قرار میگرفت).
پس هرچند ساختار گزارش عالی بود و Gemini واقعاً به جزئیات تمام معیارهای مطرح شده پرداخته بود، اما لیست نهایی گوشیها — که شاید مهمترین بخش باشد — چندان مطلوب نبود.
خروجی ChatGPT
آیا ChatGPT میتوانست بهتر عمل کند؟ از برخی جنبهها بله، اما از برخی دیگر خیر. در مورد لیست گوشیها، آن هم چهار مدل را پیشنهاد داد، اما انتخابی متفاوت داشت: Pixel 9، Galaxy S25، Pixel 8a و iPhone 16. بنابراین، هرچند به درستی Galaxy S25 جدیدتر را به جای مدل قدیمیتر S24 فهرست کرد (برخلاف Gemini)، اما به طرز عجیبی Pixel 8a قدیمیتر را به جای مدل جدیدتر Pixel 9a آورد و اساساً همان اشتباه را به شکلی دیگر تکرار کرد.
در مورد خود گزارش، در مقایسه با Gemini بسیار خلاصه بود. تنها حدود ۱۷۰۰ کلمه داشت و بیشتر شبیه یک پست وبلاگی بود تا یک گزارش تحقیقاتی عمیق. به سادگی تمام گوشیها را با توضیحی کوتاه برای هر یک فهرست کرد. گزارش به بخشهای تفصیلی تقسیم نشده بود و تحلیل مزایا و معایب هر دستگاه را نیز شامل نمیشد.
یک جدول مقایسه وجود داشت، اما جدولی پایهای بود که تمام ویژگیهای مطرح شده در دستورالعمل من را پوشش نمیداد. همچنین گزارش هیچ گوشی را به عنوان گزینه برتر پیشنهاد نکرده بود. منابع بسیار کمتری نیز ذکر شده بود — ۳۸ منبع در مقایسه با ۵۵ منبع Gemini (به علاوه ۲۷ منبع بررسی شده اضافی). همچنین کندتر بود و تهیه گزارش ۱۷ دقیقه طول کشید، در حالی که Gemini تنها ۱۲ دقیقه زمان نیاز داشت. تنها مزیت جزئی ChatGPT این بود که گزارش آن برای هر گوشی یک تصویر داشت که از نظر بصری جذاب بود.
آزمایشهای بیشتر: مقایسه گوشیها و بازار سهام
من دو گزارش دیگر نیز از هر دو چتبات درخواست کردم تا ببینم آیا ChatGPT عملکرد بهتری دارد یا خیر. اول، از آنها خواستم مقایسهای دقیق بین Galaxy S25 و Pixel 9 انجام دهند تا بتوانم تصمیم بگیرم کدام یک را بخرم. Gemini به طرز عجیبی اصرار داشت که Galaxy S25 هنوز عرضه نشده است، که اشتباه بزرگی بود. با این حال، خود گزارش ساختار خوبی داشت و نسبتاً طولانی بود. با وجود اشتباه اولیه درباره وضعیت عرضه گوشی، نتیجه نهایی به طرز غافلگیرکنندهای خوب بود، چرا که همچنان تمام مشخصات و ویژگیهای شناخته شده آن را برای مقایسه به درستی ذکر کرده بود.
این بار ChatGPT عملکرد بسیار بهتری داشت و گزارشی جامع و عمیق تولید کرد. احتمالاً در این مورد به ChatGPT امتیاز بهتری میدادم، عمدتاً به این دلیل که به درستی تأیید کرد که S25 قبلاً عرضه شده است. با این حال، نتیجهگیری نهایی و نقاط مقایسه بسیار شبیه به Gemini بود.
به عنوان شخصی که به امور مالی علاقهمند است، از هر دو درخواست کردم گزارشی درباره عملکرد بازار سهام روز قبل تهیه کنند. از آنها خواستم دادههایی درباره عملکرد شاخصهای اصلی، بزرگترین برندهها و بازندهها، تحلیلی از عوامل تأثیرگذار بر روز معاملاتی بعد و موارد بیشتر ارائه دهند.
داستان در اینجا مشابه درخواست اولیه «بهترین گوشیها» بود. هر دو چند اشتباه داشتند، مثلاً برخی شرکتها را که از بزرگترین برندهها بودند، از قلم انداختند. بنابراین، هیچیک کامل نبودند. با این حال، Gemini به طور کلی بهتر بود و گزارشی عمیقتر ارائه داد که شامل جدولهایی نیز میشد و این امر به درک سریعتر و آسانتر دادهها کمک شایانی میکرد.
برنده کیست؟
اعلام یک برنده نهایی چالشبرانگیز است، زیرا هیچیک از این پلتفرمها بیعیب نیستند. با این حال، بر اساس آزمایشهای من، Gemini در حال حاضر در وظایف تحقیق عمیق برتری دارد، عمدتاً به دلیل کیفیت و عمق بالاتر گزارشهایش. این گزارشها معمولاً طولانیتر هستند، بینشهای بیشتری ارائه میدهند و اطلاعات ساختار بهتری دارند، با عناصر مفیدی مانند جدولهای تفصیلی و رتبهبندیها.
با این حال، این عمق گاهی اوقات هزینهای دارد. در آزمایشهای من، Gemini کمی بیشتر از ChatGPT مستعد اشتباهات واقعی بود، مانند اشتباه مداوم درباره وضعیت عرضه Galaxy S25. اما ChatGPT، هرچند گزارشهای سادهتری تولید میکرد، گاهی اوقات در بعضی اطلاعات قابلاعتمادتر بود. با این حال، آن هم اشتباهاتی مانند پیشنهاد یک مدل قدیمیتر به جای مدل جدیدتر داشت. نکته مهم این است که این موضوع در تمام گزارشها یکسان نبود، بنابراین ممکن است تجربه شما بسته به موضوع تحقیق متفاوت باشد. هر دو چتبات، وقتی اشتباهاتشان را به آنها گوشزد کردم، آن را تصدیق کردند.
من فرآیند تحقیق Gemini را ترجیح میدهم
فراتر از کیفیت گزارش، من فرآیند تحقیق Gemini را بیشتر میپسندم. Gemini قبل از تولید یک گزارش کامل، یک «طرح بازی» یا چارچوب ارائه میدهد که به شما فرصت میدهد آن را مرور کرده و درخواست تغییراتی در محدوده یا تمرکز آن داشته باشید. این رویکرد پیشگیرانه میتواند در زمان صرفهجویی کند و به خروجی متناسبتری منجر شود. از سوی دیگر، ChatGPT تمایل دارد یک سری سوالات شفافسازی (حدود پنج سوال) بپرسد تا ترجیحات را مشخص کند. این سوالات همیشه مؤثر به نظر نمیرسند و گاهی اطلاعاتی را که قبلاً در دستورالعمل اولیه ارائه شده بود، دوباره میپرسند.
سرعت حوزه دیگری است که Gemini در آن مزیت دارد. به تجربه من، این چتبات حدود ۴۰٪ سریعتر از ChatGPT در تولید این گزارشهای تفصیلی عمل میکند. وقتی برخی گزارشها میتوانند بیش از ۱۰ دقیقه طول بکشند (ChatGPT برای گزارش گوشی ۱۷ دقیقه زمان صرف کرد)، این تفاوت زمانی به وضوح حس میشود.
در نهایت، مهم است که به خروجیهای عملکرد تحقیق عمیق در هر چتباتی با کمی تردید نگاه کنید. گاهی اوقات گزارشها به طرز چشمگیری دقیق و بینشمند هستند، و گاهی اوقات مشکلاتی وجود دارد که باعث میشود شما به اطمینان به این ابزار شک کنید، خصوصاً برای تصمیمات مهم و بدون اعتبارسنجی متقابل.
پس با وجود برخی بیدقتیهای گاهبهگاه، تحقیق عمیق Gemini به طور کلی تجربهای قدرتمندتر و بینشمندتر ارائه میدهد. عمق تحلیل، ارائه بهتر دادهها و ویژگی مفید «طرح بازی» آن را به انتخاب ترجیحی من در مقایسه با ChatGPT تبدیل کرده است.
این بدان معنا نیست که ویژگی ChatGPT بیارزش است. گزارشهای سادهتر و شبیه به پست وبلاگی آن ممکن است برای کاربرانی که نیاز به بررسی خیلی عمیق یک موضوع ندارند یا میخواهند یک مرور سریع داشته باشند، کاملاً مناسب یا حتی مطلوب باشد.
و در مورد مشکلات و اشتباهات این چتباتها، من خوشبین هستم که با بهروزرسانیهای آینده رفع خواهند شد و قابلیت اطمینان آنها برای وظایف تحقیقاتی روزمره و حیاتی افزایش خواهد یافت. اگر روند فعلی ادامه یابد، وقتی آن روز فرا برسد، احتمالاً من برای نیازهای تحقیق عمیقام همچنان به Gemini وفادار خواهم ماند.
منبع: android authority