هوش مصنوعی

معرفی مدل GPT 5؛ رفیق گرمابه و گلستان ما!

وقتی نام GPT-5 به میان می‌آید، با پدیده‌ای روبه‌رو هستیم که فراتر از نسخه‌های پیشین، قواعد بازی در قلمروِ پردازش زبان طبیعی (NLP) را بازتعریف می‌کند. مدل GPT 5 یا همان هوش مصنوعی GPT 5، با تلفیق توانمندی‌های استدلالی عمیق، قابلیت‌های هوش مصنوعی چندوجهی و پاسخ‌دهی پویا، قادر است از پرسش‌های روزمره تا مسائل پیچیده پژوهشی را به‌صورت معنادار پاسخ دهد. این مقاله و مطالب پیش‌رو تلاش دارد تصویری منسجم از ساختار، عملکرد و مزایا و محدودیت‌های جی‌پی‌تی 5 ارائه کند؛ مطالبی که پیرامون تجربه تیم نویسندگان هامیا ژورنال از معرفی و ارزیابی فنی GPT-5 تنظیم شده‌اند. ویژگی‌های برجسته‌ی GPT-5، از جمله شخصیت های GPT 5 که امکان تعاملات متنوع و سفارشی را فراهم می‌کنند، این مدل را به ابزاری بی‌بدیل برای خلاقیت و بهره‌وری تبدیل کرده است. کاربردهای GPT 5 در حوزه‌هایی چون تولید رابط‌های کاربری پیچیده، نگارش متون خلاقانه و ارائه مشاوره‌های سلامت دقیق، نشان‌دهنده‌ی ظرفیت بی‌مانند این فناوری برای تحول در زندگی روزمره و حرفه‌ای است. با مطالعه‌ی این مقاله، نه تنها با روش استفاده از GPT 5 آشنا خواهید شد، بلکه خواهید دید چگونه این مدل با کاهش خطاها و افزایش صداقت در پاسخ‌ها، اعتماد کاربران را به هوش مصنوعی بازتعریف کرده و به عنوان بوستری برای حرکت دنیای هوش مصنوعی به سمت هوش مصنوعی عمومی (AGI) عمل می‌کند. این فقط آغاز راه است؛ همراه ما باشید تا رازهای این فناوری پیشگام را کشف کنید.

معرفی مدل GPT 5

شرکت OpenAI از مدل زبانی بزرگ جدید خود، GPT-5، به‌عنوان پیشرفته‌ترین سیستم هوش مصنوعی تاکنون رونمایی کرده است. این مدل، یک جهش چشمگیر در قابلیت‌های هوش مصنوعی به‌شمار می‌رود و عملکردی استثنایی در حوزه‌های گوناگونی همچون برنامه‌نویسی، ریاضیات، نگارش، علوم بهداشتی و درک بصری از خود نشان می‌دهد. GPT 5 به‌عنوان یک سیستم یکپارچه، قادر است سرعت پاسخ‌گویی خود را با توجه به پیچیدگی سوال تنظیم کند؛ به‌عبارت دیگر، این مدل می‌تواند در مواقع لزوم با سرعت بالا پاسخ دهد و در موارد چالش‌برانگیز، با تأمل بیشتر، پاسخ‌های تخصصی و دقیقی ارائه کند. این مدل برای عموم کاربران در دسترس است. کاربران با اشتراک Plus می‌توانند به‌طور گسترده‌تری از آن بهره ببرند و برای کاربران با اشتراک Pro، نسخه‌ای پیشرفته‌تر با نام GPT-5 Pro عرضه شده است که از قدرت استدلال بیشتری برخوردار است و امکان تولید پاسخ‌های جامع‌تر و دقیق‌تر را فراهم می‌کند. این انتشار اگرچه با انتظاراتی نظیر نوآوری‌های کاملاً جدید و شگفت‌انگیز همراه نبود، اما پیشرفت‌های چشمگیری را در تمام حوزه‌ها به نمایش گذاشت. به بیان دیگر، GPT-5 بیشتر یک به‌روزرسانی جامع و عمیق بود تا یک تغییر انقلابی. مهم‌ترین ویژگی‌های این مدل جدید عبارت‌اند از:

برطرف شدن مشکلات بنیادین

یکی از دستاوردهای اصلی GPT-5، رفع بسیاری از ایرادات و نقاط ضعف مدل‌های قبلی است. این مدل با تمرکز بر افزایش دقت و منطق، عملکرد کلی خود را به شکل محسوسی بهبود بخشیده است. اگرچه انتظار قابلیت‌های چندوجهی (مانند پردازش ویدیو) که پیش‌تر وعده داده شده بود، در کنفرانس خبری برآورده نشد، اما قابلیت‌های صوتی مدل با کیفیت بسیار بالایی ارائه شدند. همچنین، هیچ اشاره‌ای به عرضه قابلیت‌های عامل هوش مصنوعی (AI agent) نشد که این امر نارضایتی برخی کاربران را در پلتفرم‌هایی مانند Reddit به همراه داشت. با این حال، به نظر می‌رسد رویکرد OpenAI در این مرحله، تقویت بنیان‌های اصلی مدل بوده است.

کاهش توهم‌زایی و افزایش دقت

یکی از بزرگ‌ترین نقاط قوت GPT-5، کاهش چشمگیر توهم‌زایی (Hallucination) است. بر اساس نمودارهای مقایسه‌ای رسمی، میزان توهم‌زایی این مدل بیش از ۵ برابر کمتر از نسخه‌های قبلی است. این پیشرفت تنها به دلیل بهبود ساختار مدل نیست، بلکه به یک مکانیزم جدید نیز وابسته است: در شرایطی که احتمال توهم‌زایی وجود دارد، مدل به جای ارائه پاسخ نادرست، از کاربر سوال می‌پرسد و اطلاعات بیشتری را طلب می‌کند تا از ارائه پاسخ غلط جلوگیری کند. این رویکرد، پایداری و قابل اعتماد بودن مدل را به شدت افزایش داده است.

ارتقاء قابلیت‌های فنی

  • افزایش پنجره کانالی (Context Window): طول پنجره کانالی در GPT-5 به ۲۵۶ هزار توکن افزایش یافته است. این قابلیت به مدل اجازه می‌دهد تا حجم بسیار بیشتری از اطلاعات را در یک مکالمه پردازش کرده و پاسخ‌های دقیق‌تر و منسجم‌تری ارائه دهد.
  • عملکرد برتر در کدنویسی: در یک آزمایش مقایسه‌ای در یوتیوب، GPT-5 در کدنویسی بازی ساده‌ای مانند سوپر ماریو (قارچ خور)، عملکردی به مراتب بهتر از رقبایی مانند Gemini، DeepSeek و Claude Sonnet 4 از خود نشان داد. کد تولیدی GPT-5 جزئیات بیشتری داشت و به شکل چشمگیری کارآمدتر بود.

قدمی به سوی هوش عمومی مصنوعی (AGI)

این پیشرفت‌ها، فراتر از ارتقاء فنی صرف هستند و پیام مهم‌تری را به همراه دارند: توانایی درک عمیق‌تر نیازهای کاربران، قدرت محاسباتی بالاتر و بهبود چشمگیر در درک مفاهیم. این مدل‌ها به سمت خلق هوش مصنوعی عمومی (AGI) در حال حرکت هستند؛ موجودیت‌هایی که برخلاف دستیارهای فعلی، قادر به تفکر، تصمیم‌گیری، یادگیری و اقدام مستقلانه هستند. GPT-5 را می‌توان یک گام کلیدی و استوار در مسیر رسیدن به این هدف نهایی دانست.

GPT 5 و یک سیستم یکپارچه

GPT 5 به‌عنوان یک سیستم یکپارچه، از سه بخش اصلی تشکیل شده است:

  • مدل هوشمند و کارآمد که برای پاسخ‌گویی به اکثر پرسش‌ها بهینه شده است؛
  • مدل با قدرت استدلال عمیق‌تر که برای حل مسائل پیچیده‌تر طراحی شده و با نام “GPT-5 thinking” شناخته می‌شود؛
  • مسیریاب بلادرنگ.

این مسیریاب به‌طور پویا و بر اساس عواملی مانند نوع گفتگو، میزان پیچیدگی سؤال، نیاز به استفاده از ابزارهای جانبی و قصد صریح کاربر (برای مثال، زمانی که کاربر از سیستم می‌خواهد به‌طور عمیق در مورد یک موضوع خاص تفکر کند)، تصمیم می‌گیرد که کدام‌یک از مدل‌های فوق را به‌کار گیرد. مسیریاب مذکور به‌طور مستمر و با استفاده از سیگنال‌های دریافتی از تعاملات واقعی کاربران، مانند نرخ انتخاب پاسخ‌های برتر، دقت اندازه‌گیری‌شده و تغییر مدل توسط کاربران، آموزش داده می‌شود تا عملکرد خود را در طول زمان بهبود بخشد. شایان ذکر است که پس از رسیدن به حد مجاز استفاده، یک نسخه فشرده‌تر از هر مدل، مسئولیت پاسخ‌گویی به درخواست‌های بعدی را بر عهده می‌گیرد. شرکت OpenAI قصد دارد در آینده نزدیک، این قابلیت‌ها را در یک مدل واحد ادغام کند.


GPT 5 مدلی هوشمندانه‌تر و کاربردی‌تر

GPT-5 نه‌تنها در مقایسه با مدل‌های پیشین، در معیارهای استاندارد عملکرد بهتری ارائه می‌دهد و سرعت پاسخ‌گویی بالاتری دارد، بلکه در کاربردهای واقعی نیز کارایی چشمگیری از خود نشان می‌دهد. شرکت OpenAI در این مدل، پیشرفت‌های قابل‌ملاحظه‌ای در کاهش پدیده “توهم هوش مصنوعی (hallucinations)“، بهبود توانایی درک و دنبال کردن دستورالعمل‌ها و همچنین به حداقل رساندن تملق و چاپلوسی (sycophancy) داشته است. علاوه بر این، عملکرد GPT 5 در سه حوزه پرکاربرد ChatGPT، شامل نگارش، کدنویسی و مسائل مربوط به سلامت، به‌طور قابل‌توجهی ارتقاء یافته است.

کد نویسی با GPT 5

GPT 5 قوی‌ترین مدل عرضه‌شده توسط OpenAI در حوزه کدنویسی است. این مدل به‌ویژه در تولید رابط کاربری پیچیده (front-end) و رفع اشکال (debugging) در پروژه‌های نرم‌افزاری بزرگ، پیشرفت‌های قابل‌توجهی داشته است. GPT-5 اغلب می‌تواند تنها با یک دستور (prompt)، وب‌سایت‌ها، اپلیکیشن‌ها و بازی‌های زیبا و واکنش‌گرا را تولید کند و با در نظر گرفتن زیبایی‌شناسی و اصول طراحی، ایده‌های کاربران را به شکلی بصری و جذاب به واقعیت تبدیل کند. آزمایش‌کنندگان اولیه نیز به درک عمیق این مدل از اصول طراحی مانند فاصله‌داری (spacing)، تایپوگرافی و فضای خالی (white space) اشاره کرده‌اند.

بیان خلاق و نویسندگی با GPT 5

GPT-5 به‌عنوان پیشرفته‌ترین دستیار نویسندگی، قادر است به کاربران در تبدیل ایده‌های خام به متون جذاب، تأثیرگذار و عمیق کمک کند. این مدل با دقت و اطمینان بیشتری می‌تواند ساختارهای پیچیده‌ای مانند وزن‌های شعری خاص یا شعر آزاد با جریان طبیعی را تولید کند و به فرم و وضوح بیان به‌صورت هم‌زمان توجه نماید. این پیشرفت‌ها در توانایی نگارش به این معناست که ChatGPT در انجام وظایف روزمره مانند تهیه پیش‌نویس و ویرایش گزارش‌ها، ایمیل‌ها و یادداشت‌ها، عملکرد بهتری خواهد داشت.

کارکرد مدل GPT 5 در حوزه سلامت

GPT-5 بهترین مدل شرکت OpenAI در پاسخ به سؤالات مربوط به سلامت است و به کاربران کمک می‌کند تا آگاهی خود را افزایش داده و از سلامت خود مراقبت کنند. این مدل در معیار HealthBench که توسط OpenAI و با همکاری متخصصان پزشکی طراحی شده، امتیاز قابل‌توجهی بالاتر از تمامی مدل‌های قبلی کسب کرده است. GPT-5 برخلاف نسخه‌های پیشین، بیشتر شبیه به یک همراه فکری فعال عمل می‌کند؛ به‌طور فعالانه نگرانی‌های احتمالی را مطرح کرده و با طرح سؤالاتی دقیق‌تر، به پاسخ‌های کاربردی‌تری منجر می‌شود. این مدل پاسخ‌هایی قابل‌اعتمادتر و دقیق‌تر ارائه می‌دهد و با توجه به زمینه گفتگو، سطح دانش و موقعیت جغرافیایی کاربر، خود را انطباق می‌دهد تا در شرایط مختلف، پاسخ‌هایی امن‌تر و مؤثرتر ارائه دهد. مهم است توجه شود که ChatGPT جایگزین یک متخصص پزشکی نیست، بلکه می‌تواند به‌عنوان ابزاری کمکی در درک نتایج، طرح سؤالات مناسب هنگام مراجعه به پزشک و بررسی گزینه‌های درمانی مورد استفاده قرار گیرد.

قابلیت های مدل GPT 5

از قابلیت های مدل GPT 5 می‌توان به موارد زیر اشاره کرد که در ادامه مقاله نیز تشریح شده‌اند:

مدل یکپارچه و جامع

GPT-5 اکنون یک مدل پرچمدار و همه کاره است که به طور خودکار مدل فرعی مناسب را برای درخواست شما از طریق یک سیستم مسیریابی پویا انتخاب می‌کند. این مدل شامل دو “مغز” اصلی است: GPT 5 Main برای سرعت بیشتر و GPT 5 Thinking برای حل مشکلات پیچیده. همچنین در سه اندازه زیر عرضه می‌شود:

  1. GPT 5 standard
  2. GPT 5 mini
  3. GPT 5 nano

عملکرد بهبود یافته

GPT 5 هوشمندتر، سریع‌تر و بسیار دقیق‌تر از قبل است. طبق گفته OpenAI، توهمات تا ۷۸ درصد در حالت استدلال کاهش یافته‌اند. همچنین دارای پنجره کانالی عظیمی تا ۴۰۰٬۰۰۰ توکن در API است که معادل حدود ۲۰۰٬۰۰۰ کلمه است.

قابلیت چندوجهی (Multimodal)

این مدل قادر به پردازش متن، تصاویر، صدا و حتی ویدیوی زنده در یک مکالمه واحد است. می‌تواند وب‌سایت‌ها را تولید کند، تصاویر آپلود شده را تحلیل کند و در تعاملات ویدیوی زنده دستورالعمل‌های گام به گام ارائه دهد. حالت صوتی نیز بهبود یافته و با جریان مکالمه تطبیق می‌یابد.

قدرت کدنویسی پیشرفته

GPT-5 به طور خاص برای توسعه‌دهندگان و کدنویسان طراحی شده و می‌تواند نرم‌افزارهای پیچیده را بر اساس تقاضا بسازد. این مدل می‌تواند بیش از ۴۰۰ خط کد را در عرض ۲ دقیقه تولید کند و در اشکال‌زدایی و ساخت نرم‌افزار پیچیده از یک اعلان واحد عالی عمل می‌کند.

شخصی‌سازی و حافظه

می‌توانید یکی از چهار شخصیت از پیش تعیین شده (کنایه‌آمیز، ربات، شنونده و دانشمند) را تنظیم کنید. حافظه GPT 5 نیز بسیار بهتر شده و می‌تواند ترجیحات، حقایق و دستورالعمل‌ها را در طول جلسات به خاطر بسپارد و به طور فعال پاسخ‌های خود را برای کمک به شما در رسیدن به اهداف بلندمدت تطبیق دهد

ادغام‌ها و قابلیت‌های دستیار

به زودی، GPT-5 قادر خواهد بود مستقیماً با Gmail، Google Calendar و Google Contacts متصل شود و اطلاعات مربوطه را به طور خودکار استخراج کند

ملاحظات ایمنی

OpenAI مدل GPT 5 را در زمینه دانش سلاح‌های بیولوژیکی و شیمیایی “پرخطر” طبقه‌بندی کرده است و اقدامات ایمنی اضافی مانند فیلترهای چندلایه و بازبینی انسانی را اجرا کرده است. توهمات به شدت کاهش یافته‌اند، اما هنوز به طور کامل از بین نرفته‌اند.

قیمت‌گذاری

اشتراک‌های ChatGPT بدون تغییر باقی می‌مانند (پلاس ۲۰ دلار در ماه، پرو ۲۰۰ دلار در ماه). قیمت‌گذاری API برای GPT-5 رقابتی است، به ویژه نسخه‌های GPT 5 mini و GPT 5 nano که بسیار مقرون به صرفه‌تر از مدل‌های قبلی هستند و هدفشان در دسترس قرار دادن هوش مصنوعی پیشرفته برای موارد استفاده حساس به هزینه است.

ارزیابی‌های مدل GPT 5 در معیارها و بنچمارک‌ها

GPT 5 در مقایسه با مدل‌های پیشین، از هوشمندی کلی بیشتری برخوردار است. این برتری در نتایج ارزیابی‌های آکادمیک و معیارهای سنجش عملکرد انسانی، به‌ویژه در حوزه‌های ریاضیات، کدنویسی، درک بصری و سلامت، به‌وضوح قابل‌مشاهده است. این مدل توانسته در معیارهای مختلفی همچون ریاضیات (با کسب 94.6% در آزمون AIME 2025 بدون استفاده از ابزار)، کدنویسی در دنیای واقعی (با امتیاز 74.9% در SWE-bench Verified و 88% در Aider Polyglot)، درک چندوجهی (با کسب 84.2% در MMMU) و سلامت (با امتیاز 46.2% در HealthBench Hard) رکوردهای جدیدی را به ثبت برساند. علاوه بر این، نسخه پیشرفته‌تر این مدل، یعنی GPT-5 pro، با قدرت استدلال گسترده خود، موفق به کسب امتیاز 88.4% در معیار GPQA بدون نیاز به ابزار شده که این نیز یک رکورد جدید محسوب می‌شود.

AIME 2025 Competition math: نتایج AIME با ابزارها نباید مستقیماً با عملکرد مدل‌های بدون دسترسی به ابزار مقایسه شوند؛ آنها نمونه‌ای از چگونگی استفاده مؤثر GPT 5 از ابزارهای موجود هستند.
AIME 2025 Competition math: نتایج AIME با ابزارها نباید مستقیماً با عملکرد مدل‌های بدون دسترسی به ابزار مقایسه شوند؛ آنها نمونه‌ای از چگونگی استفاده مؤثر GPT 5 از ابزارهای موجود هستند.
FrontierMath, Tier 1-3 Expert-level math
FrontierMath, Tier 1-3 Expert-level math
HMMT Harvard-MIT mathematics tournament
HMMT Harvard-MIT mathematics tournament
GPQA Diamond PhD-level science questions
GPQA Diamond PhD-level science questions
Humanity’s Last Exam (Full Set) Expert-level questions across subjects
Humanity’s Last Exam (Full Set) Expert-level questions across subjects
SWE-bench Verified Software engineering and Aider Polyglot Multi-language code editing
SWE-bench Verified Software engineering and Aider Polyglot Multi-language code editing

GPT 5 و پیروی از دستورالعمل‌ها و استفاده‌ی عاملی از ابزار

در ارزیابی‌های مربوط به توانایی پیروی از دستورالعمل‌ها و استفاده از ابزارهای هوشمند، GPT 5 پیشرفت‌های چشمگیری داشته است. این قابلیت‌ها به مدل امکان می‌دهند تا درخواست‌های چندمرحله‌ای را با دقت و اطمینان بیشتری انجام دهد، از ابزارهای گوناگون به‌صورت هماهنگ بهره ببرد و خود را با تغییرات در زمینه گفتگو (context) تطبیق دهد. در عمل، این به معنای توانایی بهتر مدل در اجرای کارهای پیچیده و پویا است؛ به این صورت که GPT-5 می‌تواند با دقت بیشتری از دستورالعمل‌های کاربران پیروی کرده و بخش بیشتری از یک کار را به‌طور کامل و با استفاده از ابزارهای در دسترس به اتمام برساند.

Scale MultiChallenge Multi-turn instruction following, BrowseComp Agentic search & browsing, and COLLIE Instruction-following in freeform writing
Scale MultiChallenge Multi-turn instruction following, BrowseComp Agentic search & browsing, and COLLIE Instruction-following in freeform writing
Tau2-bench Function calling
Tau2-bench Function calling

هوش مصنوعی چند وجهی در مدل GPT 5

GPT 5 در مجموعه معیارهای هوش مصنوعی چندوجهی، که شامل استدلال‌های بصری، ویدیویی، فضایی و علمی هستند، عملکردی برجسته از خود نشان می‌دهد. این عملکرد چندوجهی قوی‌تر باعث می‌شود تا ChatGPT بتواند با دقت بیشتری روی تصاویر و سایر داده‌های غیرمتنی استدلال کند. به‌عنوان مثال، می‌تواند نمودارها را تفسیر کند، تصویری از یک ارائه را خلاصه کند یا به سؤالات مربوط به یک دیاگرام پاسخ دهد.

MMMU College-level visual problem-solving, MMMU Pro, Graduate-level visual problem-solving, and VideoMMMU Video-based multimodal reasoning (max frame 256)
MMMU College-level visual problem-solving, MMMU Pro, Graduate-level visual problem-solving, and VideoMMMU Video-based multimodal reasoning (max frame 256)
CharXiv-Reasoning Scientific figure reasoning and ERQA Multimodal spatial reasoning
CharXiv-Reasoning Scientific figure reasoning and ERQA Multimodal spatial reasoning
HealthBench Realistic health conversations and HealthBench Hard Challenging health conversations
HealthBench Realistic health conversations and HealthBench Hard Challenging health conversations
HealthBench Hard Hallucinations Inaccuracies on challenging conversations
HealthBench Hard Hallucinations Inaccuracies on challenging conversations

وظایف مهم اقتصادی در GPT 5

GPT-5 در یک معیار داخلی که توسط شرکت OpenAI برای سنجش عملکرد مدل در کارهای فکری پیچیده و ارزشمند (knowledge work) طراحی شده است، بهترین عملکرد را در میان تمامی مدل‌ها داشته است. در کارهایی که بیش از 40 شغل مختلف از جمله حقوق، لجستیک، فروش و مهندسی را شامل می‌شود، GPT 5 با بهره‌گیری از قابلیت استدلال خود، در تقریباً نیمی از موارد، عملکردی هم‌سطح یا بهتر از متخصصان انسانی از خود نشان می‌دهد و از مدل‌های پیشین مانند GPT-4o و ChatGPT Agent عملکرد بهتری ارائه می‌کند.

Economically important tasks: روش‌شناسی ارزیابی‌های بالا: نتایج GPT-4o منعکس‌کننده جدیدترین نسخه مدل در ChatGPT تا تاریخ آگوست ۲۰۲۵ است. تمام مدل‌ها با تنظیمات «تلاش استدلالی» (reasoning effort) بالا ارزیابی شده‌اند. تلاش استدلالی می‌تواند در ChatGPT متغیر باشد، که در این حالت، تنظیمات بالا نشان‌دهنده حداکثر میزان عملکردی است که یک کاربر ممکن است هنگام استفاده از مدل تجربه کند.
Economically important tasks: روش‌شناسی ارزیابی‌های بالا: نتایج GPT-4o منعکس‌کننده جدیدترین نسخه مدل در ChatGPT تا تاریخ آگوست ۲۰۲۵ است. تمام مدل‌ها با تنظیمات «تلاش استدلالی» (reasoning effort) بالا ارزیابی شده‌اند. تلاش استدلالی می‌تواند در ChatGPT متغیر باشد، که در این حالت، تنظیمات بالا نشان‌دهنده حداکثر میزان عملکردی است که یک کاربر ممکن است هنگام استفاده از مدل تجربه کند.

تفکر سریع‌تر و کارآمدتر با GPT 5

یکی از ویژگی‌های برجسته GPT 5، تولید ارزش بیشتر با صرف منابع پردازشی کمتر است. در ارزیابی‌های صورت‌گرفته توسط OpenAI، مدل GPT-5 با استفاده از قابلیت تفکر خود، عملکردی به مراتب بهتر از مدل GPT-4o در حوزه‌هایی مانند استدلال بصری، کدنویسی پیشرفته و حل مسائل علمی در سطح تحصیلات تکمیلی از خود نشان داده است. این برتری در حالی حاصل شده که GPT-5 با 50 تا 80 درصد توکن‌های خروجی در بحت پنجره کانالی (Context Window) کمتر به این نتایج دست یافته است. این امر نشان‌دهنده کارایی و بهینگی چشمگیر این مدل جدید در تولید پاسخ‌های باکیفیت است.

CharXiv-Reasoning Scientific figure reasoning
CharXiv-Reasoning Scientific figure reasoning
SWE-bench Verified Software engineering
SWE-bench Verified Software engineering
GPQA Diamond PhD-level science questions
GPQA Diamond PhD-level science questions

GPT 5 مدلی قوی‌تر، قابل اعتمادتر و مفیدتر

پاسخ‌های دقیق‌تر با GPT 5 به پرسش‌های دنیای واقعی

GPT 5 در مقایسه با مدل‌های قبلی، به‌طور چشمگیری کمتر دچار پدیده “توهم هوش مصنوعی (hallucination)” می‌شود. برای ارزیابی این موضوع، قابلیت جستجوی وب روی سؤالات ناشناس که از ترافیک واقعی ChatGPT استخراج شده‌اند، فعال گردید. نتایج نشان می‌دهند که احتمال وجود خطاهای واقعی در پاسخ‌های GPT-5، حدود ۴۵% کمتر از GPT-4o است. علاوه بر این، در “حالت تفکر (thinking mode)” این مدل، احتمال وقوع خطا در پاسخ‌ها تقریباً ۸۰% کمتر از مدل GPT-4o اندازه‌گیری شده است.

شرکت OpenAI به‌طور ویژه روی افزایش اعتبار و قابل‌اعتماد بودن مدل‌های خود در پاسخ به پرسش‌های پیچیده و باز سرمایه‌گذاری کرده است. به همین منظور، ارزیابی‌های جدیدی برای سنجش دقت واقع‌سنجی در پاسخ‌های باز به این مدل‌ها اضافه شده است. نرخ توهم GPT 5 در حالت “تفکر”، با استفاده از دو معیار عمومی واقع‌سنجی، یعنی LongFact (که بر مفاهیم و اشیاء تمرکز دارد) و FActScore، اندازه‌گیری شده است. نتایج نشان می‌دهند که GPT-5 در تمام این معیارها، کاهش چشمگیری در توهم از خود نشان می‌دهد (حدود ۶ برابر کمتر از GPT 4o). این پیشرفت یک جهش واضح در توانایی مدل برای تولید محتوای طولانی و پیوسته دقیق محسوب می‌شود. جزئیات مربوط به نحوه پیاده‌سازی و ارزیابی در سند سیستم (system card) که توسط شرکت OpenAI منتشر شده، قابل دسترسی است.

Hallucination rate on open-source prompts
Hallucination rate on open-source prompts
Response-level error rate on de-identified ChatGPT traffic
Response-level error rate on de-identified ChatGPT traffic

پاسخ‌های صادقانه‌تر با مدل GPT 5

علاوه بر بهبود دقت واقع‌سنجی، GPT-5 در “حالت تفکر (thinking)”، عملکردها و توانایی‌های خود را با صداقت بیشتری به کاربر منتقل می‌کند. این ویژگی به‌ویژه در مورد وظایفی که غیرممکن یا ناقص هستند، و یا نیاز به ابزارهای کلیدی دارند که در دسترس نیستند، بسیار مهم است. مدل‌های هوش مصنوعی ممکن است در طول فرآیند آموزش، برای کسب امتیاز بالاتر، یاد بگیرند که در مورد تکمیل موفقیت‌آمیز یک کار دروغ بگویند یا درباره پاسخ‌های نامطمئن، اعتمادبه‌نفس بیش‌ازحدی از خود نشان دهند. برای بررسی این موضوع، شرکت OpenAI تمام تصاویر را از معیار چندوجهی CharXiv حذف کرد. در این آزمایش، مدل GPT-4o همچنان در 86.7% موارد، پاسخ‌های مطمئنی درباره تصاویر ناموجود ارائه می‌داد، در حالی که این رقم برای GPT-5 تنها 9% بود. این تفاوت فاحش نشان‌دهنده صداقت بیشتر GPT 5 است.

در حالت استدلال، GPT 5 با دقت بیشتری تشخیص می‌دهد که قادر به انجام یک کار نیست و محدودیت‌های خود را به‌طور واضح بیان می‌کند. برای ارزیابی این قابلیت، نرخ “فریب‌کاری” (deception) در شرایطی که شامل وظایف کدنویسی غیرممکن و دارایی‌های چندوجهی ازدست‌رفته بود، مورد بررسی قرار گرفت. نتایج نشان داد که GPT-5 در حالت تفکر، در تمام این موارد، فریب‌کاری کمتری نسبت به GPT-4o انجام می‌دهد. در مجموعه‌ای بزرگ از مکالمات که نشان‌دهنده ترافیک واقعی ChatGPT هستند، نرخ فریب‌کاری از 4.8% برای GPT-4o به 2.1% برای پاسخ‌های استدلالی GPT-5 کاهش یافته است. اگرچه این یک پیشرفت مهم و معنادار برای کاربران است، اما هنوز جای کار بسیاری وجود دارد و شرکت OpenAI به تحقیقات خود برای بهبود واقع‌سنجی و صداقت مدل‌هایش ادامه خواهد داد. جزئیات بیشتر این بررسی‌ها در سند سیستم (system card) قابل دسترسی است.

Deception evals across models
Deception evals across models

GPT 5 و پاسخ‌های ایمن‌تر و مفیدتر

GPT 5 در زمینه ایمنی، مرزهای جدیدی را جابه‌جا کرده است. در گذشته، عملکرد ChatGPT عمدتاً بر آموزش مبتنی بر “رد درخواست” (refusal-based training) استوار بود. در این روش، مدل بر اساس درخواست کاربر، یا آن را انجام می‌داد و یا به‌طور کامل آن را رد می‌کرد. اگرچه این رویکرد برای درخواست‌های مخرب آشکار مؤثر بود، اما در مواجهه با شرایطی که قصد کاربر مبهم است، یا اطلاعات می‌توانند به‌طور هم‌زمان برای اهداف خوب و بد (کاربرد دوگانه) مورد استفاده قرار گیرند، با چالش‌هایی روبرو می‌شد. این نوع آموزش به‌ویژه در حوزه‌هایی مانند ویروس‌شناسی بسیار غیرانعطاف‌پذیر است؛ چرا که یک درخواست خوش‌آیند برای مدل می‌تواند در سطح کلان به‌طور ایمن تکمیل شود، اما در صورت ارائه جزئیات دقیق، ممکن است به یک عامل مخرب کمک کند.

در GPT-5، شرکت OpenAI رویکرد جدیدی به نام “تکمیل‌های ایمن” (safe completions) را برای آموزش ایمنی معرفی کرده است. این روش به مدل می‌آموزد که در چارچوب‌های ایمنی، مفیدترین پاسخ ممکن را ارائه دهد. این امر ممکن است گاهی به معنای ارائه پاسخی جزئی یا کلی به سؤال کاربر باشد. اگر مدل مجبور به رد یک درخواست شود، GPT-5 آموزش دیده است که به‌صورت شفاف دلیل این رد را توضیح داده و جایگزین‌های ایمن‌تری را پیشنهاد کند. در آزمایش‌های کنترل‌شده و مدل‌های تولیدی، این رویکرد به‌عنوان یک روش ظریف‌تر و کارآمدتر شناخته شده است که امکان مدیریت بهتر پرسش‌های با کاربرد دوگانه، مقاومت قوی‌تر در برابر مقاصد مبهم و کاهش رد درخواست‌های غیرضروری را فراهم می‌کند. برای مطالعه بیشتر در مورد رویکرد جدید OpenAI به آموزش ایمنی و جزئیات کامل روش‌شناسی، معیارها و نتایج، می‌توانید به مقاله منتشرشده در مورد “تکمیل ایمن” مراجعه کنید.

Safety and Helpfulness given safe
Safety and Helpfulness given safe

کاهش تملق‌گویی و بهبود سبک در مدل GPT 5

در مجموع، GPT-5 در مقایسه با GPT 4o، با شور و حرارت کمتری موافقت می‌کند، از شکلک‌ها یا ایموجی‌های غیرضروری کمتری بهره می‌برد و در ادامه دادن مکالمات، ظریف‌تر و سنجیده‌تر عمل می‌کند. تجربه کاربری با این مدل کمتر شبیه به “صحبت با یک هوش مصنوعی” است و بیشتر به گفتگو با یک همکار یا دوست باهوش شباهت دارد.

شرکت OpenAI در اوایل سال جاری، به‌روزرسانی برای مدل GPT-4o منتشر کرد که به‌صورت ناخواسته باعث شد این مدل بیش از حد تملق‌گو یا به بیان دیگر، چاپلوس و موافق با نظرات کاربران شود. این شرکت به‌سرعت این تغییر را لغو کرد و از آن زمان تاکنون، تلاش‌های گسترده‌ای را برای درک و کاهش این رفتار در مدل‌های خود آغاز کرده است. این تلاش‌ها شامل موارد زیر بوده است:

  • توسعه ارزیابی‌های جدیدی برای اندازه‌گیری دقیق میزان تملق‌گویی.
  • بهبود فرآیند آموزش مدل با هدف کاهش تملق‌گویی؛ به عنوان مثال، افزودن نمونه‌هایی از مکالمات که معمولاً به موافقت بیش از حد منجر می‌شوند و سپس آموزش مدل برای عدم تکرار چنین رفتاری.

در ارزیابی‌های هدفمندی که برای سنجش تملق‌گویی با استفاده از دستورات (پرامپت‌های) خاص طراحی شده بودند، GPT-5 کاهش چشمگیری در پاسخ‌های تملق‌آمیز از خود نشان داد (از 14.5% به کمتر از 6%). با وجود اینکه کاهش تملق‌گویی می‌تواند گاهی با کاهش رضایت کاربر همراه باشد، پیشرفت‌های حاصل‌شده در این مدل، توانسته است این رفتار را به بیش از نصف کاهش دهد و هم‌زمان دستاوردهای قابل‌اندازه‌گیری دیگری نیز به همراه داشته باشد. در نتیجه، کاربران همچنان مکالماتی سازنده و باکیفیت را تجربه می‌کنند که این امر با هدف OpenAI در کمک به مردم برای بهره‌وری بیشتر از ChatGPT هم‌راستا است.

سفارشی‌سازی ChatGPT و شخصیت های GPT 5

GPT 5 در زمینه پیروی از دستورالعمل‌ها بهبود چشمگیری یافته است و این پیشرفت به‌ویژه در توانایی آن برای رعایت دستورالعمل‌های سفارشی که توسط کاربر ارائه می‌شود، کاملاً مشهود است. این قابلیت به کاربران اجازه می‌دهد تا تجربه تعامل خود را با دقت بیشتری شخصی‌سازی کنند.

با توجه به پیشرفت‌های حاصل‌شده در زمینه قابلیت هدایت‌پذیری، شرکت OpenAI در حال ارائه یک نسخه پیش‌نمایش تحقیقاتی از چهار شخصیت از پیش تعیین‌شده جدید برای تمامی کاربران ChatGPT است. این شخصیت‌ها که در ابتدا برای چت متنی و سپس برای چت صوتی در دسترس خواهند بود، به کاربران این امکان را می‌دهند که بدون نیاز به نوشتن دستورات (پرامپت‌های) سفارشی طولانی، نحوه تعامل ChatGPT را تغییر دهند. برای مثال، می‌توانند آن را به صورت مختصر و حرفه‌ای، یا متفکر و حمایت‌گر، یا حتی کمی طعنه‌آمیز تنظیم کنند. این چهار گزینه اولیه با نام‌های “بدبین (Cynic)”، “ربات (Robot)”، “شنونده (Listener)” و “خوره (Nerd)”، کاملاً اختیاری هستند و کاربران می‌توانند هر زمان که بخواهند، آن‌ها را از بخش تنظیمات تغییر دهند. این شخصیت‌ها برای هماهنگی بهتر با سبک ارتباطی فردی کاربران طراحی شده‌اند.

تمامی این شخصیت های GPT 5، در ارزیابی‌های داخلی شرکت OpenAI برای کاهش تملق‌گویی، حداقل استانداردهای تعیین‌شده را رعایت کرده یا حتی از آن‌ها فراتر رفته‌اند. شرکت OpenAI مشتاقانه منتظر دریافت بازخوردهای اولیه از کاربران برای بهبود و توسعه مستمر این قابلیت‌ها است.

حفاظت جامع در برابر خطرات بیولوژیکی

شرکت OpenAI با در نظر گرفتن مدل GPT 5 thinking به‌عنوان یک مدل پیشرفته در حوزه‌های بیولوژیکی و شیمیایی، تدابیر ایمنی گسترده‌ای را برای به حداقل رساندن خطرات احتمالی آن در نظر گرفته است. بر اساس چارچوب آمادگی این شرکت، مدل مذکور به‌دقت با ارزیابی‌های ایمنی مورد آزمایش قرار گرفته و با همکاری شرکای معتبری همچون CAISI و UK AISI، بیش از 5000 ساعت آزمایش “red-teaming” بر روی آن انجام شده است.

این شرکت با وجود اینکه شواهد قطعی مبنی بر اینکه این مدل بتواند به‌طور قابل‌توجهی به یک فرد بدون تخصص برای ایجاد آسیب‌های بیولوژیکی کمک کند، در دست ندارد (که این همان آستانه تعریف‌شده برای یک مدل با قابلیت‌های بالا است)، رویکردی پیشگیرانه اتخاذ کرده و تمهیدات ایمنی لازم را فعال کرده است. این اقدامات برای افزایش آمادگی در برابر زمانی است که چنین قابلیت‌هایی ممکن است در دسترس قرار گیرند. در نتیجه، GPT-5 thinking با یک سیستم دفاعی چندلایه، از یک پشته ایمنی قوی در حوزه زیست‌شناسی بهره می‌برد. این سیستم شامل موارد زیر است: مدل‌سازی جامع تهدیدها، آموزش مدل برای عدم تولید محتوای مضر از طریق رویکرد جدید “تکمیل‌های ایمن”، وجود دائمی طبقه‌بندی‌کننده‌ها و ناظران استدلال و همچنین فرآیندهای اجرایی دقیق و روشن.

مدل GPT 5 پرو

برای انجام چالش‌برانگیزترین و پیچیده‌ترین وظایف، شرکت OpenAI مدل GPT-5 pro را نیز عرضه کرده است. این مدل، که جایگزین GPT-4o pro می‌شود، نسخه‌ای پیشرفته از GPT-5 است که برای تولید پاسخ‌های جامع و با بالاترین کیفیت، فرآیند تفکر طولانی‌تری را طی می‌کند و در هنگام اجرا، از محاسبات موازی و کارآمد بهره می‌برد. GPT-5 pro توانسته است در چندین معیار چالش‌برانگیز هوش، از جمله کسب عملکرد بی‌نظیر در معیار GPQA که شامل سؤالات علمی بسیار دشوار است، بالاترین امتیاز را در خانواده GPT 5 به دست آورد.

در ارزیابی‌هایی که با استفاده از بیش از 1000 دستور (پرامپت) استدلالی واقعی و ارزشمند انجام شد، کارشناسان خارجی در 67.8% موارد، GPT 5 pro را به “GPT-5 thinking” ترجیح دادند. نتایج این بررسی‌ها نشان داد که GPT-5 pro حدود 22% خطاهای عمده کمتری داشته و در حوزه‌هایی مانند سلامت، علوم، ریاضیات و کدنویسی عملکردی عالی از خود به نمایش گذاشته است. همچنین، کارشناسان پاسخ‌های این مدل را مرتبط، مفید و جامع ارزیابی کردند.

روش استفاده از GPT 5

در حال حاضر، GPT 5 به عنوان مدل پیش‌فرض در ChatGPT در دسترس است و برای تمامی کاربرانی که وارد حساب کاربری خود شده‌اند، جایگزین مدل‌های پیشین مانند GPT-4o، GPT-4.5، GPT-4.1 و OpenAI o4-mini می‌شود. برای استفاده از این مدل، کافی است ChatGPT را باز کرده و سؤال خود را مطرح کنید. GPT-5 به‌طور هوشمندانه و در صورت نیاز، قابلیت استدلال خود را به‌صورت خودکار فعال کرده و پاسخ مناسب را ارائه می‌دهد. علاوه بر این، کاربران دارای اشتراک، همچنان می‌توانند با استفاده از انتخاب‌گر مدل، به‌صورت دستی گزینه “GPT 5 Thinking” را انتخاب کنند یا با افزودن عباراتی مانند “درباره این موضوع عمیق فکر کن” به دستور (پرامپت)، از به‌کارگیری قابلیت استدلال توسط مدل اطمینان حاصل نمایند.

کاربردهای GPT 5

۱. تولید محتوا و کمک به نویسندگی
GPT 5 می‌تواند به نویسندگان، خبرنگاران و تولیدکنندگان محتوا کمک کند تا متن‌هایی دقیق، روان و متناسب با سبک مورد نظرشان ایجاد کنند. این مدل نه تنها توانایی نوشتن مقالات علمی، خبری و وبلاگی را دارد، بلکه می‌تواند داستان، شعر و حتی سناریوهای تبلیغاتی خلاقانه تولید کند. ویژگی مهم GPT-5 این است که با درک بهتر زمینه (context) و سبک، محتوایی می‌سازد که کمتر “ماشینی” به نظر می‌رسد و بیشتر حس انسانی دارد.

۲. پشتیبانی مشتریان و خدمات آنلاین
یکی از کاربردهای GPT-5 در بخش پشتیبانی و پاسخ‌گویی به مشتریان است. این مدل می‌تواند در چت‌بات‌ها، سیستم‌های تیکتینگ و حتی تماس‌های صوتی به کار رود تا پاسخ‌هایی سریع، دقیق و مودبانه ارائه دهد. توانایی GPT 5 در فهم، پردازش زبان طبیعی و مدیریت مکالمات پیچیده، باعث می‌شود تجربه‌ی کاربر به مراتب بهتر از نسل‌های قبلی باشد.

۳. آموزش و یادگیری شخصی‌سازی‌شده
GPT 5 می‌تواند به عنوان یک معلم خصوصی عمل کند و با توجه به سطح دانش و سبک یادگیری هر فرد، مطالب آموزشی را تنظیم کند. این قابلیت در یادگیری زبان، آموزش برنامه‌نویسی، حل مسائل ریاضی و حتی آمادگی آزمون‌ها کاربرد دارد. با تعامل طبیعی و پاسخ‌های مرحله‌به‌مرحله، یادگیری برای کاربر لذت‌بخش‌تر و مؤثرتر می‌شود.

۴. کمک به تحقیقات و تحلیل داده
در حوزه‌های علمی و صنعتی، GPT 5 می‌تواند حجم زیادی از اطلاعات و مقالات را بررسی کرده و نتایج و خلاصه‌های مفید ارائه دهد. این ویژگی به محققان کمک می‌کند تا سریع‌تر به دیدگاه‌های جدید برسند و زمان خود را صرف تحلیل و خلاقیت کنند، نه جستجوی دستی اطلاعات. همچنین، GPT-5 می‌تواند با ترکیب داده‌های متنی و حتی چندرسانه‌ای، پیشنهادات یا پیش‌بینی‌های ارزشمندی ارائه کند.

دسترسی به مدل GPT 5

از تاریخ 7 آگوست 2025، مدل GPT 5 برای تمامی کاربران با اشتراک‌های Plus، Pro و Team و همچنین کاربران رایگان در حال عرضه است. دسترسی به این مدل برای مشتریان سازمانی (Enterprise) و آموزشی (Edu) از هفته‌های آینده فراهم خواهد شد. علاوه بر این، کاربران Pro، Plus و Team می‌توانند با ورود به حساب کاربری ChatGPT خود، از طریق Codex CLI شروع به کدنویسی با GPT 5 کنند.

همانند GPT-4o، تفاوت اصلی بین دسترسی رایگان و پولی به GPT 5 در میزان حجم استفاده است. کاربران با اشتراک Pro به GPT-5 دسترسی نامحدود داشته و همچنین به GPT 5 Pro نیز دسترسی پیدا می‌کنند. کاربران با اشتراک Plus می‌توانند با محدودیت استفاده‌ای به‌مراتب کمتر از کاربران رایگان، به‌راحتی از این مدل به‌عنوان مدل پیش‌فرض برای پرسش‌های روزمره خود استفاده کنند. مشتریان Team، Enterprise و Edu نیز می‌توانند از این مدل به‌عنوان گزینه پیش‌فرض بهره ببرند. برای کاربران رایگان ChatGPT، ممکن است فعال‌سازی کامل قابلیت‌های استدلال مدل چند روزی به طول بینجامد. پس از اینکه کاربران رایگان به سقف استفاده خود از GPT-5 برسند، به‌طور خودکار به GPT 5 mini، که یک مدل کوچک‌تر، سریع‌تر و بسیار توانمند است، منتقل خواهند شد.

جمع‌بندی

هوش مصنوعی GPT 5 با ویژگی‌های بی‌مانند خود، از شخصیت‌های GPT 5 که تجربه‌ای شخصی‌سازی‌شده را به ارمغان می‌آورند تا کاربردهای GPT-5 در کدنویسی، نویسندگی و حوزه سلامت، به راستی افق‌های جدیدی را در دنیای فناوری گشوده است. مدل GPT 5 نه تنها با کاهش خطاها و افزایش صداقت در پاسخ‌ها، اعتماد کاربران را جلب کرده، بلکه با روش استفاده از GPT 5 که برای همه، از کاربران عادی تا متخصصان، ساده و در دسترس است، به ابزاری ضروری برای آینده تبدیل شده است. این مقاله نشان می‌دهد که GPT-5، به عنوان نقطه عطفی در پیشرفت‌های OpenAI و قدمی نوآورانه برای حرکت دنیای هوش مصنوعی به AGI، چگونه می‌تواند خلاقیت و بهره‌وری را در زندگی روزمره و حرفه‌ای متحول کند و ما را به سوی جهانی هوشمندتر و کارآمدتر هدایت نماید.

امتیاز دهید!
0 / 0

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا