در آستانهی تحقق رویایی که سالها به نظر غیرممکن میرسید، مدل جمینای ۳ (Gemini 3)، آخرین دستاورد عظیم گوگل، پا به عرصه گذاشته است؛ نه یک بهروزرسانی ساده، بلکه یک جهش بنیادین که مستقیماً به سمت هوش عمومی مصنوعی (AGI) نشانه رفته است. این مدل با معماری انقلابی خود، استدلال در سطح دکترا و قابلیتهای هوش مصنوعی چندوجهی (multimodal AI) را به سطحی کاملاً جدید برده و آغازگر عصری است که در آن ماشینها از نقش دستیار صرف خارج شده و به شرکای واقعی فکری در مواجهه با پیچیدهترین چالشهای علمی و فنی تبدیل میشوند.
اما این انقلاب صرفاً در حوزهی نظری و بنچمارکها محصور نمیماند. در بُعد عملی، جمینای ۳ با معرفی قابلیتهای هوش مصنوعی عاملی (Agentic AI)، ماهیت توسعه نرمافزار را متحول ساخته است. عاملهای هوشمند اکنون از یک ابزار، به شریک فعالی تبدیل شدهاند که میتوانند وظایف پیچیده و چندمرحلهای را به صورت خودکار برنامهریزی و اجرا کنند. مقاله پیش رو، ضمن بررسی دقیق عملکرد مدل در آزمونهای تخصصی (مانند Humanity’s Last Exam)، بر پلتفرم جدید Google Antigravity نیز تمرکز خواهد کرد؛ محیط توسعهای که به کاربران فردی و توسعهدهندگان آزادی عمل میدهد تا با استفاده از این سطح بیسابقه از هوشمندی، ایدههای خود را مستقل و با بهرهوری بالا به واقعیت تبدیل کنند. مطالعه این گزارش تخصصی، درک عمیقی از اینکه چگونه این فناوریهای نوظهور، مرزهای فردی و عملی توسعه را برای آیندهای مبتنی بر آزادی نوآوری گسترش میدهند، فراهم خواهد آورد.
چشمانداز ساندار پیچای: آغاز عصر جدید هوش مصنوعی و مسیر AGI
نزدیک به دو سال پیش، شرکت هوش مصنوعی گوگل (Google AI) با معرفی مجموعه مدلهای جمینای، یک مسیر استراتژیک و یکی از بزرگترین تلاشهای علمی و محصولی خود را آغاز نمود. این حرکت، که به منظور تحقق چشمانداز گستردهتر هوش عمومی مصنوعی (AGI) صورت پذیرفت، با استقبال شگرف کاربران مواجه شده است. شواهد حاکی از موفقیت این رویکرد شامل مواردی چون استفاده ماهانه ۲ میلیارد کاربر از قابلیت “نمای کلی مبتنی بر هوش مصنوعی (AI Overviews)” در نتایج جستجو، فراتر رفتن از ۶۵۰ میلیون کاربر ماهانه برای اپلیکیشن جمینای، استفاده بیش از ۷۰ درصد از مشتریان سرویسهای ابری (Cloud) از راهکارهای هوش مصنوعی گوگل و همچنین، برنامهنویسی ۱۳ میلیون توسعهدهنده با استفاده از مدلهای زبانی بزرگ (LLM) و مدلهای هوش مصنوعی مولد (Generative AI) این شرکت است. این آمارها تنها بخش کوچکی از تأثیرگذاری عمیق این فناوریهای نوین در حوزههای مختلف را به نمایش میگذارند.
قابلیت شرکت هوش مصنوعی گوگل در ارائه سریع و مستمر قابلیتهای استدلال پیشرفته (Advanced Reasoning) به جامعه جهانی، مرهون اتخاذ یک رویکرد متمایز در نوآوری مبتنی بر “رویکرد فول استک (Full Stack)” است. این استراتژی جامع، که توسط ساندار پیچای (Sundar Pichai) تبیین شده، تمامی اجزای حیاتی فناوری هوش مصنوعی را در بر میگیرد؛ از توسعه زیرساختهای محاسباتی پیشرو و تحقیقات بنیادی گرفته تا طراحی مدلهای زبانی بزرگ (LLM) و مدلهای هوش مصنوعی چندوجهی (Multimodal AI) در سطح جهانی، ارائه ابزارهای کارآمد و در نهایت، یکپارچهسازی آنها در محصولاتی که در دسترس میلیاردها کاربر قرار میگیرند، که آغازگر “عصر جدید هوش مصنوعی” محسوب میشود.
هر نسل متوالی از مدلهای جمینای (Gemini) بر مبنای پیشرفتهای نسل قبلی بنا نهاده شده و به طور مداوم، توانمندیهای کاربران را ارتقا میبخشد. مدلهای اولیه جمینای ۱، با معرفی قابلیتهای هوش مصنوعی چندوجهی (Multimodal AI) بومی و افزایش قابل توجه در طول “پنجره کانالی (Context Window یا معادل حجم حافظه)”، دامنه و میزان اطلاعات قابل پردازش را گسترش دادند. به دنبال آن، جمینای ۲ اساس قابلیتهای “هوش مصنوعی عاملی (Agentic AI)” را پیریزی کرد و مرزهای استدلال پیشرفته و تفکر منطقی را جابجا نمود. این پیشرفتها امکان انجام وظایف و حل ایدههای پیچیدهتر، را فراهم آورد؛ به نحوی که مدل Gemini 2.5 Pro به مدت بیش از شش ماه در صدر جدول معتبر LMArena قرار گرفت و نشاندهنده توانمندی این مدل زبانی بزرگ (LLM) در رقابت با سایر مدلها بود.
در حال حاضر، شرکت هوش مصنوعی گوگل با افتخار جمینای ۳ (Gemini 3) را معرفی میکند؛ این مدل هوشمندترین نوآوری شرکت در این حوزه است و با تجمیع تمامی قابلیتهای پیشین مدل زبانی بزرگ (LLM) جمینای، به کاربران امکان میدهد تا هرگونه ایده و تصور را به واقعیت تبدیل کنند. این مدل جدید، به عنوان یک گام اساسی در مسیر رسیدن به هدف هوش عمومی مصنوعی (AGI)، نویدبخش یک تغییر پارادایم در کاربردهای هوش مصنوعی عاملی (Agentic AI) و استدلال پیشرفته است.
مدل جمینای ۳ (Gemini 3) از نظر قابلیت “استدلال پیشرفته (Advanced Reasoning)” در بالاترین سطح دانش روز (State-of-the-Art) قرار دارد. این مدل زبانی بزرگ (LLM) با معماری نوین خود، برای درک دقیقترین جزئیات و ظرافتها طراحی شده است. این توانایی، شامل درک سرنخهای ظریف و پنهان در یک مفهوم خلاقانه یا تحلیل لایههای پیچیده و در هم تنیده یک مسئله علمی دشوار است. جمینای ۳ عملکرد به مراتب بهتری در تشخیص بافت و زمینه (Context) و منظور واقعی درخواست کاربر (هدف نهایی) نشان میدهد. این امر موجب میشود که کاربران با پرامپتنویسی (Prompting) یا فرماندهی کمتری به نتایج مورد نظر خود دست یابند. قابل توجه است که در طول تنها دو سال، هوش مصنوعی گوگل از صرف پردازش متن و تصاویر به تکامل در “درک شرایط (Reading the Room)” دست یافته است که یک معیار کلیدی در مسیر تحقق هوش عمومی مصنوعی (AGI) محسوب میشود.
از اواخر نوامبر 2025، شرکت هوش مصنوعی گوگل آغاز به ارائه قابلیتهای جمینای ۳ (Gemini 3) در مقیاس وسیع سرویسهای خود نموده است. این توزیع گسترده شامل ادغام Gemini 3 در «حالت هوش مصنوعی» (AI Mode) جستجوی (Google Search) است که تجربه کاربری را با توانایی استدلال پیشرفتهتر و قابلیتهای پویای جدید ارتقا میبخشد. این رخداد، نخستین باری است که هوش مصنوعی گوگل یک نسخه از مدل جِمینای را همزمان با عرضه، در محصول جستجوی خود ارائه میکند. علاوه بر این، جمینای ۳ از امروز در اپلیکیشن جِمینای، برای توسعهدهندگان از طریق AI Studio و Vertex AI و همچنین در پلتفرم جدید توسعه «هوش مصنوعی عاملی» (Agentic AI)، یعنی Google Antigravity، که جزئیات آن متعاقباً منتشر خواهد شد، در دسترس قرار خواهد گرفت. این رویکرد گسترده، بر اساس استراتژی «رویکرد فول استک» (Full Stack) شرکت استوار است.
همانند نسلهای پیشین، جمینای ۳ (Gemini 3) بار دیگر استانداردهای دانش روز (State-of-the-Art) در صنعت مدل زبانی بزرگ (LLM) و هوش مصنوعی چندوجهی (Multimodal AI) را بهبود میبخشد. در این فصل نوین از عصر جدید هوش مصنوعی، شرکت هوش مصنوعی گوگل متعهد است که به پیشبرد مرزهای هوش، توسعه “هوش مصنوعی عاملی (Agentic AI)” کارآمد و قابلیتهای شخصیسازی پیشرفته ادامه دهد تا فناوری هوش مصنوعی مولد واقعاً برای تمامی افراد و کاربردهای مختلف سودمند واقع شود و گامی دیگر به سمت AGI برداشته شود.
ساندار پیچای امیدوار است که علاقهمندان به تکنولوژی از قابلیتهای نوین جمینای ۳ (Gemini 3) و پیشرفتهای حاصل شده در زمینه استدلال پیشرفته و هوش مصنوعی عاملی استقبال نمایند. شرکت هوش مصنوعی گوگل بر تداوم بهبود این مدل متمرکز است و مشتاقانه منتظر مشاهده نوآوریها و کاربردهای خلاقانهای است که توسعهدهندگان با استفاده از این ابزار جدید مدل زبانی بزرگ (LLM) خلق خواهند کرد. اخبار و بهروزرسانیهای بیشتری در راه است.
معرفی رسمی مدل پرچمدار Gemini 3 Pro و دستاوردهای کلیدی آن
در راستای چشمانداز استراتژیک شرکت هوش مصنوعی گوگل (Google AI) برای دستیابی به هوش عمومی مصنوعی (AGI)، در 18 م.امبر 2025 یک گام بزرگ دیگر برداشته شده و مدل پرچمدار جمینای ۳ (Gemini 3) رسماً معرفی و منتشر شد. این عرضه، نمایانگر جهشی کوانتومی در تواناییهای مدل زبانی بزرگ (LLM) است و به طور خاص، بر توان استدلال پیشرفته (Advanced Reasoning) تمرکز دارد تا مرزهای هوش مصنوعی مولد (Generative AI) را توسعه دهد.
این مدل جدید، یعنی Gemini 3 Pro، اکنون به عنوان بهترین مدل جهانی در زمینه “درک چندوجهی (Multimodal Understanding)” تلقی میشود. علاوه بر این، این مدل قدرتمندترین نمونه در حوزه “هوش مصنوعی عاملی” و “کدنویسی حسی (Vibe Coding)” است که تاکنون توسط هوش مصنوعی گوگل توسعه یافته است. قابلیت “کدنویسی حسی” به مدل این امکان را میدهد که علاوه بر دستورالعملهای صریح، ظرایف و حس نهفته در یک درخواست را نیز درک کند (مانند تشخیص این که یک طرح گرافیکی باید حس نوستالژی یا مدرن داشته باشد). Gemini 3 Pro با ارائه تجسمهای غنیتر و امکان تعامل عمیقتر، پتانسیلهای گستردهای را در توسعه نرمافزار با هوش مصنوعی و سایر حوزهها نمایان میسازد؛ تمامی این توانمندیها بر پایهی یک ساختار استدلال پیشرفته (State-of-the-Art Reasoning) بنا نهاده شدهاند.
شرکت هوش مصنوعی گوگل “عصر Gemini 3” را با عرضه مدل Gemini 3 Pro در نسخه پیشنمایش (Preview) آغاز میکند و این مدل پرچمدار را از 18 نوامبر 2025 در مجموعهای از محصولات اصلی گوگل در دسترس کاربران قرار میدهد. این دسترسی گسترده به کاربران این امکان را میدهد تا در فعالیتهای روزمره خود، از جمله یادگیری، خلق محتوا و برنامهریزیهای پیچیده، از قابلیتهای این مدل زبانی بزرگ (LLM) بهرهمند شوند. همچنین، در این رونمایی، قابلیت جدید “جمینای ۳ تفکر عمیق (Gemini 3 Deep Think)” نیز معرفی شده است. این حالت، یک وضعیت استدلال پیشرفته اختصاصی است که عملکرد Gemini 3 Pro را حتی فراتر میبرد. دسترسی اولیه به “Deep Think” در ابتدا در اختیار تیمهای آزمایشکننده ایمنی قرار میگیرد و متعاقباً برای مشترکین Google AI Ultra میسر خواهد شد.
استدلال پیشرفته Gemini 3: صدرنشینی در بنچمارکهای Humanity’s Last Exam و GPQA
مدل جمینای ۳ پرو (Gemini 3 Pro) به لطف قابلیتهای استدلال پیشرفته و هوش مصنوعی چندوجهی خود که در بالاترین سطح دانش روز قرار دارند، قادر است هر ایده پیچیدهای را به واقعیت تبدیل نماید. این مدل زبانی بزرگ به طور چشمگیری عملکرد نسل پیشین خود، یعنی Gemini 2.5 Pro، را در تمامی معیارهای اصلی سنجش هوش مصنوعی (AI Benchmark) پشت سر گذاشته و توانمندی بیبدیلی را در پردازش و تحلیل دادهها به نمایش میگذارد. این برتری، نشاندهنده یک جهش قابل توجه در توسعه هوش مصنوعی گوگل به سوی اهداف هوش عمومی مصنوعی (AGI) است.
این مدل با کسب نمره برجسته ۱۵۰۱ Elo، جایگاه صدرنشینی را در جدول امتیازات LMArena Leaderboard تثبیت میکند. جمینای ۳ پرو توانمندی خود را در “استدلال در سطح دکترا (PhD-Level Reasoning)” با کسب بالاترین امتیازات در آزمونهای دشوار به اثبات رسانده است. این موفقیت شامل دستیابی به ۳۷.۵٪ در آزمون چالشبرانگیز Humanity’s Last Exam (بدون استفاده از ابزارهای جانبی) و نمره ۹۱.۹٪ در آزمون GPQA Diamond است. علاوه بر این، در حوزه تخصصی ریاضیات نیز، جمینای ۳ پرو با کسب ۲۳.۴٪ در بنچمارک MathArena Apex، یک رکورد جدید در میان مدلهای پیشرفته (Frontier Models) به ثبت میرساند و معیار جدیدی برای ارزیابی تواناییهای محاسباتی تعیین میکند.

فراتر از پردازش صرفاً متنی، جمینای ۳ پرو (Gemini 3 Pro) مفهوم “استدلال چندوجهی (Multimodal Reasoning)” را بازتعریف میکند. این مدل هوش مصنوعی چندوجهی با کسب نمره ۸۱٪ در MMMU-Pro و ۸۷.۶٪ در Video-MMMU، برتری خود را در درک و تحلیل دادهها از طریق ورودیهای متنوع (مانند متن، تصویر و ویدیو) نشان میدهد. همچنین، با کسب امتیاز ۷۲.۱٪ در آزمون SimpleQA Verified، این مدل یک رکورد جدید در معیار “دقت واقعیتسنجی (Factuality Accuracy)” ثبت میکند. این دستاوردها بدان معناست که جمینای ۳ پرو به عنوان یک مدل زبانی بزرگ (LLM)، در حل مسائل پیچیده در طیف گستردهای از موضوعات علمی، ریاضی و عمومی با سطح بالایی از قابلیت اطمینان و صحت اطلاعاتی بسیار توانمند است.
جمینای ۳ پرو (Gemini 3 Pro) سطح جدیدی از عمق و جزئیات دقیق را به تعاملات کاربر-هوش مصنوعی میآورد. پاسخهای تولید شده توسط این مدل هوش مصنوعی گوگل هوشمندانه، مختصر و صریح هستند و صرفاً تکرار کلیشهها یا لحنهای چاپلوسانه نیستند، بلکه بینشهای واقعی را ارائه میدهند. به عبارت دیگر، این مدل آنچه را که کاربر برای حل مسئله نیاز دارد بشنود، نه لزوماً آنچه را که صرفاً مطلوب اوست، بیان میکند. این ویژگیها جمینای ۳ پرو را به یک شریک فکری (Intellectual Partner) واقعی تبدیل میکند. این مدل با قابلیتهایی نظیر ترجمه مفاهیم علمی سنگین (مانند تئوریهای کوانتومی) به زبان ساده، تولید کد برای تجسمهای با کیفیت بالا (High-Fidelity Visualizations) در توسعه نرمافزار با هوش مصنوعی و طوفان فکری (Creative Brainstorming) خلاقانه، راههای جدیدی را برای درک اطلاعات و ابراز وجود کاربران فراهم میسازد که حاکی از پتانسیل بالای آن به عنوان یک “هوش مصنوعی عاملی” است.
حالت تفکر عمیق Gemini 3 (Deep Think): فراتر از مرزهای هوش برای حل مسائل پیچیده
معرفی حالت “جمینای ۳ تفکر عمیق (Gemini 3 Deep Think)” نشاندهنده یک جهش کیفی در توسعه مدل زبانی بزرگ (LLM) توسط هوش مصنوعی گوگل است که “مرزهای هوش (Frontiers of Intelligence)” را فراتر میبرد. این حالت اختصاصی، یک تغییر اساسی در “قابلیت استدلال پیشرفته (Advanced Reasoning Capability)” و “درک چندحالتی (Multimodal Understanding)” مدل جمینای ۳ ایجاد میکند. هدف اصلی Gemini 3 Deep Think، کمک به کاربران و محققان برای “حل مسائل پیچیده” و چندلایه است؛ مسائلی که نیازمند سطح بالایی از تحلیل، استنتاج منطقی و تلفیق دادهها از منابع مختلف (متن، تصویر و غیره) هستند. این قابلیت، چشماندازهای جدیدی را برای کاربردهای هوش مصنوعی عاملی در حوزههای تخصصی باز میکند.
در ارزیابیهای فنی و آزمونهای سختگیرانه، حالت جمینای ۳ تفکر عمیق (Gemini 3 Deep Think) به صورت قابل توجهی از عملکرد چشمگیر مدل Gemini 3 Pro نیز فراتر میرود. این برتری با نتایج بهبودیافته در بنچمارکهای مهم هوش مصنوعی مشهود است: در آزمون Humanity’s Last Exam، که سطح دشواری آن بسیار بالا است، به نمره ۴۱.۰٪ (بدون استفاده از ابزار) دست یافته و در بنچمارک GPQA Diamond، که نیازمند استدلال پیشرفته در سطح دکترا است، امتیاز ۹۳.۸٪ را کسب کرده است. افزون بر این، این حالت توانسته است به امتیاز بیسابقه ۴۵.۱٪ در آزمون ARC-AGI-2 (با اجرای کد، که توسط ARC Prize تأیید شده) دست یابد. این دستاوردها، به وضوح توانایی Gemini 3 Deep Think را در حل چالشهای نوین و نیازمند تفکر استنتاجی و خلاقانه، تأیید کرده است.

یادگیری همهجانبه با قابلیتهای Multimodal (متن، کد و ویدیو)
مدل جمینای ۳ (Gemini 3) از همان ابتدا با هدف ترکیب و سنتز یکپارچه اطلاعات از طریق چندین حالت (Modality)، شامل متن، تصویر ویدیو، صدا و کد، توسعه یافته است. این نسخه جدید، مرزهای هوش مصنوعی چندوجهی را به طور قابل توجهی گسترش میدهد تا یک محیط یادگیری همهجانبه فراهم سازد. این توانمندی با تلفیق استدلال پیشرفته در سطح دانش روز، درک بینایی و فضایی (Visual and Spatial Understanding)، عملکرد چندزبانه پیشرو و یک پنجره کانالی (Context Window) عظیم تا سقف ۱ میلیون توکن، امکانپذیر شده است. این ترکیب مهارتها به کاربران اجازه میدهد تا به روشهایی که برای سبک یادگیری شخصی آنها منطقیتر است، دانش کسب کنند و جمینای ۳ را به یک مدل زبانی بزرگ (LLM) استثنایی تبدیل میکند. اگر در درک مفهوم Context Window دچار تردید هستید، پیشنهاد میشود مقالهی جامع پنجره کانالی را مطالعه نمائید.
این قابلیتهای هوش مصنوعی چندوجهی در زندگی روزمره کاربردهای متعددی دارند. برای مثال، اگر فردی تمایل داشته باشد آشپزی را مطابق با سنتهای خانوادگی خود بیاموزد، جمینای ۳ میتواند دستورالعملهای دستنویس به زبانهای مختلف (مانند نسخههای خطی قدیمی فارسی یا عربی) را رمزگشایی و ترجمه کند و آنها را در قالب یک کتاب آشپزی خانوادگی قابل اشتراک سازماندهی نماید. در مثالی دیگر، در فرآیند “یادگیری همهجانبه” پیرامون یک موضوع جدید، کاربر میتواند مجموعهای از مقالات دانشگاهی، سخنرانیهای ویدیویی طولانی، یا آموزشها (Tutorials) را به مدل ارائه دهد. سپس، جمینای ۳ میتواند کد لازم برای ساخت “فلشکارتهای تعاملی”، “تجسم دادههای علمی (Visualizations)” یا سایر قالبهای آموزشی را تولید کند که به تسلط بر آن مطالب کمک میکند. حتی در حوزه ورزش، این مدل هوش مصنوعی عاملی میتواند ویدیوهای تمرینی (مانند یک بازی فوتسال) را تحلیل کرده، نقاط ضعف تکنیکی را شناسایی و یک برنامه تمرینی اختصاصی برای بهبود کلی فرم بازی (Performance) ایجاد کند.
برای تسهیل درک و پردازش اطلاعات موجود در وب، اکنون “حالت هوش مصنوعی (AI Mode)” در جستجوی (Google Search) از توانمندیهای مدل جمینای ۳ (Gemini 3) بهره میگیرد. این ادغام، فعالسازی تجربههای رابط کاربری مولد جدیدی را ممکن میسازد. این موارد شامل “چیدمانهای بصری فراگیر (Immersive Visual Layouts)” و همچنین ابزارها و شبیهسازیهای کاملاً تعاملی هستند. نکته حائز اهمیت این است که تمامی این عناصر به صورت کامل و “بر اساس آنی (On the Fly)” و متناسب با پرسش کاربر تولید میشوند. این ویژگیها، کاربردهای عملیاتی هوش مصنوعی گوگل را در حوزه “یادگیری” و “برنامهریزی” با استدلال پیشرفته، به طور بیسابقهای تقویت میکنند.
توسعه، کدنویسی و “وایب کدینگ” (Vibe Coding) با مدل Agentic Gemini 3
مدل جمینای ۳ (Gemini 3)، با تکیه بر دستاوردهای برجسته نسل قبلی خود، Gemini 2.5 Pro، به وعده شرکت هوش مصنوعی گوگل مبنی بر تبدیل هر ایده به واقعیت در حوزه “توسعه نرمافزار با هوش مصنوعی” عمل میکند. این مدل زبانی بزرگ (LLM) به طور چشمگیری در “تولید صفر-شات (Zero-Shot Generation)” (تولید خروجی دقیق تنها با یک فرمان) عملکردی فوقالعاده از خود نشان داده و از پرامپتها (Prompts) و دستورالعملهای بسیار پیچیده پشتیبانی مینماید. این قابلیت امکان “توسعه” رابطهای کاربری وب (Web UI) غنیتر و تعاملیتری را فراهم میآورد، که خود نشانهای از قدرت “استدلال پیشرفته” و هوش مصنوعی عاملی (Agentic AI) این مدل است.
Gemini 3 Pro به عنوان بهترین مدل در زمینه کدنویسی حسی یا همان وایب کدینگ (Vibe Coding)” و “کدنویسی عاملمحور (Agentic Coding)” شناخته میشود که تاکنون توسط هوش مصنوعی گوگل ساخته شده است. قابلیت “کدنویسی حسی” به مدل اجازه میدهد تا علاوه بر منطق کدنویسی، ظرایف سبکی یا حس (Vibe) مورد نظر توسعهدهنده (مانند یک رابط کاربری مینیمالیستی یا پرجنبوجوش) را نیز درک و اجرا نماید. این مدل “هوش مصنوعی عاملی” با خودکارسازی بسیاری از فرآیندها، بهرهوری توسعهدهندگان را در “گردش کار (Workflow)” به طرز چشمگیری افزایش میدهد. عملکرد درخشان این مدل در بنچمارکها شامل کسب امتیاز چشمگیر ۱۴۸۷ Elo و صدرنشینی در جدول امتیازات WebDev Arena است. همچنین، در آزمون Terminal-Bench 2.0، که توانایی مدل را در استفاده از ابزارهای API برای تعامل با رایانه از طریق ترمینال میسنجد، امتیاز ۵۴.۲٪ را کسب میکند و در معیار SWE-bench Verified (با کسب ۷۶.۲٪) که به ارزیابی “عاملهای کدنویسی” (Coding Agents) میپردازد، عملکردی به مراتب بهتر از Gemini 2.5 Pro به نمایش میگذارد.
توسعهدهندگان اکنون میتوانند با استفاده از جمینای ۳ (Gemini 3) از طریق چندین پلتفرم کلیدی برنامهنویسی نمایند. این دسترسی شامل محیطهای توسعه Google AI Studio و Vertex AI، ابزار خط فرمان Gemini CLI و پلتفرم نوین “توسعه عاملیتمحور” شرکت، Google Antigravity، میشود که به طور خاص برای ساخت “هوش مصنوعی عاملی” پیشرفته طراحی شده است. علاوه بر این، این مدل در پلتفرمهای توسعه نرمافزار با هوش مصنوعی شخص ثالث مشهوری همچون Cursor، GitHub، JetBrains، Manus و Replit نیز در دسترس قرار گرفته است تا دسترسی جامعه توسعهدهندگان را به این مدل زبانی بزرگ (LLM) گسترش دهد.
پلتفرم Agent-First Development گوگل: معرفی Google Antigravity و کدنویسی عاملی
در پی شتاب گرفتن تواناییهای هوشی مدل زبانی بزرگ (LLM) با عرضه جمینای ۳ (Gemini 3)، فرصت مغتنمی برای بازآفرینی کامل تجربه توسعهدهندگان فراهم آمده است. شرکت هوش مصنوعی گوگل در راستای این هدف، پلتفرم جدید Google Antigravity را معرفی کرده است. این پلتفرم توسعه “هوش مصنوعی عاملی، به منظور توانمندسازی توسعهدهندگان جهت فعالیت در سطحی بالاتر و با رویکرد “وظیفهمحور (Task-Oriented)” طراحی شده است. این نوآوری، توسعه نرمافزار با هوش مصنوعی را وارد مرحلهای جدید و پیشرفته میسازد که در آن، تمرکز از فرامین جزء به کل به اجرای خودمختار وظایف جامع منتقل میشود.
پلتفرم Google Antigravity با بهرهگیری از قابلیتهای “استدلال پیشرفته”، استفاده هوشمندانه از ابزارها و توان “کدنویسی عاملی (Agentic Coding)” مدل جمینای ۳، نقش دستیار هوش مصنوعی را از یک ابزار منفعل به یک “شریک فعال” در فرآیند برنامه نویسی ارتقا میدهد. اگرچه هسته Google Antigravity یک تجربه آشنای “محیط توسعه یکپارچه هوش مصنوعی (AI IDE)” را تداعی میکند، اما “هوش مصنوعی عاملی” آن به سطحی منحصر به فرد ارتقا یافتهاند. این عاملها اکنون دسترسی مستقیمی به ویرایشگر (Editor)، ترمینال (Terminal) و مرورگر (Browser) دارند. در نتیجه، عاملها قادرند تا وظایف پیچیده نرمافزاری را به صورت سر به سر (End-to-End) و خودمختار برنامهریزی و اجرا کنند و همزمان، اعتبار و صحت کد تولید شده توسط خود را نیز مورد تأیید و اعتبارسنجی قرار دهند.
شایان ذکر است که پلتفرم Google Antigravity علاوه بر استفاده از Gemini 3 Pro، با سایر مدلهای تخصصی شرکت هوش مصنوعی گوگل نیز به صورت تنگاتنگ یکپارچه شده است. این ادغام شامل مدل جدید Gemini 2.5 Computer Use برای کنترل مرورگر و مدیریت تعاملات کامپیوتری و همچنین مدل پیشرفته Nano Banana (Gemini 2.5 Image) است که به عنوان مدل برتر برای ویرایش و تحلیل تصاویر شناخته میشود. این ترکیب از مدلهای هوش مصنوعی چندوجهی، قدرت و دامنه توسعه نرمافزار با هوش مصنوعی را در این پلتفرم به شکل قابل ملاحظهای گسترش میدهد.
برنامهریزی و خودکارسازی وظایف با عاملهای هوشمند Gemini 3 (Long-Horizon Planning)
از زمان آغاز “عصر هوش مصنوعی عاملی (Agentic Era)” با معرفی مدل جمینای ۲، شرکت هوش مصنوعی گوگل پیشرفتهای قابل توجهی را در این حوزه به دست آورده است. این پیشرفتها نه تنها در تقویت قابلیتهای عامل کدنویسی جمینای مشهود است، بلکه به طور خاص در بهبود توانایی مدل برای “برنامهریزی افق طولانی (Long-Horizon Planning)” و قابل اعتماد برای دورههای زمانی گستردهتر نیز نمایان است. مدل جمینای ۳ این برتری را با قرار گرفتن در صدر جدول امتیازات Vending-Bench 2 اثبات میکند. این بنچمارک، توانایی برنامهریزی افق طولانی را از طریق مدیریت شبیهسازی شده یک کسبوکار (مانند مدیریت دستگاههای فروش خودکار Vending Machine) مورد سنجش قرار میدهد. Gemini 3 Pro استفاده ثابت از ابزار و تصمیمگیریهای خودکار را برای یک سال کامل از عملیات شبیهسازی شده حفظ میکند و در نتیجه، بازدهی بالاتری را بدون انحراف از وظایف محوله اصلی، به ارمغان میآورد.

این قابلیت جدید در هوش مصنوعی عاملی به این معنا است که جمینای ۳ میتواند به طور مؤثرتری در “خودکارسازی وظایف” روزمره به کاربران یاری رساند. با تلفیق “استدلال پیشرفته” عمیقتر با استفاده بهبودیافته و سازگارتر از ابزارهای مدل زبانی بزرگ (LLM)، جمینای ۳ میتواند از طرف کاربر عمل کرده و جریانهای کاری (Workflows) پیچیده و چندمرحلهای را از ابتدا تا انتها مدیریت کند. این اقدامات شامل وظایفی مانند “رزرو خدمات محلی” (مثل رزرو وقت دندانپزشکی یا یک میز در رستوران سنتی)، سازماندهی صندوق ورودی ایمیل (Inbox) یا برنامه نویسی خودکارسازی وظایف شخصی میشود؛ تمامی این فرآیندها به صورت هوشمندانه و تحت کنترل و راهنمایی مستقیم کاربر انجام خواهد شد.
مشترکین Google AI Ultra این امکان را دارند که از زمان عرضه مدل جدید گوگل، این قابلیتهای “هوش مصنوعی عاملمحور را از طریق Gemini Agent در اپلیکیشن جمینای تجربه نمایند. شرکت هوش مصنوعی گوگل با بهبود مستمر قابلیتهای هوش مصنوعی عاملی در جمینای ۳، بینشهای ارزشمندی کسب کرده و مشتاق است تا کاربردهای خلاقانهای را که کاربران با این فناوری خلق میکنند، مشاهده نماید؛ چرا که این قابلیتها به زودی به طیف وسیعتری از محصولات هوش مصنوعی گوگل گسترش خواهد یافت.
ساخت مسئولانه Gemini 3: پروتکلهای ایمنی، تزریق پرامپت و حملات سایبری
مدل جمینای ۳ (Gemini 3) در زمان عرضه، ایمنترین مدل زبانی بزرگ (LLM) توسعه یافته توسط هوش مصنوعی گوگل محسوب میشود و جامعترین مجموعهای از ارزیابیهای “ایمنی هوش مصنوعی (AI Safety Assessments)” را پشت سر گذاشته است. این مدل، در مقایسه با مدلهای پیشین، تمایل کمتری به رفتارهای متملقانه (Sycophancy) نشان میدهد و مقاومت بیشتری در برابر حملات متداول امنیتی مانند “تزریق پرامپت (Prompt Injection)” دارد. علاوه بر این، جمینای ۳ با بهرهگیری از استدلال پیشرفته، حفاظت بهبودیافتهای را در برابر سوءاستفادههای بالقوه از طریق “حملات سایبری (Cyberattacks)” یا سایر روشهای مخرب ارائه مینماید. این اقدامات نشاندهنده تعهد شرکت به توسعه مسئولانه هوش مصنوعی عاملی است.
در راستای تضمین ایمنی هوش مصنوعی، شرکت هوش مصنوعی گوگل علاوه بر انجام آزمایشهای داخلی گسترده بر روی حوزههای حیاتی مشخص شده در “چارچوب ایمنی پیشرفته (Frontier Safety Framework)”، همکاریهای نزدیکی را با کارشناسان برجسته جهانی در زمینههای تخصصی آغاز کرده است. این رویکرد شامل فراهم آوردن “دسترسی زودهنگام (Early Access)” به مدل جمینای ۳ برای نهادهای معتبری مانند UK AISI (سازمان ایمنی هوش مصنوعی بریتانیا) و همچنین دریافت ارزیابیهای مستقل از کارشناسان برجسته صنعت همچون Apollo، Vaultis، Dreadnode و سایرین بوده است. برای کسب اطلاعات جامعتر و فنیتر در خصوص پروتکلهای ایمنی و ارزیابیهای انجام شده، میتوان به سند فنی مرتبط با جمینای ۳ (Gemini 3 Model Card) مراجعه نمود.
دورنمای عصر Gemini 3: نقشه راه عرضه و کانالهای دسترسی توسعهدهندگان و مشترکین Ultra
معرفی رسمی جمینای ۳ (Gemini 3) تنها نقطه آغازین دورنمای عصر Gemini 3 تلقی میشود. شرکت هوش مصنوعی گوگل در حال اجرای نقشه راه عرضه دقیق برای فراهمسازی دسترسی گسترده به این مدل زبانی بزرگ (LLM) و قابلیتهای استدلال پیشرفته آن است. از امروز، عرضه اولیه جمینای ۳ آغاز شده و کاربران میتوانند از طریق کانالهای دسترسی مشخصی با این نسل جدید از هوش مصنوعی تعامل برقرار کنند.
- کاربران نهایی: برای عموم کاربران، این مدل در اپلیکیشن جمینای در دسترس قرار دارد. همچنین، مشترکین سرویسهای Google AI Pro و Google AI Ultra میتوانند از قابلیتهای استدلال پیشرفته مدل جمینای ۳ در حالت هوش مصنوعی (AI Mode) جستجوی (Search) استفاده نمایند.
- توسعهدهندگان: کانالهای دسترسی برای جامعه توسعهدهندگان از طریق API مدل جمینای ۳ در AI Studio، پلتفرم جدید توسعه هوش مصنوعی عاملی با نام Google Antigravity و ابزار خط فرمان Gemini CLI میسر شده است. این دسترسیها برای توسعه نرمافزار با هوش مصنوعی حیاتی هستند.
- سازمانها و شرکتها: برای نهادهای تجاری بزرگ (Enterprises)، دسترسی به جمینای ۳ از طریق پلتفرمهای ابری Vertex AI و Gemini Enterprise فراهم شده است.
در خصوص حالت جمینای ۳ تفکر عمیق (Gemini 3 Deep Think، حالت ویژه استدلال پیشرفته)، شرکت هوش مصنوعی گوگل زمان بیشتری را به ارزیابیهای ایمنی دقیق و اخذ نظرات تخصصی از تستکنندگان ایمنی اختصاص داده است. پس از تکمیل این فرآیندها، پیشبینی میشود که این قابلیت در هفتههای آتی برای مشترکین رده بالای Google AI Ultra در دسترس قرار گیرد تا اطمینان حاصل شود که توسعه این مدل زبانی بزرگ (LLM) به صورت مسئولانه و ایمن انجام پذیرفته است.
شرکت هوش مصنوعی گوگل برنامهریزی کرده است تا در آیندهای نزدیک، مدلهای دیگری از سری جمینای ۳ (Gemini 3) را نیز منتشر نماید تا کاربران بتوانند از طریق این مدلهای هوش مصنوعی عاملی و هوش مصنوعی چندوجهی وظایف و پروژههای پیچیدهتری را به انجام برسانند. تیم گوگل مشتاقانه منتظر دریافت بازخورد جامعه کاربران و مشاهده نوآوریهایی هستند که با استفاده از قابلیتهای جمینای ۳ در زمینههای یادگیری، توسعه نرمافزار با هوش مصنوعی و برنامه نویسی، خلق خواهد شد.
جمع بندی
سفری که در این مقاله به دنیای مدل Gemini 3 گوگل داشتیم، بیش از یک گزارش فنی، تصویری از اوجگیری مهندسی هوش مصنوعی را به نمایش گذاشت. همانطور که مشهود بود، این مدل نه یک تکرار، بلکه یک جهش بنیادین است که با توانایی استدلال پیشرفته در سطح دکترا و هوش مصنوعی چندوجهی، فراتر از انتظارات در صدر بنچمارکهای مرجع قرار گرفته است. در حقیقت، حالت تخصصی Gemini 3 Deep Think نشاندهنده آن است که هوش مصنوعی امروز چگونه میتواند پیچیدهترین مسائل علمی و مفاهیم بنیادین را با عمق و ظرافتی بیسابقه تحلیل کند و بهعنوان یک شریک فکری، مرزهای دانش را به چالش بکشد. این سطح از هوشمندی، رسالت گوگل را برای حرکت در مسیر هوش عمومی مصنوعی (AGI) به وضوح ترسیم میکند.
اما تأثیرگذاری اصلی این انقلاب، در اعطای آزادی عمل به نوآور و توسعهدهنده نهفته است. با ظهور پلتفرم Google Antigravity و قابلیتهای هوش مصنوعی عاملمحور (Agentic AI)، توسعه نرمافزار از یک فرآیند کدنویسی خطی، به یک سیستم خودکار و وظیفهمحور تبدیل شده است. این رویکرد، که بر توانمندی و استقلال فاعل (Agent-First) تأکید دارد، به کاربران این امکان را میدهد که از قید پیچیدگیهای فنی رها شده و صرفاً بر روی ایده و اهداف خود تمرکز کنند. جمینای ۳ نویدبخش عصری است که در آن، هر فرد صاحب ایده، صرف نظر از موانع فنی، با استفاده از ابزارهایی هوشمند و مستقل، قدرت خلق و برنامهریزی برای افقهای طولانیتر را در اختیار دارد؛ عصری که در آن، تکنولوژی نه یک محدودیت، بلکه نیروی محرکه آزادی و بهرهوری فردی است.
سوالات متداول
جمینای ۳ هوشمندترین مدل زبان بزرگ (LLM) گوگل است. تفاوت اصلی آن در جهشهای بیسابقه در قابلیت استدلال پیشرفته، درک چندوجهی بومی (Multimodal) و تواناییهای عاملمحور (Agentic AI) است که آن را از نسخههای قبلی متمایز میکند.
Deep Think حالت استدلال پیشرفته جمینای ۳ است که مرزهای هوش را فراتر برده و برای حل مسائل فوقالعاده پیچیده و چالشهای علمی طراحی شده است. این حالت در بنچمارکهای دشواری مانند GPQA و Humanity’s Last Exam عملکردی استثنایی دارد.
Google Antigravity پلتفرم توسعه عاملیتمحور (Agent-First) جدید گوگل است. این پلتفرم از قدرت جمینای ۳ استفاده میکند تا عاملهای هوشمند بتوانند به صورت خودمختار وظایف پیچیده نرمافزاری (کدنویسی، کنترل ترمینال و مرورگر) را اجرا و اعتبارسنجی کنند.
بله. این مدل در بنچمارکهای تخصصی مانند «Humanity’s Last Exam» و «GPQA Diamond» امتیازاتی کسب کرده که نشاندهنده توانایی استدلال پیشرفته در سطح تحصیلات تکمیلی و دکترا در حل مسائل علمی و منطقی است.
این قابلیتها برای توسعهدهندگان از طریق پلتفرم Google Antigravity و Gemini API در AI Studio و Vertex AI در دسترس هستند. همچنین مشترکین Google AI Ultra میتوانند این قابلیتهای برنامهریزی طولانیمدت را در اپلیکیشن Gemini امتحان کنند.
این قابلیت به عاملهای هوشمند جمینای ۳ اجازه میدهد تا وظایف چندمرحلهای و پیچیده را در طول زمان (افق طولانی) بدون انحراف از هدف، برنامهریزی و مدیریت کنند، مانند رزرو خدمات یا سازماندهی صندوق ورودی (Inbox).
اگر محتوای ما برایتان جذاب بود و چیزی از آن آموختید، لطفاً لحظهای وقت بگذارید و این چند خط را بخوانید:
ما گروهی کوچک و مستقل از دوستداران علم و فناوری هستیم که تنها با حمایتهای شما میتوانیم به راه خود ادامه دهیم. اگر محتوای ما را مفید یافتید و مایلید از ما حمایت کنید، سادهترین و مستقیمترین راه، کمک مالی از طریق لینک دونیت در پایین صفحه است.
اما اگر به هر دلیلی امکان حمایت مالی ندارید، همراهی شما به شکلهای دیگر هم برای ما ارزشمند است. با معرفی ما به دوستانتان، لایک، کامنت یا هر نوع تعامل دیگر، میتوانید در این مسیر کنار ما باشید و یاریمان کنید. ❤️









