گوگل بهتازگی از قابلیت Gemini Live برای کاربران Gemini Advanced رونمایی کرده است. این ویژگی، که بهعنوان رقیبی برای Advanced Voice Mode چتجیپیتی OpenAI معرفی شده است، به کاربران اجازه میدهد چتهای صوتی در لحظه و کاملاً طبیعی را با هوش مصنوعی داشته باشند.
Gemini Live میتواند با صدای طبیعی صحبت کند، به مکالمات طولانی پاسخ دهد و حتی در حین مکالمه قطع شود و مجدداً ادامه دهد. این ویژگی بر پایه مدلهای Gemini 1.5 Pro و 1.5 Flash ساخته شده و نسبت به ChatGPT، حافظه طولانیتری برای نگهداشتن اطلاعات مکالمات گذشته دارد.
اما آیا این ویژگی جدید، تجربه مکالمه با AI را متحول میکند؟ آیا Gemini Live نسبت به چتجیپیتی مزیت رقابتی دارد؟ در این مقاله از کداکسپلور ، تمام جزئیات آن را بررسی میکنیم.
آنچه در این مقاله میخوانید:
- Gemini Live چیست و چه قابلیتهایی دارد؟
- مقایسه Gemini Live با Advanced Voice Mode چتجیپیتی
- نقاط قوت و ضعف Gemini Live
- ویژگیهای آینده: پردازش چندرسانهای و ادغام با Google Services
- آیا Gemini Live ارزش پرداخت ماهانه ۲۰ دلاری را دارد؟

Gemini Live چیست و چه قابلیتهایی دارد؟
Google Gemini Live یک ویژگی جدید در اپلیکیشن Gemini است که به کاربران اجازه میدهد با مدلهای پیشرفته Gemini بهصورت صوتی مکالمه کنند. برخی از ویژگیهای کلیدی آن عبارتاند از:
✅ ۱۰ صدای طبیعی برای پاسخگویی
✅ درک گفتار در لحظه و واکنش به مکالمات متقاطع (Interruptions)
✅ ادامه مکالمه حتی زمانی که گوشی قفل باشد یا در پسزمینه اجرا شود
✅ حافظه طولانیتر نسبت به چتجیپیتی برای حفظ تاریخچه مکالمات
✅ یکپارچگی با Google Services مانند Calendar، Keep، Gmail و YouTube Music
همچنین بخوانید : Google Gemini Code Assist: رایگان و ۹۰ برابر سریعتر از GitHub Copilot
💡 مثالهای استفاده:
🔹 تمرین مصاحبه شغلی: Gemini Live میتواند با شبیهسازی مصاحبه، پیشنهادهایی برای بهبود مهارتهای گفتاری ارائه دهد.
🔹 برنامهریزی روزانه: میتوانید به Gemini Live بگویید: “هفته آینده جلسهای دارم، میتوانی یادآوری کنی؟” و آن را در Google Calendar ثبت کند.
🔹 تعامل با موسیقی و محتوا: “لیستی از آهنگهای نوستالژیک دهه ۹۰ برایم بساز!”
مقایسه Gemini Live با Advanced Voice Mode چتجیپیتی
با ورود Gemini Live، بسیاری از کاربران به دنبال مقایسه آن با Advanced Voice Mode چتجیپیتی هستند. در جدول زیر، برتریها و نقاط ضعف هر دو سیستم را بررسی میکنیم:
ویژگیها | Gemini Live (Google) | ChatGPT Advanced Voice Mode (OpenAI) |
---|---|---|
صدای طبیعی و احساسی | ✅ ۱۰ صدای طبیعی و احساسی | ✅ صدای طبیعی اما محدودتر |
پاسخگویی بلادرنگ | ✅ سریع و روان | ❌ کندتر و نیازمند پردازش بیشتر |
حافظه مکالمات طولانی | ✅ حافظه بیشتر با استفاده از Gemini 1.5 Pro | ❌ حافظه مکالمات کوتاهتر |
امکان مکالمه هنگام قفل بودن گوشی | ✅ بله | ❌ خیر |
پشتیبانی از چند زبان | ❌ فقط انگلیسی (در آینده گسترش مییابد) | ✅ پشتیبانی از چندین زبان |
پردازش چندرسانهای (Multimodal Input) | ❌ هنوز فعال نشده (انتظار میرود در اواخر ۲۰۲۵ اضافه شود) | ✅ پشتیبانی محدود از تصاویر و ویدئوها |
ادغام با اپلیکیشنها | ✅ Google Keep، Calendar، Tasks، YouTube Music | ❌ محدود به ChatGPT |
📌 نتیجه:
- Gemini Live در مکالمات صوتی بلادرنگ عملکرد بهتری دارد و تعامل روانتری ارائه میدهد.
- ChatGPT در پردازش تصاویر و تعامل چندزبانه قویتر است.
- حافظه طولانیتر Gemini Live میتواند برای مکالمات بلندمدت یک مزیت کلیدی باشد.
ویژگیهای آینده: پردازش چندرسانهای و ادغام با Google Services
Google اعلام کرده است که در آینده ویژگیهای زیر به Gemini Live اضافه خواهند شد:
🔜 پردازش چندرسانهای (Multimodal Input):
- Gemini Live در آینده میتواند تصاویر و ویدئوهای گرفتهشده توسط دوربین گوشی را پردازش کند.
- مثال: گرفتن عکس از یک دوچرخه خراب و درخواست راهنمایی تعمیر از Gemini Live.
🔜 ادغام عمیقتر با Google Services:
- افزودن قابلیت کنترل روی تایمرها، موسیقی، بلوتوث و Wi-Fi از طریق دستورات صوتی.
- مثال: “چراغ قوه را روشن کن!” یا “آهنگهای آرامشبخش برای خواب پخش کن.”
📌 زمان انتشار این ویژگیها؟
- پردازش چندرسانهای: اواخر ۲۰۲۵
- پشتیبانی از زبانهای دیگر و نسخه iOS: نیمه دوم ۲۰۲۵
مقاله دیگر : لینک لیست LinkedList چیست؟
آیا Gemini Live ارزش پرداخت ماهانه ۲۰ دلاری را دارد؟
Gemini Live بخشی از پلن پولی Google One AI Premium (۲۰ دلار در ماه) است. اما آیا ارزش پرداخت دارد؟
✅ ارزش دارد اگر:
✔ نیاز به مکالمه صوتی طبیعی و سریع با هوش مصنوعی دارید.
✔ کاربر اکوسیستم Google Services هستید و میخواهید از Google Keep، Calendar و YouTube Music در مکالمات AI استفاده کنید.
✔ دنبال یک دستیار صوتی با حافظه بلندمدت هستید.
❌ ارزش ندارد اگر:
❌ بهدنبال قابلیتهای چندرسانهای (تصویری و ویدیویی) هستید.
❌ نیاز به پشتیبانی از زبانهای دیگر غیر از انگلیسی دارید.
❌ از ChatGPT و قابلیتهای فعلی آن راضی هستید.
نتیجهگیری:
Google با این معرفی تجربه مکالمه صوتی با AI را به سطح جدیدی رسانده است. این ویژگی، با ارائه گفتگوی روان، صدای طبیعی و حافظه بلندمدت، میتواند جایگزین بهتری برای کاربران Google نسبت به چتجیپیتی OpenAI باشد.
🚀 آیا Gemini Live میتواند انقلابی در مکالمات صوتی AI ایجاد کند؟ یا OpenAI همچنان پیشتاز خواهد بود؟ نظرات خود را با ما در میان بگذارید!
منبع : TechCrunch