در رویداد DevDay که اخیراً توسط OpenAI برگزار شد، این شرکت بهروزترین قابلیتهای خود را برای توسعهدهندگان و علاقهمندان به هوش مصنوعی معرفی کرد. کداکسپلور، به عنوان مرجعی برای تازهترین اخبار دنیای تکنولوژی، این ویژگیها را از دیدگاه علمی و کاربردی بررسی میکند. این مقاله به قابلیتهای جدید OpenAI، از جمله API Realtime، ذخیرهسازی پرسشها و توانمندیهای جدید پردازش تصاویر میپردازد.
OpenAI در DevDay، API Realtime و قابلیتهای جدید OpenAI مانند ذخیرهسازی پرسشها و پردازش تصویر را برای تجربههای تعاملی و بهینهتر معرفی کرد.
قابلیتهای جدید OpenAi در رویداد DevDay برای API Realtime در ذخیره سازی پرسشها و پردازش تصویر معرفی شد.
معرفی Realtime API: تجربهای سریع و طبیعیتر
یکی از مهمترین اعلامیههای DevDay، معرفی Realtime API بود. این API که هماکنون بهصورت نسخهی بتا در دسترس است، توسعهدهندگان را قادر میسازد تا تجربههای تعاملی کملَتِنسی و چندرسانهای بسازند. بهعنوان مثال، برنامهی Healthify از این API برای ایجاد مکالمات طبیعی با مربی هوشمند خود بهره برده و همچنین، Speak با کمک این قابلیت، امکان تمرین مکالمه زبان را برای کاربران فراهم کرده است. این API با شش صدای پیشفرض در حالت پیشرفته صوتی ChatGPT سازگار است و از ورودی و خروجی صوتی نیز پشتیبانی میکند.
ذخیرهسازی پرسشها (Prompt Caching): کاهش هزینه و افزایش سرعت
یکی دیگر از قابلیتهای مهم، ذخیرهسازی پرسشها یا همان Prompt Caching است. این ویژگی به توسعهدهندگان این امکان را میدهد تا ورودیهای اخیر خود را ذخیره کرده و از آنها با هزینهای ۵۰ درصد کمتر نسبت به توکنهای بدون کش استفاده کنند. این امکان بهطور پیشفرض در نسخههای جدید GPT-4o، GPT-4o mini، o1-preview و o1-mini فعال است. این ویژگی برای کاربردهایی که نیاز به پاسخهای تکراری دارند، میتواند صرفهجویی چشمگیری داشته باشد.
بیشتر بخوانید: Prompt Caching چیست؟
تقویت پردازش تصویر و تنظیمات دقیق
قابلیت تنظیم دقیق تصاویر در GPT-4o یکی از دیگر امکانات جدید است که در این رویداد معرفی شد. این ویژگی امکان شخصیسازی مدل برای درک دقیقتر تصاویر را فراهم میکند. کاربردهای این ویژگی شامل جستجوی تصویری پیشرفته، تشخیص بهینهتر اشیا در وسایل خودران و تحلیل دقیقتر تصاویر پزشکی است. OpenAI تا پایان ماه جاری یک میلیون توکن رایگان روزانه برای این قابلیت ارائه میکند که فرصتی مناسب برای توسعهدهندگان است تا از آن بهرهمند شوند.
Distillation مدلها: کاهش هزینهها و بهبود مدلهای کوچکتر
در نهایت، ویژگی Distillation مدلها معرفی شد که به توسعهدهندگان امکان میدهد خروجی مدلهای پیشرفتهتر را بهعنوان داده آموزشی برای بهبود مدلهای کوچکتر و کمهزینهتر استفاده کنند. بهعنوان نمونه، خروجیهای GPT-4o یا o1-preview میتوانند به بهبود GPT-4o mini کمک کنند.
بیشتر بدانید
در یادگیری ماشین، استخراج دانش یا تقطیر مدل فرآیندی است که در آن دانش از یک مدل بزرگ به یک مدل کوچکتر منتقل میشود. در حالی که مدلهای بزرگ (مانند شبکههای عصبی بسیار عمیق یا مجموعهای از چندین مدل) ظرفیت دانش بیشتری دارند، این ظرفیت ممکن است بهطور کامل مورد استفاده قرار نگیرد.
نتیجهگیری
قابلیتهای جدید معرفیشده در DevDay، مجموعهای از ابزارهای پیشرفته و کمهزینه را برای توسعهدهندگان فراهم میآورد که میتوانند تجربههای تعاملی و بهینهتری را در نرمافزارهای خود پیاده کنند. این امکانات به توسعهدهندگان این فرصت را میدهد تا از امکانات پیشرفتهتر و بهینهتری بهرهمند شوند و به خلق تجربههای هوشمند و شخصیسازی شده برای کاربران بپردازند.
با توجه به این قابلیتهای جدید، نظر شما درباره استفاده از Realtime API و ذخیرهسازی پرسشها چیست؟ آیا فکر میکنید این امکانات میتوانند در پروژههای شما مفید باشند؟ تجربیات و نظرات خود را با ما و دیگر کاربران به اشتراک بگذارید.
منبع: sdtimes