مایکروسافت می گوید سیستم کپشن نویسی تصویرش، از انسان ها هم دقیق تر است

مایکروسافت امروز خبر داده تکنولوژی کپشن‌نویسی تصویرش که بر هوش مصنوعی متکی است، اکنون از طریق سرویس‌های ادراکی آژور (Azure Cognitive Services) در دسترس است. این کمپانی ضمنا مدعی شده که سیستم جدیدش می‌تواند با مهارتی مشابه انسان‌ها، تصاویر مختلف را توصیف کند.

این دستاورد جدید می‌تواند به توسعه‌دهندگان کمک کند تا دسترسی‌پذیری را در اپلیکیشن‌های خود بهبود ببخشند. با استفاده از کپشن‌نویسی مبتنی بر هوش مصنوعی، کاربران حالا می‌توانند محتویات مهم درون تصاویر موتورهای جستجو و تصاویر موجود در ارائه‌ها را مشاهده کنند. اما این شرکت غول حوزه تکنولوژی هشدار داده که گاهی از اوقات، نتایج آنقدرها هم بی‌نقص نخواهند بود.

مهم‌تر از همه این‌ها، صغیب شیخ، یکی از مهندسین نرم‌افزار در گروه پلتفرم هوش مصنوعی مایکروسافت، می‌گوید که این قابلیت به افرادی که مشکلات بینایی دارند کمک خواهد کرد تا از طریق کپشن‌های دقیق، از محتویات موجود در تصاویر وب و مستندات مختلف باخبر شوند. تیم او از این سیستم برای اپلیکیشن تصویربرداری Seeing AI نیز استفاده می‌کند که تصاویر را برای افراد نابینا یا دچار به کم‌بینی، توصیف می‌کند.

شیخ می‌گوید: «در حالت ایده‌آل، هرکسی باید برای تصاویر موجود در مستندات، در وب و در شبکه‌های اجتماعی را کپشن‌نویسی کند تا افراد نابینا هم به آن محتویات دسترسی داشته و در مباحثات شرکت کنند. اما همه چنین کاری نمی‌کنند. بنابراین چندین اپلیکیشن داریم که وقتی خبری از کپشن برای تصاویر نیست، همین کار را با قابلیت تشخیص تصویر به انجام می‌رسانند.

مایکروسافت مدعی شده که سیستم جدیدش تا دو برابر بهتر از هر مدل کپشن‌نویسی تصویری است که از سال ۲۰۱۵ تاکنون استفاده شده است. کمپانی ساکن ردموند می‌گوید هوش مصنوعی‌اش توانسته کپشن‌هایی برای تصاویر بنویسد که حتی از نمونه‌های نوشته شده توسط افراد واقعی «شفاف‌تر و دقیق‌تر» هستند.

ناگفته نماند که اواخر سال جاری میلادی، این تکنولوژی کپشن‌نویسی راهش را به دیگر سرویس‌های مایکروسافت مانند Word ،Outlook و پاورپوینت باز خواهد کرد. جالب است که برای این قابلیت منتظر بمانیم و ببینیم که در دنیای واقعی و غیر ایده‌آل چه عملکردی از خود به نمایش می‌گذارد.

دنیای دیجیتال🖥

مایکروسافت می گوید سیستم کپشن نویسی تصویرش، از انسان ها هم دقیق تر است

شاید خوشتان بیاید

پاسخ ها

دنیای دیجیتال🖥دنبال کردن

مایکروسافت می گوید سیستم کپشن نویسی تصویرش، از انسان ها هم دقیق تر است

شاید خوشتان بیاید

سیستم عامل Realme UI 7.0 با طراحی شیشه‌ای و پشتیبانی از آیفون و اپل واچ منتشر شد

موفقیت خیره‌کننده‌ی ChatGPT، مایکروسافت را در رقابت دستیارهای هوش مصنوعی عقب نگه می‌دارد

دکمه هوش مصنوعی به صفحه کلید مایکروسافت ویندوز اضافه شده است

پاسخ ها

دنیای دیجیتال🖥