فناوری تشخیص چهره یکی از قابلیتهای پیشرفته سیستمهای مدرن است که از هوش مصنوعی استفاده میکند و میتواند بحثبرانگیز باشد.
از زمان ظهور کامپیوترها فناوریهای متعددی بهوجود آمدهاند که تأثیراتی زیادی بر زندگی ما گذاشتهاند. یکی از این فناوریها تشخیص چهره است که با ایجاد نقشهای از چهره به تحلیل و احراز هویت افراد میپردازد و میتواند کاربردهای مختلفی داشته باشد. در این مطلب با این فناوری جذاب و البته بحثبرانگیز آشنا میشویم.
بسیاری از ما اولینبار با فناوری تشخیص چهره در فیلمهای علمی-تخیلی آشنا شدیم؛ جایی که یک لیزر روی صورت بازیگر میافتاد و ظاهراً میتوانست هویت او را تشخیص دهد. اما اکثر فیلمها بهدرستی این فناوری را به نمایش درنیاوردهاند. درواقع سیستمهای تشخیص چهره گوناگون به روشهای مختلفی کار میکنند و هر کدام معمولاً الگوریتمهای خاص خودشان را دارند. اما پیش از اینکه ببینیم این فناوری چگونه کار میکند، ابتدا بگذارید ببینیم تشخیص چهره چیست.
تشخیص چهره فناوری نسبتاً جدیدی است که امروزه رواج زیادی پیدا کرده. از پلتفرمهای شبکههای اجتماعی گرفته که میتوانند چهره شما را در تصاویر تشخیص دهند، تا موبایلهایی که میتوانند با شناسایی چهره، قفل دستگاهتان را باز کنند، همگی از یک فناوری کلی استفاده میکنند.
فناوری تشخیص چهره یک ابزار بیومتریک است که ویژگیهای چهره کاربر را آنالیز میکند و با مطابقتدادن اطلاعات دریافتی با اطلاعات موجود در پایگاه داده خود میتواند هویت یک فرد را تشخیص دهد. نرمافزارهای تشخیص چهره برای اسکن چهرهها و مقایسه اطلاعات ورودی و اطلاعات پایگاههای داده خود از هوش مصنوعی و یادگیری ماشینی بهره میبرند.
اگرچه این فناوری در ابتدا عمدتاً در سازمانهای دولتی برای شناسایی مجرمان استفاده میشد، اما حالا محصولات مصرفی هم به آن مجهز شدهاند. نیاز بازار مصرفی به این فناوری باعث شده است که شرکتهای فناوری حالا درزمینه توسعه این فناوریها پیشگام باشند و حتی گاهی اوقات محدودیتهایی را درباره استفاده دولتی از فناوریهای خود اعمال کردهاند.
فرایند تشخیص چهره را میتوان بهطور خلاصه در سه عملکرد پایهای تعریف کرد:
حالا که از کلیت عملکرد این فناوری آگاه شدید، بگذارید دقیقتر به شیوه عملکرد سیستمهای تشخیص چهره بپردازیم. این سیستمها در وهله اول باید یاد بگیرند که یک چهره چیست. این کار میتواند با تمرین یک الگوریتم روی شمار زیادی تصویر از چهرهها در موقعیتهای شناختهشده انجام بگیرد. هر بار که تصویری به الگوریتم داده میشود، نرمافزار تخمین میزند که صورت شخص در کجای قاب تصویر قرار دارد.
این شبکه عصبی در ابتدا عملکرد نامطلوبی دارد، اما با انجام تمرینات متعدد، بهتر میشود و درنهایت میتواند موقعیت چهرهها را پیدا کند. کامپیوتر در ادامه معمولاً با استفاده از یک شبکه عصبی ثانویه یاد میگیرد که چگونه باید متوجه تفاوت میان یک چهره با یک چهره دیگر شود. بعضی از الگوریتمها بهصورت مستقیم از اجزای صورت نقشهبرداری میکنند، اما بعضیها با استفاده از ویژگیهای انتزاعیتر نقشه خود را از چهره میسازند. درنهایت شبکه عصبی برای هر چهره یک وکتور بهدست میآورد که درواقع رشتهای از اعداد است که میتواند بهطور یکتا صورت یک فرد را در میان سایر صورتهای موجود در نمونه تمرینی شناسایی کند.
در سیستمهای زنده، نرمافزار در لحظه روی کلیپهای ویدیویی کار میکند. به عبارت دیگر، کامپیوتر فریمهای ویدیو را که معمولاً از مناطق پرجمعیت تهیه میشوند، اسکن میکند. آنگاه ابتدا چهرههای موجود در هر فریم را تشخیص میدهد، سپس وکتور هر کدام را بهدست میآورد. درنهایت این وکتور با دادههای موجود در پایگاه داده مقایسه میشود. سپس هر تطابقی که به آستانه مطلوب رسیده باشد، ردهبندی و نمایش داده میشود. این آستانه در نیروی پلیس بریتانیا تطابق 60 درصدی است، اما میتوان آن را بالاتر برد تا احتمال تشخیصهای اشتباه پایین بیاید.
بهترین سیستمهای موجود در این حوزه بسیار خوب عمل میکنند. آزمایشهای مستقلی که توسط مؤسسه ملی استانداردها و فناوری آمریکا (Nist) انجام گرفته است، نشان میدهد که در حد فاصل سالهای 2014 تا 2018، سیستمهای تشخیص چهره در پیداکردن چهره افراد در پایگاه دادهای از 12 میلیون تصویر پرتره، حدود 20 برابر بهتر شدهاند.
نرخ خطای این سیستمها هم بهلطف پیشرفت شبکههای عصبی عمیق در همین بازه زمانی از 4 درصد به 0.2 درصد رسیده است. اما این عملکرد خیرهکننده تا حد زیادی به شرایط ایدهآل بستگی دارد؛ یعنی تصویر فرد باید واضح و شفاف باشد و با پایگاه دادهای از تصاویر واضح و شفاف مقایسه شود.
در جهان واقعی تصاویر میتوانند تار، بیکیفیت یا کمنور باشند. چهره فرد ممکن است با دوربین زاویه داشته باشد یا سن او نسبت به تصویر موجود در پایگاه داده افزایش قابلتوجهی پیدا کرده باشد. همه این عوامل در کنار کیفیت الگوریتمهای تشخیص چهره میتوانند بر قدرت عمل این سیستمها اثر بگذارند.
ریشههای این فناوری در دهه 1960 میلادی بهوجود آمد؛ زمانی که «وودرو ویلسون بلدسو» سیستمی را برای دستهبندی تصویر چهرهها توسعه داد. این سیستم میتوانست چهرههای ناشناخته را با عکسهای موجود در پایگاه داده خود مقایسه کند. این نرمافزار با نمونههای امروزی تفاوتهای زیادی داشت، اما ایده تقریباً مشابهی را دنبال میکرد.
در سال 1967، دولت آمریکا ظاهراً به این فناوری علاقهمند شده بود و زمزمههایی از سرمایهگذاری روی نرمافزار بلدسو به گوش میرسید تا برنامهای برای تطابق تصاویر توسعه داده شود. بااینحال، نتیجه تلاشهای بلدسو هرگز منتشر نشد.
در طول دهههای 70، 80 و 90 میلادی، سیستمهای بیشتری سعی کردند در مسیر تولید نرمافزارهای تشخیص چهره گام بردارند. برخی از این برنامهها توانایی این فناوری در تشخیص موقعیت چهرهها و بعد شناسایی ویژگی هر چهره را بهبود دادند تا زمینهساز جهش فناوریهای مدرن امروزی شوند.
اولین جهش فناوری تشخیص چهره برای ورود به جریان عمومی آمریکا همزمان با یک جنجال بزرگ اتفاق افتاد. در سال 2001، نیروی پلیس ایالاتمتحده از این فناوری برای نظارت بر بازی Super Bowl استفاده کرد و این تصمیم با انتقادات گستردهای روبهرو شد. منتقدان باور داشتند که پلیس حقوق شهروندان در متمم چهارم قانون اساسی آمریکا را زیر پا گذاشته و بدون دلیل موجه درخصوص افراد تحقیق و تفحص انجام داده است.
حدود یک دهه بعد، توان کامپیوترها به سطحی رسید که سیستمهای تشخیص چهره بتوانند با شبکههای عصبی قدرتمند آموزش ببینند و اوضاع متحول شد. فیسبوک خیلی زود در سال 2014 بهطور عمومی اعلام کرد که از نرمافزار DeepFace برای تشخیص چهره کاربران در عکسها استفاده میکند.
این فناوری اولینبار در سال 2015 با نرمافزارهایی مثل Windows Hello و Trusted Face در اندروید وارد دستگاههای مصرفی شد. کمی بعد، اپل هم در سال 2017 این فناوری را به آیفون X آورد تا رفتهرفته اکثر گوشیها به این ویژگی مجهز شوند.
طرفداران این فناوری میگویند تشخیص چهره کار بسیاری از مردم را راحتتر کرده است. این سیستمها میتوانند برای قفلگشایی گوشی و لپتاپ، انجام پرداختها، دستهبندی تصاویر، عبور از گیتهای فرودگاهها و ورزشگاهها و موارد اینچنینی استفاده شوند.
از سوی دیگر، برخی از دیگر طرفداران این فناوری به استفاده از این قابلیت برای تشخیص مجرمان اشاره دارند. این مسئله بهویژه در رویدادهای بزرگ و شلوغ میتواند ریسک بروز حادثههای تروریستی را کاهش دهد. سازمانهای دولتی در سراسر جهان در سالهای اخیر تلاش زیادی برای پیادهسازی این روشها انجام دادهاند و از چین میتوان بهعنوان بزرگترین نمونه مصرفکننده این سیستمها برای نظارت بر شهروندان نام برد.
بااینوجود، مخالفان تشخیص چهره میگویند وزنه مزایای این فناوری نسبت به معایب آن سنگینتر نیست. آنها باور دارند که این سیستمها میتوانند حریم خصوصی شهروندان را نقض کنند و نمیتوان به افرادی که کنترلکننده این نرمافزارها هستند، اعتماد داشت.
از سوی دیگر، بروز خطا در سیستمهای تشخیص چهره همچنان بیشتر از آن است که بتوان به این فناوری تکیه کرد. این سیستمها هنوز اشتباهات زیادی دارند و گاهی اوقات افراد بیگناه را به اشتباه بهجای افراد مجرم تشخیص میدهند یا با سوگیریهایی که در دادههای دریافتی خود دارند، میتوانند دچار خطاهای بزرگی شوند.
همچنین منتقدان باور دارند که راهی برای ارزیابی عملکرد سیستمهای تشخیص چهره دولتی توسط مردم وجود ندارد و این الگوریتمها اغلب انحصاری هستند و به محققان اجازه داده نمیشود تا صحت عملکرد آنها را بررسی کنند.
خیلی از شرکتهای فناوری دائماً مشغول بهینهسازی سیستمهای خود هستند تا ضمن بهبود دقت آنها، سرعت عملشان را افزایش دهند. این شرکتها تلاش دارند تا این فناوری حتی بتواند در محیطهای تاریک و از روی زاویههای نامناسب، چهره کاربران را تشخیص دهد.
بااینحال، کارشناسان باور دارند که برای استفاده صحیح از این فناوری باید قوانین روشن و مناسبی وجود داشته باشد. این مسئله چه در بُعد شرکتی، چه در بُعد دولتی و چه در بُعد شخصی باید با قانونهای عادلانه مشخص شود تا امکان سوءاستفاده از آن وجود نداشته باشد و همه بتوانند بهشکلی یکسان از مزایای این سیستمها بهرهمند شوند.
پاسخ ها