وقتی چشم های خود را باز می کنید، بدون اینکه کاری انجام دهید، می توانید اشیا اطراف خود را تشخیص دهید. به طور مثال شما می توانید تشخیص دهید که جسم زیر پای شما یک فرش با رنگ های مختلف است و یا اینکه آن جسمی که رو بروی شما قرار دارد و شما می توانید با یک دستگیره آن را باز کنید، یک در است. اما آیا این توانایی که از ابتدای تولد در شما وجود داشته در یک رایانه و ربات هم وجود دارد؟ مسلما خیر!
بینایی ماشین چیست؟
بینایی ماشین یا توانایی دیدن و ادراک دنیای پیرامون توسط ماشین ها که می توانند خودرو، رایانه، ربات یا هر نوع ماشین دیگری باشد، بینایی ماشین نامیده می شود. ماشین ها همانند انسان ها و حیوانات توانایی دیدن اطراف خود را ندارند در نتیجه نیاز به تجهیزات مختلفی مانند حسگرها و دوربین های مختلف دارند تا دنیای بیرونی را تجزیه و تحلیل کنند و درکی مانند ادراک ما انسان ها از دنیای پیرامون خود به دست آورند.
بینایی ماشین (Machine vision یا Computer vision) یک فن آوری هوش مصنوعی است که به کامپیوترها امکان درک تصاویر و اشیا را می دهد. در واقع این فناوری سعی در انجام همان فرایندی را دارد که سیستم بینایی انسان انجام می دهد. در یک سیستم بینایی ماشین، تصویر مورد نظر، تجزیه و تحلیل می شود و اطلاعات مورد نیاز از آن استخراج می گردد و در اختیار ماشین قرار می گیرد.
امروزه ماشین هایی مختلفی توسعه پیدا کرده اند که توانایی تشخیص تصاویر را دارا می باشند. شرکت های بزرگ فن آوری مانند آمازون، گوگل، مایکروسافت و فیسبوک در حال سرمایه گذاری میلیاردها دلار در تحقیقات و توسعه محصولات مرتبط با بینایی ماشین هستند.
کاربردهای بینایی ماشین بی شمار و متنوع هستند. در این مقاله موردهای واقعی از بکارگیری بینایی ماشین در زندگی افراد مورد بررسی قرار گرفته اند.
خرده فروشی ها
تجربه مشتری: در خرده فروشی، از بینایی کامپیوتر برای تسویهحسابهای بدون صندوقدار استفاده میشود. در چنین فروشگاه هایی، دوربینها و ابزارهای هوش مصنوعی، اقلامی را که مشتریان برمیدارند تشخیص میدهند و بهطور خودکار هنگام خروج از فروشگاه، آن ها را شارژ میکنند.
مدیریت موجودی: به نظارت بر سطح موجودی، شناسایی اقلامی که در جای نادرستی قرار گرفته اند و شناسایی دزدی از فروشگاه کمک می کند.
مثال هایی از کاربرد بینایی ماشین در خرده فروشی ها
مدیریت موجودی اقلام در فروشگاه ها توسط Amazon Go
آمازون به تازگی Amazon Go را برای عموم مردم در دسترس قرار داده است. در فروشگاه های Amazon Go نیازی نیست خریداران در صف ها بایستند تا محصولات آن ها بررسی و هزینه پرداخت شود. این فروشگاه ها، مجهز به دوربین هایی با قابلیت بینایی ماشین هستند. ابتدا فقط کارمندان آمازون اجازه ی حضور در این فروشگاه ها را داشتند ولی از اوایل ۲۰۱۸ مردم هم می توانند وارد این فروشگاه ها شوند.
تکنولوژی مورد استفاده در این فروشگاه ها Walk Out نامیده می شود. همان طور که در ویدئوی یک دقیقه ای زیر مشاهده می کنید، خریداران قبل از ورود به فروشگاه باید برنامه ی موبایل خود را فعال کنند.
همان طور که در ویدئو مشخص است دوربین های مجهز به فناوری بینایی ماشین در سقف بالای راهرو و در قفسه ها قرار دارند. وب سایت شرکت ادعا می کند که این دوربین ها قابلیت تعیین زمانی که یک شی از قفسه برداشته می شود و هم چنین تشخیص فردی که شی را برمی دارد را دارند. اگر یک کالا به قفسه برگردانده شود، این سیستم قادر به حذف آن کالا از سبد مجازی مشتریان است. شبکه ی دوربین ها امکان ردیابی افراد در تمام زمان ها را فراهم می کند و اجناس خریداران را به درستی قبل از خروج آن ها از فروشگاه حساب می کند.
همان طور که از نام Walk Out پیداست، خریداران هر موقع که محصولات خود را انتخاب کردند، برای بیرون رفتن از فروشگاه آزاد هستند. پس از خروج از فروشگاه، برنامه یک رسید آنلاین برای آن ها ارسال کرده و هزینه محصولات را در حساب آمازون آن ها شارژ می کند.
در حالی که فروشگاه، فروشنده ها را حذف کرده است، نیویورک تایمز گزارش داده است که کارکنان فروشگاه هنوز هم برای چک کردن شناسه ها، پر کردن قفسه ها و کمک به خریداران برای پیدا کردن کالا ها و راهروها در دسترس هستند. یک نماینده آمازون تایید کرده است که کارمندان انسانی پشت صفحات نمایش در فروشگاه های Go کار می کنند تا به آموزش الگوریتم ها کمک کرده و اگر کالای خارج شده از قفسه ها اشتباها شناسایی شد، آن را تصحیح کنند.
آینه مجازی
آینه ی مجازی یکی دیگر از محصولاتی است که می تواند در فروشگاه های آنلاین و حتی فیزیکی مورد استفاده قرار بگیرد. فرض کنید که فردی قصد خرید لباسی را داشته باشد. این فرد بدون اینکه نیاز به تعویض چندین لباس داشته باشد می تواند به راحتی مقابل آینه ی مجازی قرار بگیرد و لباس های مورد نظرش را امتحان کند. با استفاده از فناوری بینایی ماشین لباس مورد نظر، روی بدن افراد قرار می گیرد. در ادامه یک ویدئوی دو دقیقه ای را مشاهده می کنید که مربوط به استفاده از کینکت در یک فروشگاه است که به عنوان یک آینه ی مجازی کار می کند. همان طور که در ویدئو نشان داده می شود شخص یک لباس مجازی به تن دارد. حرکات او دنبال می شود و با صدای خریدار رنگ لباس هم عوض می گردد.
تشخیص دزدی و کمبود اقلام در فروشگاه
StopLift ادعا می کند که یک سیستم بینایی ماشین توسعه داده که دزدی ها و دیگر کمبود ها را در فروشگاه های زنجیره ای کاهش می دهد. در واقع محصول این شرکت برای تامین امنیت خرده فروشی هاست. محصول شرکت که ScanItAll نام دارد سیستمی است که خطاهای فروشندگان و همچنین فروشندگانی که محصولات را اسکن نمی کنند را مشخص می کند. نام دیگر این محصول sweethearting است. sweethearting به معنای اسکن تقلبی یک محصول توسط فروشنده است. در sweethearting فروشنده برای مشتری خود که دوست، خانواده یا همکار او است، اجناسی را اسکن نمی کند.
تکنولوژی بینایی ماشین موجود در ScanItAll در دوربین های متصل به سقف و سیستم های POS فروشگاه های خواربار فروشی وجود دارد. نرم افزار از طریق دوربین، مشاهده می کند که آیا صندوقدار همه ی کالاها را اسکن می کند. اگر محصولی در POS اسکن نشود، با عنوان “گم شده” توسط نرم افزار برچسب می خورد. بعد از ثبت این مورد، نوبت مدیریت است که تدابیری را برای جلوگیری از موارد مشابه در آینده اتخاذ کند.
این شرکت ادعا می کند که ScanItAll می تواند رفتارهای متقلبانه مانند پوشاندن بارکد، انباشتن محصولات روی یک دیگر و اسکن نکردن کالا را شناسایی کند.
در ویدئوی زیر نشان داده می شود که چطور ScanItAll اقلامی را که در هنگام چک کردن توسط صندوقدار اسکن نمی شود را می توان شناسایی کرد.
در یک مطالعه ی موردی Piggly Wiggly نماینده ی شرکت Stop Lift ادعا کرده است که در دو فروشگاه خواربار فروشی از زمان استقرار این سیستم رفتار های sweethearting کاهش یافته است. همچنین خسارت ۱۰ هزار دلاری در ماه که به دلیل مشکلات در اسکن اقلام بوده، به هزار دلار در ماه کاهش یافته است. البته این خسارت بیشتر به دلیل خطاهای سهوی بوده تا اینکه به رفتارهای مشکوک فروشنده هنگام اسکن کالا ها مربوط شود.
خودرو و سیستم های حمل و نقل
طبق اظهارات سازمان بهداشت جهانی بیش از ۱.۲۵ میلیون نفر سالانه در تصادفات، جان خود را از دست می دهند. این سازمان پیش بینی کرده که اگر هیچ اقدام پایداری صورت نگیرد، تصادف هفتمین علت مرگ تا سال ۲۰۳۰ خواهد بود. تقریبا نیمی از تلفات جاده ای کاربران جاده ای آسیب پذیر هستند: عابران پیاده، دوچرخه سواران و موتورسواران. با توجه به این تحقیق، یک دلیل واضح برای اکثر این حوادث وجود دارد: خطا و بی توجهی انسان.
اتومبیل های خودران: سیستم های بینایی رایانه ای در وسایل نقلیه خودران به تشخیص علائم راهنمایی و رانندگی، عابران پیاده، سایر وسایل نقلیه و موانع کمک می کند. این فناوری برای ناوبری، جلوگیری از برخورد و رعایت قوانین راهنمایی و رانندگی حیاتی است.
مثال هایی از کاربرد بینایی ماشین در خودرو و سیستم های حمل و نقل
رانندگی ایمن
Waymo شرکتی است که ادعا می کند رانندگی را ایمن تر می کند. Waymo که قبلا به عنوان پروژه ی ماشین خودران شناخته می شد در حال کارکردن بر روی بهبود حمل و نقل مردم و ساخت ماشین های خودران است.
سایت این شرکت گزارش داده که ماشین های این شرکت مجهز به سنسور و نرم افزاری است که می تواند حرکات ۳۶۰ درجه ای پیاده ها، دوچرخه سوارها، ساخت و سازهای جاده ای و اشیا را تا فاصله ای به اندازه ی سه زمین فوتبال شناسایی کند. شرکت همچنین ادعا کرده است که این نرم افزار در ۷ میلیون مایل جاده مورد آزمایش قرار گرفته تا خودروهای خود را برای حضور در ترافیک های روزانه آموزش دهد.
همان طور که در ویدئوی پایین می بینید خودرو می تواند جریان ترافیک را دنبال و مقررات را پیروی و موانع را شناسایی کند. برای مثال، زمانی که دوچرخه سوار دست چپش را دراز می کند، نرم افزار حرکت دست را تشخیص می دهد و پیش بینی می کند که آن دوچرخه سوار به مسیر دیگری حرکت می کند. نرم افزار همچنین می تواند به وسیله نقلیه دستور دهد که کندتر حرکت کند تا دوچرخه سوار به طور ایمن از آنجا عبور کند.
این شرکت اعلام کرده که از شبکه های عمیق برای پیش بینی، برنامه ریزی، نقشه برداری و شبیه سازی برای آموزش وسایل نقلیه برای مانور در موقعیت های مختلف مانند مکان های ساخت و ساز، دادن راه به وسایل نقلیه اورژانسی، دادن فضا به ماشین ها برای پارک کردن و توقف برای عبور عابران پیاده استفاده می کند.
قطرات برف و باران می تواند نویز زیادی را در سنسور ماشین های خودران ایجاد کند. یادگیری ماشین به فیلتر کردن این نویز و تشخیص درست افراد پیاده، وسایل نقلیه و دیگر موارد کمک می کند.
شرکت دیگری که ماشین های خودران را توسعه داده تسلا است که ادعا می کند که تمامی خودروهای خودران آن توانایی رانندگی به صورت خودکار را دارند. هر وسیله نقلیه ی این شرکت، مجهز به هشت دوربین برای دید ۳۶۰ درجه ای در اطراف خودرو با فاصله کانونی ۲۵۰ متر در اطراف خود است. دوازده سنسور مافوق صوت، ماشین را قادر می سازند تا اشیا سخت و نرم را شناسایی کند. این شرکت ادعا می کند که یک رادار رو به جلو، خودرو را قادر می سازد تا در باران سنگین، مه، گرد و خاک و حتی خودروی جلویی را ببیند. سیستم دوربین آن که Tesla Vision نام دارد با ابزارهای پردازش تصویر کار می کند که شرکت تسلا اعلام کرده این سیستم روی یک شبکه عصبی عمیق ساخته شده و قادر به بازسازی محیطی است تا خودرو بتواند جاده های پیچیده را هدایت کند.
در ویدئوی سه دقیقه ای زیر مشاهده می کنید که یک خودرو بدون دست های راننده بر روی فرمان و پاهای او بر روی پدال در ساعات شلوغی ترافیک در حال حرکت است.
در مارس ۲۰۱۸ ماشین شرکت تسلا در یک تصادف مرگ بار شرکت داشته است در حالی که خودرو در حالت خودران در حال حرکت بوده است. با وجود هشدارهای داده شده، راننده دست هایش را روی فرمان قرار نداده است. در عرض شش ثانیه ای که دست ها روی فرمان نبوده با یک بتن برخورد کرده و راننده کشته می شود. بعداً مشخص می شود که نه راننده و نه خود ماشین ترمز را فعال نکردند.
پیشرفت های اخیر نرم افزاری که برای تسلا ایجاد شد، شامل هشدارهای بیشتر به رانندگان برای نگه داشتن دستان خود بر روی فرمان بود. براساس اعلام این شرکت، پس از سه هشدار، نرم افزار مانع حرکت بیشتر خودرو می شود، تا اینکه راننده دوباره خودرو را روشن نماید.
مراقبت های بهداشتی
در مراکز مراقبت های بهداشتی، بینایی ماشین به متخصصان کمک می کند تا به درستی شرایط یا بیماری ها را دسته بندی کنند. این امر می تواند با کاهش یا حذف تشخیص یا درمان نادرست iهمراه باشد و به نجات جان بیمار کمک کند.
تصویربرداری پزشکی: بینایی رایانه ای برای تجزیه و تحلیل تصاویر پزشکی (اشعه ایکس، ام آر آی، سی تی اسکن) برای تشخیص ناهنجاری هایی مانند تومورها، شکستگی ها و سایر شرایط استفاده می شود. این به تشخیص زودهنگام و برنامه ریزی درمان کمک می کند.
کمک جراحی: در طول جراحی ها، بینایی کامپیوتری می تواند در هدایت ابزارهای رباتیک با دقت بالا کمک کند.
مثال هایی از کاربرد بینایی ماشین در مراقبت های بهداشتی
نظارت بر خون از دست رفته
شرکت gauss surgical روش هایی برای نظارت بر از دست رفتن خون را توسعه داده که می تواند زمان از دست رفتن خون را در شرایط پزشکی به صورت بلادرنگ تخمین زند. این روش، انتقال خون را به حداکثر می رساند و همچنین خونریزی را بهتر از چشم انسان تشخیص می دهد.
خط تریتون شرکت Gauss Surgical برای نظارت بر خون از دست رفته، شامل تریتون اتاق جراحی است که از یک برنامه ی مبتنی بر iPad برای گرفتن تصاویری از خون در اسفنج های جراحی و محفظه های مکش استفاده می کند. این تصاویر توسط الگوریتم های بینایی ماشین برای تخمین مقدار خون از دست رفته پردازش می شود. شرکت ادعا می کند که این برنامه توسط مختصصان پزشکی در بیمارستان ها طی عملیات جراحی استفاده می شود.
ویدئوی ۶ دقیقه ای نشان می دهد که چگونه تصاویر اسفنج ها یا لباس هایی که خون را جذب می کنند گرفته شده و به عنوان یک اسکنر بلادرنگ کار می کند تا بتواند مقدار خون از دست رفته ی بیمار را تخمین بزند.
برای تعیین صحت و درستی برنامه تریتون اتاق جراحی، این برنامه در حین عملیات زایمان مورد مطالعه قرار گرفت و توسط سازمان غذا و داروی آمریکا درسال ۲۰۱۷ تایید شد.
Gauss Surgical در سال ۲۰۱۷ یک مطالعه برای بررسی میزان صحت تخمین مقدار خون از دست رفته در عمل سزارین انجام داد. با استفاده از بینایی ماشین مقدار خونه جذب شده در اسفنج ها و مخزن مکش برای ۵۰ بیمار در طی عمل سزارین اندازه گیری شد. وقتی نتایج با نتایج پزشک متخصص مقایسه شد مشخص شد نتایج برنامه بهتر بوده است.
تشخیص بیماری پوستی
DeepLens وب سرویسی از شرکت آمازون است. یکی از برنامه های مراقبت پزشکی که از DeepLens استفاده می کند DermLens است. DermLens هدفش کمک به بیمار برای مدیریت بیماری پوستی psoriasis است. این برنامه داده های گزارش شده را در دسترس تیم پزشکی قرار می دهد. ویدئوی ۴ دقیقه ای زیر نحوه ایجاد و استقرار یک پروژه شناسایی اشیا را با استفاده از کیت DeepLens به توسعه دهندگان آموزش می دهد.
توسعه دهندگان باید با نام کاربری و رمز عبور خود وارد سیستم مدیریت خدمات وب سایت آمازون شوند. پس از ورود، توسعه دهنده باید یک پروژه ی نمونه ی شناسایی اشیا را انتخاب می کند، توصیف پروژه و مقادیر دیگر را در فیلدهای مورد نظر وارد می کند. در ادامه می توان خروجی پروژه ی مورد نظر را روی صفحه ابزار خود مشاهده کرد.
ابزار بینایی ماشین، داده ها را به برنامه میفرستد و کاربر می تواند تخمین شدت بیماری را مشاهده کند. تیم DermLens یک برنامه موبایل برای گزارش علائم اضافی مانند خارش و خستگی را هم توسعه داده است.
در طی تحقیقی که این تیم در ژونال American Dermatology به ثبت رسانده، این شرکت ادعا کرده که DermLens در ۹۲ بیمار تست شده و ۷۲ درصد از بیماران اعلام کرده اند که ترجیح می دهند از دوربین های DermLens به جای گوشی های هوشمند استفاده کنند. مطالعه همچنین مشخص کرده که ۹۸ درصد از بیماران تحت مطالعه تمایل دارند در صورت در دسترس بودن این ابزار، تصاویر خود را با این ابزار به مراکز پزشکی ارسال کنند.
کشاورزی
برخی از مزارع به تدریج در حال استفاده از فن آوری بینایی ماشین برای بهبود عملیات خود هستند. این تکنولوژی ها با هدف کمک به کشاورزان برای اتخاذ روش های رشد کارآمدتر، افزایش بازدهی و در نهایت افزایش سود توسعه یافته است.
نظارت بر محصولات: پهپادها و روباتهای زمینی از بینایی کامپیوتری برای نظارت بر سلامت محصول، تشخیص بیماریها و بهینهسازی آبیاری و کوددهی استفاده میکنند.
برداشت: ماشین های برداشت خودکار از سیستم های بینایی ماشین برای شناسایی و چیدن میوه ها و سبزیجات رسیده استفاده می کنند.
مثال هایی از کاربرد بینایی ماشین در کشاورزی
سنجش و نظارت وضعیت محصولات کشاورزی
Slantrange ادعا می کند که هواپیمای بدون سرنشینی مجهز به بینایی ماشین توسعه داده که به سیستم هوشمندی شامل سنسورها، پردازشگرها، ابزار ذخیره سازی، شبکه ها و برنامه های تحلیل هوش مصنوعی و دیگر واسط ها متصل است تا شرایط محصولات را اندازه گیری و نظارت کند.
این شرکت ادعا می کند که هواپیماهای بدون سرنشین آن تصاویری از زمین های کشاورزی را ثبت کرده و نتایج حاصل از شرایط استرس زای محصول را در مقایسه با شرایطی که محصول در حالت استرس قرار ندارد، نشان می دهد. این عوامل استرس زا عبارتند از هجوم آفت ها، کمبود مواد غذایی و کمبود آب که معیارهایی برای برآورد بازده برداشت هستند. این نتایج به سیستم تحلیلی SlantView داده می شود تا داده ها تفسیر شوند و در نهایت به کشاورزان در تصمیم گیری برای درمان شرایط استرس زا کمک می کند.
با استفاده از هواپیمای بدون سرنشین Slantrange 3p به پرواز درآمد و اولین ۲۵۰ هکتار مزرعه را برای تعیین مناطقی که مورد تنش هستند از بالا نقشه برداری کرد. این کار آن ها را قادر ساخت تا اطلاعات مربوط به مناطقی با سطوح بالای نیترات در خاک را جمع آوری کنند که تاثیری منفی بر محصولات چغندر قند دارد. سپس داده ها را در SlantView پردازش کردند. SlantView دارای الگوریتم هایی است که می تواند مشخص کند تصویر مربوط به محصول است یا علف هرز به صورتی که صحت روش افزایش می یابد.
Slantange ادعا می کند که هواپیماهای بدون سرنشین آن فقط به ۱۷ دقیقه پرواز نیاز دارند تا ۴۰ هکتار زمین را پوشش دهند که معادل حدود ۸ دقیقه از پردازش داده ها است. طبق گزارش ها، زمان پرواز و پردازش داده ها برای تهیه نقشه هایی از مناطق استرس زا حدود ۳ ساعت است. این داده ها منجر به کاهش ۱۵ تا ۲۰ درصدی استفاده از کود نیتروژن در ۵۰۰ هکتار زمین شده که معادل ۹ تا۱۳ دلار صرفه جویی در هر هکتار است. تیم این عملیات محصولات سالم تر و حتی افزایش در محصولات به صورت ۱۰ بشکه در هر هکتار را پیش کرده بود. بازده و سود بیشتر سبب شد که سرمایه گذاری برای پیاده سازی دقت در مزرعه جبران شود.
بررسی وضعیت دام ها
تشخیص چهره حیوانات یکی از ویژگی های ادعا شده توسط شرکت Cainthus است. Cainthus از تحلیل تصویربرداری پیش بینی کننده برای نظارت بر سلامت محصولات و دام ها استفاده می کند.
ویدئوی ۲ دقیقه ای زیر چگونگی تشخیص گاوها با استفاده از تصویر برداری در چند ثانیه توسط این نرم افزار را نشان می دهد. نرم افزار این کار را بر اساس الگوهای پنهان، تشخیص چهره و ردیابی داده های کلیدی مانند مصرف آب و غذا، شناسایی گرما و الگوهای رفتاری انجام می دهد. این اطلاعات توسط الگوریتم های هوش مصنوعی دریافت شده و هشدارهایی را مورد سلامتی گاوها به کشاورزانی که در مورد تولید شیر، مدیریت تولید مثل و سلامت کلی حیوانات تصمیم گیری می کنند، ارسال می شود.
Cargill، تولید کننده و توزیع کننده محصولات کشاورزی مانند شکر، روغن تصفیه شده، پنبه، شکلات و نمک، اخیرا با Cainthus همکاری کرده تا فن آوری تشخیص چهره مزارع لبنی در سراسر جهان وارد شود.
بانکداری
بیشتر کاربردهای هوش مصنوعی در صنعت بانکداری در گذشته در زمینه ی کشف تقلب و پردازش زبان طبیعی بوده است. هم اکنون نیز بینایی ماشین در صنعت بانکداری راه پیدا کرده است.
بینایی ماشین تأثیر قابل توجهی بر بخش بانکی دارد و فرآیندهای مختلف را از طریق اتوماسیون، بهبود امنیت و ارائه تجربیات بهتر برای مشتریان تقویت می کند. در اینجا برخی از کاربردهای کلیدی بینایی کامپیوتر در بانکداری آورده شده است:
تأیید هویت: بینایی ماشین با استخراج و اعتبارسنجی اطلاعات از اسناد شناسایی (گذرنامه، گواهینامه رانندگی) و تطبیق آن با سلفی های زنده، تأیید هویت مشتری را خودکار می کند. این امر فرآیند ورود را سرعت می بخشد و تقلب را کاهش می دهد.
دیجیتال سازی فرم: استخراج و پردازش خودکار داده ها از فرم ها و اسناد (به عنوان مثال، درخواست های وام، فرم های افتتاح حساب) برای ساده سازی عملیات و کاهش خطاهای ورود دستی.
نظارت بر تراکنش: تجزیه و تحلیل تصاویر دوربین های خودپرداز یا نقاط تراکنش برای شناسایی رفتارهای مشکوک و جلوگیری از فعالیت های کلاهبرداری مانند دست زدن به کارت یا دسترسی غیرمجاز.
راستیآزمایی چک: تأیید خودکار چکهای دستنویس یا چاپی با شناسایی امضاها، مبالغ و جزئیات دریافتکننده برای تشخیص جعل و مغایرت.
مثال هایی از کاربرد بینایی ماشین در بانکداری
سیستم های Mitek برنامه های شناسایی تصویری را ارائه می دهند که از یادگیری ماشین برای دسته بندی، استخراج داده و اعتبارسنجی اسنادی مانند گذرنامه، کارت های شناسایی، گواهی نامه های رانندگی و چک ها استفاده می کنند.
در این برنامه، تصویری از شناسه یا چک کاغذی با موبایل گرفته می شود سپس به بانک ارسال می شود. تصویر ارسال شده توسط برنامه های بینایی ماشین، اعتبار سنجی می شود و در صورت معتبر بودن چک، درخواست پردازش می شود. براساس گزارش وب سایت شرکت Mitek، منابع مالی معمولا در یک روز کاری در دسترس مشتریان قرار می گیرد.
دموی دو دقیقه ای زیر نشان می دهد که چگونه نرم افزار Mitek روی تلفن های همراه کار می کند تا تصویر یک چک را ثبت کرده و آن را در حساب کاربر سپرده گذاری کند.
برای شروع فرایند، کاربر شماره ی موبایل خود را در فرم درخواست بانک وارد می کند. یک پیام متنی همراه با لینکی به کاربر فرستاده می شود تا عکسی را بگیرد. کاربر می تواند تصویر گواهینامه رانندگی، کارت شناسایی یا گذرنامه خود را وارد کند. بعد از ثبت تصویر توسط کاربر، کیفیت تصویر سریعا بررسی می شود. شرکت ادعا کرده که الگوریتم ها برخی از نواقص تصویر مانند نور، اعوجاج و دیگر موارد را تصحیح می کنند.
صنعت
کنترل کیفیت: سیستمهای بینایی ماشین محصولات را از نظر نقص بازرسی میکنند و از حفظ استانداردهای بالای کیفیت در طول فرآیند تولید اطمینان میدهند.
اتوماسیون: رباتهای مجهز به سیستمهای بینایی ماشین میتوانند وظایف پیچیدهای مانند مونتاژ، بستهبندی و جابجایی مواد را با دقت انجام دهند.
مثال هایی از کاربرد بینایی ماشین در صنعت
نظارت بر وضعیت زیرساخت حیاتی
یکی از کاربردهای بینایی ماشین توسط شرکت Osprey Informatics ارائه شده است که برنامه هایی را برای نظارت بر وضعیت زیرساخت حیاتی مانند چاه های دورافتاده، تاسیسات صنعتی، فعالیت کاری و امنیت مکان توسعه داده است. این شرکت در وب سایت خود، شرکت شل و چورون را در میان مشتریان خود فهرست کرده است.
در یک مطالعه ی موردی کاربری گزارش داده که استفاده سیستم نظارتی این شرکت برای نظارت بر چاه های نفت از راه دور سبب کاهش بازدیدها و هزینه ها شده است. مشتری به دنبال راه هایی برای کارآمدتر کردن تولید نفت در مواجهه با قیمت های پایین بوده است. در این مطالعه نشان داده شده است که Osptey از سیستم های نظارت مجازی در چندین مکان برای نظارت بر عملیات و امنیت و شناسایی کاربردهای جدید به منظور بهبود بهره وری استفاده کرده است.
سیستم بینایی ماشین این شرکت برای چاه های مهم کاربر، به منظور ایجاد تصاویر ۱۵ دقیقه ای از نواحی خاص چاه توسعه داده شده که دارای گزینه ای برای تصاویر مورد تقاضا و ویدئوی زنده است. Osptey همچنین در یک باتری مخزن کنترل از راه دور مستقر شده و اپراتورها را قادر به خواندن سطوح تانک و مشاهده منطقه می کند. با توجه به مطالعه موردی، مشتری توانست از زمان استقرار Osptey ، میزان بازدید روزانه از محل روزانه را ۵۰ به درصد کاهش دهد.
ویدئوی سه دقیقه ای زیر چگونگی استفاده از روش Osptey برای کمک به اپراتور ها در کنترل از راه دور چاه های نفت را نشان می دهد. با زوم کردن در تصویر می توان جاهایی که نشت کرده و همچنین اینکه آیا پمپ ها در سرعت مشخصی حرکت می کنند را مشخص کرد.
براساس وب سایت این شرکت، فهرست صنایعی که می توانند از بینایی ماشین استفاده کنند، شامل سکوهای نفتی و گازی، کارخانه های شیمیایی، پالایشگاه های نفت و حتی نیروگاه های هسته ای است. اطلاعات جمع آوری شده توسط حسگرها و دوربین ها به نرم افزار هوش مصنوعی منتقل می شوند که به بخش تعمیرات و نگهداری هشدار می دهد تا اقدام های لازم را حتی در شرایطی که کمترین استرس وجود دارد، انجام دهد.
امنیت و نظارت
تشخیص چهره: برای شناسایی افراد در محیط های مختلف از جمله فرودگاه ها، کنترل مرزها و رویدادهای عمومی استفاده می شود و اقدامات امنیتی را افزایش می دهد.
تشخیص ناهنجاری: سیستمهای نظارتی از بینایی ماشین برای شناسایی فعالیتها یا رفتارهای غیرعادی استفاده میکنند و هشدارهایی را برای تهدیدات امنیتی بالقوه ارائه میدهند.
پایش محیط زیست
حفاظت از حیات وحش: دوربینهایی با قابلیت بینایی کامپیوتری جمعیت حیات وحش و زیستگاههای آنها را کنترل میکنند و به تلاشهای حفاظت از محیط زیست کمک میکنند.
تشخیص آلودگی: تجزیه و تحلیل تصاویر از ماهواره ها و هواپیماهای بدون سرنشین برای نظارت بر کیفیت هوا و آب، شناسایی منابع آلودگی و ارزیابی اثرات زیست محیطی.
مثال هایی از کاربرد بینایی ماشین در پایش محیط زیست
SkyTruth یک سازمان غیرانتفاعی است که در استفاده از تصاویر ماهواره ای، سنجش از راه دور و تجزیه و تحلیل داده ها برای نظارت و حفاظت از محیط زیست تخصص دارد. این سازمان از بینایی ماشین و سایر فناوری های پیشرفته برای ارائه بینش عملی در مورد مسائل زیست محیطی استفاده می کند. شناسایی محل نشست نفت، شناسایی فعالیت های جنگل زدایی، شناسایی فعالیت های غیرقانونی ماهیگیری و ارزیابی ماهواره ای از بلایایی طبیعی از جمله کاربردهای سیستم شرکت SkyTruth است.
مالی
تشخیص تقلب: سیستمهای بینایی کامپیوتری الگوهای تراکنش و دادههای بصری اسناد را برای شناسایی فعالیتهای متقلبانه تجزیه و تحلیل میکنند.
پردازش اسناد: استخراج اطلاعات از اسناد مالی را خودکار می کند و کارایی و دقت را در ورود و تجزیه و تحلیل داده ها بهبود می بخشد.
شرکت Ocrolus در زمینه اتوماسیون اسناد و دادهها، به ویژه برای خدمات مالی تخصص دارد. وام دادن، استخراج و پردازش داده ها از فاکتورها و رسیدها، تشخیص تقلب، استخراج و اعتبارسنجی اسناد هویتی همگی از جمله امکانات Ocrolus است.
شهرهای هوشمند
مدیریت و نظارت ترافیک: سیستم های بینایی کامپیوتری جریان ترافیک و ازدحام را تجزیه و تحلیل می کنند، الگوهای چراغ راهنمایی را بهینه می کنند و تحرک شهری را بهبود می بخشند.
ایمنی عمومی: نظارت بر فضاهای عمومی برای شناسایی حوادث، خطرات و شرایط اضطراری، تسهیل زمان پاسخگویی سریعتر.
مثال هایی از کاربرد بینایی ماشین در شهرهای هوشمند
Genetec Security یک پلت فرم امنیتی جامع و یکپارچه است که چندین سیستم امنیتی را در یک سیستم واحد ادغام می کند. این پلتفرم به طور گسترده در شهرهای هوشمند برای افزایش ایمنی و امنیت عمومی با استفاده از بینایی کامپیوتر و سایر فناوری های پیشرفته استفاده می شود. Genetec Security یک پلت فرم امنیتی یکپارچه که نظارت تصویری را با بینایی ماشین برای نظارت بر فضاهای عمومی و افزایش ایمنی یکپارچه می کند.
نظارت تصویری، کنترل تردد، تشخیص چهره و پلاک خوان، مدیریت حوادث همگی از ویژگی های این سیستم شهر هوشمند هستند.
سرگرمی
ایجاد محتوا: در فیلم و بازیهای ویدیویی، از بینایی کامپیوتری برای ضبط حرکت استفاده میشود که امکان ایجاد انیمیشنهای واقعی و جلوههای ویژه را فراهم میکند.
واقعیت افزوده (AR): اپلیکیشنهایی مانند اسنپچت و اینستاگرام از دید کامپیوتری برای تشخیص چهره استفاده میکنند تا فیلترها و افکتها را در زمان واقعی اعمال کنند.
نتایج
بینایی ماشین هم اکنون در صنایع بسیاری وارد شده است. برخی صنایع این کاربرد را زودتر از بقیه اتخاد کرده اند اما به هر حال این تکنولوژی هنوز هم برای نظرات، تحلیل، تفسیر، کنترل، تصمیم گیری و اقدام، به انسانها نیازمند است.
در صنعت خودرو، شرکت های جهانی مانند گوگل و تسلا در حال پیشرفت و بهبود ماشین های خودران مجهز به دوربین های بینایی ماشین هستند. با این حال، با گزارش تصادفات مرگبار، واضح است که این خودروها کاملا آماده تجاری بودن نیستند و نمی توانند کاملا خودمختار باشند.
در فروشگاه های خرده فروشی آنلاین مانند فروشگاه Amazon Go، هنوز هم کارمندان انسانی در بخش خدمات مشتری کار می کنند و در پشت صفحه نمایش ها مشغول آموزش الگوریتم ها و بررسی توانایی یادگیری ماشین هستند. از لحاظ امنیت خرده فروشی، تکنولوژی به ثبت ویدیو سرقت ها کمک می کند، اما در نهایت منابع انسانی باید وارد عمل شوند تا کارمندان خطاکار را اصلاح کنند.کاربرد بینایی ماشین در کشاورزی به کندی پیش می رود. اما شرکت هایی مانند Cainthus با هدف گرفتن این فن آوری از صنایع دیگر و بکارگیری آن در کشاورزی وارد این بازار شده اند. این شرکت ها ادعا می کنند که به کشاورزان در کشاورزی دقیق تر کمک کنند تا از این طریق تولید را با هزینه کم تر افزایش دهند. همکاری Cainthus و Cargill می تواند شکل دیگری از کاربردهای هوش مصنوعی را وارد صنایع کند.
سپاسگزارم