کاربردهای جالب یادگیری عمیق

کاربردهای یادگیری عمیق

با ظهور یادگیری عمیق (Deep Learning) به عنوان یکی از شاخه های هوش مصنوعی و یادگیری ماشینی در سال های اخیر، کاربرد آن در صنایع مختلف فراگیر شده است. یادگیری عمیق را می توان در بینایی ماشین تا پردازش زبان طبیعی مشاهده کرد. کاربردهای زیادی را می توان برای یادگیری عمیق در نظر گرفت. در ادامه تعدادی از کاربردهای جالب و جذاب یادگیری عمیق را با هم بررسی می کنیم.

رنگی کردن تصاویر و ویدئوهای سیاه سفید

برای رنگی کردن تصاویر و ویدئوهای سیاه سفید می توانید از یادگیری عمیق استفاده کنید. “Let there be color!” سیستمی است که به همین منظور توسعه داده شده است. این سیستم تصاویر و فیلم های شما را به صورت خودکار رنگی می کند. اگر علاقمند به کسب اطلاعات بیشتر درباره ی این سیستم هستید به اینجا و اینجا  مراجعه کنید.

رنگی کردن عکس سیاه سفید با یادگیری عمیق

همین روش می تواند برای رنگی کردن فیلم های سیاه و سفید نیز به کار رود.

منبع ویدئو

مدل یادگیری عمیق برای رنگی کردن تصاویر و ویدئوها، الگوهای طبیعی داخل عکس را تشخیص می دهد و سپس این الگوها را رنگی می کند. برای مثال رنگ آسمان آبی، رنگ ابرها سفید یا خاکستری و رنگ علف ها سبز هستند. تبدیل رنگ ها و یادگیری اینکه هر الگویی در تصویر چه رنگی است توسط مدل بدون دخالت انسان انجام می شود.

در تصویر زیر دو عکس سیاه و سفید را مشاهده می کنید که توسط مدل یادگیری عمیق رنگی شده اند. عکس وسط، تصویر واقعی، عکس سمت راست عکس تولید شده توسط یادگیری عمیق است. مدل قادر به تشخیص فصل پاییز و تغییر رنگ آن نشده است.

رنگی کردن عکس های سیاه و سفید با هوش مصنوعی

بازسازی پیکسل تصویر

 تصاویری را دیده اید که وضوح کافی ندارند و نمی توان چهره ی افراد را در آن ها مشخص کرد؟ در سال ۲۰۱۷ محققان  Google Brain از یک مدل یادگیری عمیق برای تشخیص چهره ی افراد در تصاویر کم کیفیت استفاده کردند. ورودی این مدل یک تصویر بدون وضوح ۸ در ۸ پیکسلی است. این مدل  Pixel Recursive Super Resolution نامیده شد و می تواند وضوح تصویر را تا حد قابل قبولی بالا ببرد. در تصویر زیر نمونه ای از تشخیص این مدل را می بینید. نمی توان گفت که این کار خیلی خوب انجام شده اما همان طور که مشاهده می کنید تشخیص خیلی از ویژگی های چهره توسط مدل واقعا خوب است.

بازیابی پیکسل های تصویر

در تصویر بالا عکس سمت چپ ورودی مدل، عکس وسطی، عکس تشخیص داده شده و تصویر سمت راست عکس واقعی است.

تخمین موقعیت افراد مختلف به صورت بلادرنگ

شبکه های یادگیری عمیق می توانند به انیماتورها در یافتن مکان مناسب افراد کمک کنند. این کار می تواند به صورت بلادرنگ انجام شود. در فیلم زیر حرکات و موقعیت بدن افراد مختلف مشخص می شود. هیچ سنسوری به بدن این افراد متصل نیست. تنها با تحلیل تصاویر ویدئویی، یادگیری عمیق توانسته است افراد و حرکاتشان را در ویدئو تشخیص دهد.

منبع ویدئو

ایجاد تصاویری از کهکشان ها

با یادگیری عمیق می توان تصاویری از کهکشان  و آتشفشان را ایجاد کرد.

در بالا تصویری از کهکشان ها و آتشفشان هایی را مشاهده می کنید که توسط کامپیوتر ایجاد شده است. معماری مورد استفاده برای این کار Generative Adversarial Networks و به اختصار GANs نام دارد.

ترجمه ماشینی

اپلیکیشن مترجم گوگل می تواند متن روی تصاویر را ترجمه کند. کافی است برنامه ی مترجم گوگل را اجرا کنید، عکسی را با دوربین خود بگیرید. این عکس توسط OCR تبدیل به متن شده و سپس ترجمه می شود.

ترجمه از روی عکس

در تصویر بالا، کاراکترها شناسایی شده، توسط اپلیکیشن مترجم گوگل ترجمه می شود و متن ترجمه شده جایگزین متن اصلی می شود.

 

ایجاد تصاویر جدید

در  Pix2Pix یک مدل یادگیری عمیق آموزش داده شده تا کارهای مختلفی از جمله ایجاد تصاویری از خیابان واقعی، ساختن یک نقشه از تصاویر هوایی، تبدیل صحنه ی روز به شب و رنگ کردن فضای خالی بین لبه های یک شی در تصویر را انجام دهد.

ایجاد تصویر با یادگیری عمیق

در تصویر بالا، عکس هایی را می بینید که توسط یادگیری عمیق ایجاد شده اند. برای مثال تصویر گرفته شده در روز توسط این مدل به شب تبدیل شده است.

رنگ کردن طراحی با یادگیری عمیق

در تصویر بالا، طرح های کشیده شده و این طرح ها توسط مدل های یادگیری عمیق رنگ آمیزی شده اند. رنگ آمیزی ها بسیار جالب و زیبا هستند.

 

شکست دادن افراد در بازی های کامپیوتری

الگوریتم های یادگیری ماشین در حال آموزش دیدن برای شکست دادن انسان ها در بازی های کامپیوتری هستند. هم اکنون در بسیاری از بازی های کامپیوتری، الگوریتم های یادگیری ماشین خیلی بهتر از افراد حرفه ای، بازی می کنند. این الگوریتم ها برای بازی کردن برنامه ریزی نشده اند، در واقع چندین ساعت بازی مورد نظر را انجام می دهند و سپس یاد می گیرند چطور بازی کنند.

شکست دادن انسان در بازی های رایانه ای توسط یادگیری عمیق

لیستی از بازی هایی که توسط ماشین ها انجام می شود را مشاهده می کنید. در بیشتر موارد، مدل های یادگیری عمیق به اندازه ی کافی آموزش دیده اند تا بتوانند بهتر از انسان بازی کنند.

منبع ویدئو

در اینجا ویدئویی مشاهده می کنید از حرکات یک ماشین در بازی breakout که توسط یادگیری عمیق توسعه داده شده است. همان طور که مشاهده می کنید با افزایش زمان بازی، کامپیوتر حرفه ای تر شده و بهتر از گذشته بازی را انجام می دهد. برای پیاده سازی این ماشین از تکنولوژی DeepMind گوگل استفاده شده است.

اتومبیل خودران

حتما شما هم تا به حال چیزهایی در مورد خودروهای بدون سرنشین یا خودروان شنیده و خوانده اید. در ادامه ویدیویی مشاهده می کنید از یک خودروی بدون سرنشین که توسط شرکت تسلا توسعه داده شده است. همان طور که مشخص است، خودرو می توانند علائم راهنمایی و رانندگی، افراد و دیگر اشیا را تشخیص دهد.

توصیف عکس(ایجاد caption)

تا حالا  شده به تگ کردن تصویر دوستانتان در عکس هایی که در فیسبوک قرار می دهید دقت کنید؟ این کار به صورت خودکار انجام می شود.  Google Photos هم تصاویر شما را به منظور جستجوی راحت تر، برچسب گذاری می کند. در واقع برای این کار از یک مدل یادگیری عمیق به همراه ImageNet که بزرگترین دیتاست تصاویر برچسب خورده است، استفاده می شود.

توصیف تصویر

کار مدل یادگیری عمیق فقط به اینجا ختم نمی شود که تصاویر را دسته بندی کند. یادگیری عمیق گامی جلوتر رفته و تمام اجزای تصویر را در یک جمله به زبان انگلیسی توصیف می کند. برای اطلاعات بیشتر به این لینک  مراجعه کنید.

در تصویر زیر نمونه ای از شناسایی اشیا را با یادگیری عمیق مشاهده می کنید:

شناسایی اشیا یا یادگیری عمیق

تغییر جهت خیره شدن فرد

تا حالا شده که بخواهید جهت خیره شدن فرد را در تصویری تغییر دهید؟ در DeepWarp این کار با یادگیری عمیق انجام می شود.

کاربردهای یادگیری عمیق

تحلیل رفتار به صورت بلادرنگ

همان طور که کاربردهای بالا اشاره شد، یادگیری عمیق می تواند حرکات افراد را شناسایی و ردیابی کند. کاربرد دیگر یادگیری عمیق در این زمینه آگاهی دادن درباره ی رفتار افراد، خودروها  و اشیا دیگر است

منبع ویدئو

شناسایی وال های در معرض خطر

تکنیک کانولوشن که یکی از تکنیک های یادگیری عمیق است، دسته بندی تصاویر را به خوبی انجام می دهند. دسته بندی تصاویر کاربردهای بسیاری در نجوم، زیست شناسی، صنایع غذایی و صنایع دیگر دارد. یکی از کاربردهای دسته بندی تصاویر  وال هاست، به طوری که از این طریق می توان به مطالعه ی جمعیت وال های در معرض خطر پرداخت. مثال های دیگر نیز برای طبقه بندی گیاهان و پلانکتون ها وجود دارد.

منبع ویدئو

تخمین پتانسیل ذخیره ی انرژی خورشیدی

Google Sunroof از عکس های هوایی سرویس  Google Earth خود برای ایجاد تصاویر سه بعدی سقف ها استفاده می کند. در پروژه ی مذکور از یادگیری عمیق برای جدا سازی سقف خانه از چیزهای دیگر مانند درختان و سایه استفاده می کنند. سپس از خط سیر خورشید و الگوهای آب و هوا برای پیش‌ بینی اینکه چقدر انرژی می‌تواند با نصب صفحات خورشیدی بر روی سقف شما تولید شود، استفاده می‌ کند.

پیش بینی ذخیره ی انرژی خورشیدی با هوش مصنوعی

 

تولید صدا

WaveNet و Deep Speech شبکه های یادگیری عمیق هستند که برای تولید صدا به صورت خودکار به کار می روند. سیستم های تبدیل متن به صوت در گذشته به صورت کاملا خودکار انجام نمی شد و صدایی تولید نمی کردند و همچنین نیاز به آموزش دستی برای این کار داشتند. امروزه سیستم های تبدیل متن به صوت صدای انسان را تقلید می کنند و با آموزش بیشتر بهبود می یابند. شباهت صدای تولید شده با صدای انسان به گونه ای است که به سختی می توان آن را تشخیص داد. یادگیری ماشین بیش از پیش ماشین ها را به سمتی می برد که مانند انسان صحبت کنند.

 

منبع ویدئو

آهنگ سازی

فناوری تشخیص صوت می تواند برای آهنگ سازی هم مورد استفاده باشد. ویدئوی زیر، آهنگی است که توسط ماشینی تولید شده است. این ماشین با یادگیری توانسته است، آهنگی مشابه با آهنگ Chopin را بسازد.

منبع ویدئو

بازیابی صدا در ویدئو

افرادی را دیده اید که می توانند از روی حرکات لب ها، لب خوانی کرده و منظور شما را متوجه شوند؟ می توان این کار را با یادگیری ماشین بر روی ویدئوهای بدون صدا انجام داد. گروهی از محققان با ایجاد صداهای مختلف اشیا، مدل خود را آموزش دادند و سپس ویدئوی بدون صدایی را به مدل دادند و مدل توانست صدای این ویدئو را بازیابی کند.

منبع ویدئو

در ادامه ویدئویی را مشاهده می کنید از LipNet که می تواند لب خوانی کند.

منبع ویدئو

انتقال سبک نقاشی

تصویری از یک سبک نقاشی به مدل یادگیری عمیق داده می شود. ماشین الگوها، رنگ ها و سایه ها را تحلیل می کند و بعد از یادگیری می توان عکس جدید به  مدل داد تا این سبک را روی عکس جدید پیاده کند.

انتقال سبک نقاشی با کمک هوش مصنوعی

این کار فقط محدود به انتقال سبک نیست در ادامه می بینید که طرح هایی روی نقاشی مونالیزا پیاده سازی شده است. جهت آشنایی بیشتر به لینک مراجعه کنید.

طراحی با هوش مصنوعی

از این تکنیک می توان برای ویرایش عکس هم استفاده کرد. در تصویر زیر، تصویر سمت چپ تصویر واقعی است، توسط وسط سبک واقعی و تصویر سمت راست تصویر حاصل شده از ترکیب این دو است.

ویرایش عکس با هوش مصنوعی

نوشتن خودکار مقاله های ویکی پدیا، ریاضی، کدهای کامپیوتری و نمایشنامه های شکسپیر

یکی از کاربردهای دیگر یادگیری عمیق، در حیطه ی داده های متنی است. در تحقیقی که برای بررسی توانایی یادگیری عمیق در این زمینه انجام شد، مدل با متن هایی از ویکی پدیا، شکسپیر، مقالات ریاضی و کدهای کامپیوتری آموزش داده شده است. در نهایت این مدل توانست مقالات، کدها و نمایشنامه هایی ایجاد کند. گرچه همه ی نتایج قابل قبول نبودند اما امیدوار کننده بودند.

نمایشنامه شکسپیر

این مقاله شبیه نمایشنامه های شکسپیر است اما توسط یک مدل یادگیری عمیق که با دادن نمایشنامه های بسیاری از شکسپیر آموزش داده شده، تولید شده است.

مقاله ای از ویکی پدیا

مقاله ای از ویکی پدیا که توسط مدل یادگیری عمیق ایجاد شده است.

تولید دست خط

دست خط با یادگیری عمیق

این دست خط توسط یک کامپیوتر ایجاد شده نه یه انسان! تولید دست خط توسط الگوریتم های یادگیری عمیق انجام شده است.

رویای عمیق

در سال ۲۰۱۵ محققان شرکت گوگل روشی را پیدا کردند که می تواند برخی ویژگی های موجود در تصویر را ارتقا بخشد. یکی از کاربردهای این روش در ایجاد یک رویای عمیق (Deep dreaming) است. در رویای عمیق کامپیوتر یک تصویر خیالی و توهمی از تصویر موجود می سازد.

Deep dreaming

ساخت تصاویر توهمی با هوش مصنوعی

دو تصویر بالا نمونه هایی از بکارگیری یادگیری ماشین برای ایجاد تصاویر توهمی است.

منبع ویدئو

منبع ویدئو

در دو  ویدئوی بالا، ویدئوهایی همانند تصاویر توهمی با تکنیک های یادگیری عمیق ایجاد شده است.

 نرم افزار پلاک خوان خودنگار و نرم افزار تشخیص چهره رخ نگار با بکارگیری الگوریتم های یادگیری عمیق توسعه یافته اند.

منبع ۱، منبع ۲

 

 

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *