یادگیری عمیق زیرشاخهای از یادگیری ماشینی است که بر آموزش شبکههای عصبی مصنوعی با لایههای متعدد برای یادگیری و پیشبینی حجم عظیمی از دادهها تمرکز دارد. از ساختار و عملکرد مغز انسان الهام گرفته شده است، جایی که هر لایه از نورونها ویژگیهای پیچیدهتر را از دادههای ورودی پردازش و استخراج میکنند.
در یادگیری عمیق ، شبکههای عصبی با لایههای مخفی متعدد، که به عنوان شبکههای عصبی عمیق شناخته میشوند، برای یادگیری خودکار نمایش سلسله مراتبی دادهها استفاده میشوند. این شبکهها با استفاده از مجموعه دادههای برچسبگذاریشده بزرگ برای تشخیص الگوها، طبقهبندی اشیا، پیشبینی و انجام سایر وظایف پیچیده، آموزش داده میشوند. الگوریتمهای یادگیری عمیق فرآیندی به نام پس انتشار را به کار میگیرند، که در آن خطاهای پیشبینیها به عقب از طریق شبکه منتشر میشوند تا وزنها و بایاسهای نورونها را تنظیم کنند و به طور مکرر عملکرد مدل را بهبود بخشند.
یادگیری عمیق در حوزه های مختلف از جمله بینایی کامپیوتر، پردازش زبان طبیعی، تشخیص گفتار، سیستم های توصیه و بسیاری موارد دیگر به موفقیت چشمگیری دست یافته است. این فناوری در کارهایی مانند طبقهبندی تصویر، تشخیص اشیا، ترجمه زبان و سنتز گفتار از تکنیکهای سنتی یادگیری ماشین بهتر عمل کرده و به پیشرفتهایی در وسایل نقلیه خودران، دستیاران مجازی، تشخیصهای پزشکی و موارد دیگر کمک کرده است.
یادگیری عمیق از چندین جنبه کلیدی با یادگیری ماشین سنتی متفاوت است:
1. نمایش داده ها: در یادگیری ماشین سنتی، استخراج و انتخاب ویژگی ها مراحل بسیار مهمی هستند که در آن کارشناسان دامنه به صورت دستی ویژگی های مرتبط را از داده های خام مهندسی می کنند. از سوی دیگر، یادگیری عمیق، نمایشها را مستقیماً از دادهها یاد میگیرد و نیاز به مهندسی ویژگی صریح را از بین میبرد. شبکه های عصبی عمیق به طور خودکار نمایش های سلسله مراتبی داده ها را در سطوح مختلف انتزاعی یاد می گیرند.
2. یادگیری ویژگی: الگوریتمهای یادگیری ماشین سنتی اغلب بر ویژگیهای دست ساز برای آموزش مدلها متکی هستند. الگوریتمهای یادگیری عمیق ویژگیها را بهطور خودکار از دادههای خام یاد میگیرند، و به مدل اجازه میدهند الگوها و نمایشهای پیچیدهای را کشف کند که استخراج دستی آنها ممکن است چالش برانگیز باشد.
3. پیچیدگی معماری: مدلهای یادگیری عمیق با عمقشان مشخص میشوند که به وجود لایههای متعدد نورونهای به هم پیوسته اشاره دارد. این لایهها به مدل اجازه میدهند تا نمایشهای پیچیدهتری از دادهها را بیاموزد. الگوریتمهای یادگیری ماشین سنتی معمولاً معماری سادهتری دارند، مانند مدلهای خطی یا درختهای تصمیم.
4.عملکرد بر روی داده های مقیاس بزرگ: یادگیری عمیق در مدیریت داده های در مقیاس بزرگ، بهتر است. با افزایش اندازه مجموعه داده، شبکه های عصبی عمیق ظرفیت یادگیری الگوهای پیچیده و تعمیم خوبی را دارند. الگوریتمهای یادگیری ماشین سنتی ممکن است در مدیریت مجموعه دادههای بزرگ مشکل داشته باشند و ممکن است روابط پیچیده را به اندازه مدلهای یادگیری عمیق درک نکنند.