تشخیص تصویر چیست؟
1 پاسخ
در ابتدایی ترین سطح خود، تشخیص تصویر را می توان تقلید از دید انسان توصیف کرد. قابلیتهای بینایی ما به گونهای تکامل یافته است که به سرعت جذب، زمینهسازی و واکنش به آنچه میبینیم است.
این همان کاری است که پردازش تصویر نیز انجام میدهد – تشخیص تصویر میتواند دادههای موجود در تصاویر را دستهبندی و شناسایی کند و اقدامات مناسب را بر اساس زمینه جستجو انجام دهد.
به زبان ساده، فرآیند تشخیص تصویر را می توان به 3 مرحله مجزا تقسیم کرد.
1.همه چیز با یک مجموعه داده عظیم شروع می شود. این را میتوان با دادههای موجود در دنیای بزرگ وقتی از چشمان کنجکاو یک نوزاد مشاهده کرد، تشبیه کرد. یک نوزاد نمی داند که سگ سگ است یا درخت، درخت است، اما به سرعت یاد می گیرد که دنیای اطراف خود را شناسایی و دسته بندی کند.
مجموعه داده تمام اطلاعات لازم را برای هوش مصنوعی در پشت تشخیص تصویر فراهم می کند تا بتواند داده هایی را که در تصاویر می بیند درک کند.
2.تغذیه مجموعه داده به یک شبکه عصبی است. سپس این شبکه آموزشی می شود. تقریباً در همه موارد، نوع شبکه عصبی مورد استفاده برای پردازش تصویر، یک شبکه عصبی کانولوشن است.
به زبان ساده، شبکه عصبی کانولوشن شبکه ای است که از مجموعه ای از فیلترها برای شناسایی داده های نگهداری شده در یک تصویر استفاده می کند.
تصویری که باید اسکن شود به بلوکهای پیکسلی تقسیم میشود و سپس با فیلترهای مناسب که شباهتها شناسایی میشوند، مقایسه میشوند. نتیجه به عنوان یک مقدار بالا در ماتریس خروجی علامت گذاری می شود.
این یک برداشت بسیار ساده در مورد نحوه عملکرد یک شبکه عصبی کانولوشنال است، اما طعمی از نحوه عملکرد این فرآیند می دهد.
3.مرحله آخر این است که همه چیز در مورد آن است. اکنون، سیستم میتواند تصاویری را که با مجموعه دادههای آموزشی مقایسه میشوند، تغذیه کند و نتایج یا پیشبینیهایی بر اساس آنچه شبکه میبیند، خروجی است