بینایی ماشین

Vision Transformer (ViT)

نحوه‌ی کار Vision Transformer (ViT)

مدل ViT (Vision transformer) یک مدل شبیه به transformer است که برای انجام تسک‌های پردازش بینایی طراحی شده است. در این مقاله می آموزیم که این مدل چگونه کار می‌کند.
معرفی مدل Segment Anything (SAM): پیش به سوی اولین مدل پایه برای سگمنت بندی تصویر

معرفی مدل Segment Anything: اولین مدل پایه برای سگمنت‌بندی تصویر

سگمنت بندی (Segmentation) به معنی شناسایی پیکسل‌های تصویر متعلق به یک شی است و یکی از تسک‌های اصلی در بینایی ماشین است و در طیف گسترده‌ای از برنامه‌ها استفاده می‌شود از تحلیل تصاویر علمی گرفته تا ویرایش تصاویر. اما ایجاد…