بلاگ علمی

segment Anything

چطور از Segment Anything Model (SAM) استفاده کنیم؟

در این پست می‌خواهیم به قابلیت‌های مدل Segment Anything (SAM) بپردازیم. این مدل کارآمد و سریع را برای سگمنت بندی تصاویر بررسی می‌کنیم. با بیش از یک میلیارد ماسک روی یازده میلیون تصاویر دارای مجوز و احترام به حریم خصوصی،…
فرق بین عبارت کانولوشن (convolution) و میان-همبستگی (cross-correlation)

فرق بین کانولوشن convolution و میان-همبستگی cross-correlation

اگه پردازش تصویر یا شبکه های عمیق کار کرده باشید حتما دو عبارت کانولوشن (convolution) و میان-همبستگی (cross-correlation) را شنیده اید. هر دو عملیات از لحاظ ریاضیاتی خیلی شبیه بهم هستند. اگه بخوایم یه تعریف کلی در مورد هر کدوم…
تصویر مرد عنکبوتی تولید شده با هوش مصنوعی

کار با GPT-4 در ایران بدون نیاز به ثبت نام و شماره مجازی (با New Bing)

Microsoft's Bing سال‌ها برای بدست آوردن جایگاهی مناسب در میان موتورهای جستجو تلاش کرده است. اما تلاش‌های اخیر این شرکت با افزودن ویژگی چت AI-powered Bing جان تازه‌ای به این موتور جستجو بخشیده است. Bing جدید که اغلب با نام…
مدل تولید کپشن برای تصویر

مدل CNN-RNN برای تولید کپشن تصاویر

ما انسان ها به راحتی می توانیم توصیفی برای تصاویر تولید کنیم. اما ماشین چطور می تواند برای تصاویری که به عنوان ورودی دریافت می کند توصیف تولید کند؟ به لطف پیشرفت های حاصل در حوزه های بینایی ماشین و…
معرفی مدل Segment Anything (SAM): پیش به سوی اولین مدل پایه برای سگمنت بندی تصویر

معرفی مدل Segment Anything: اولین مدل پایه برای سگمنت‌بندی تصویر

سگمنت بندی (Segmentation) به معنی شناسایی پیکسل‌های تصویر متعلق به یک شی است و یکی از تسک‌های اصلی در بینایی ماشین است و در طیف گسترده‌ای از برنامه‌ها استفاده می‌شود از تحلیل تصاویر علمی گرفته تا ویرایش تصاویر. اما ایجاد…
OpenAI چیست؟ ChatGPT چطور جهان را به چالش می‌کشد؟

OpenAI چیست؟ ChatGPT چطور جهان را به چالش می‌کشد؟

OpenAI یک شرکت تحقیقاتی است که هدف آن ارتقا و توسعه‌ی هوش مصنوعی «دوستانه» است. سال گذشته ChatGPT و DALLE-2 توانستند جریان اصلی هوش مصنوعی را به خود اختصاص دهند و اکنون این شرکت به دنبال یافتن چند دوست جدید…
کدام مهم‌تر است؛ دانش حل مسئله یا دانستن زبان برنامه نویسی؟

کدام مهم‌تر است؛ دانش حل مسئله یا دانستن زبان برنامه نویسی؟

دانش حل مسئله مهم‌تر است یا مهارت در برنامه نویسی؟ این پرسش از سال‌ها قبل مطرح شد و هنوز هم یک چالش مهم و عمده به حساب می‌آید. می‌توان گفت حل مسائل، عنصر مرکزی در علوم کامپیوتر است. برنامه نویسان…
آناتومی قلب انسان و سیستم گردش خون

آناتومی قلب انسان و سیستم گردش خون

روزانه، قبل انسان به طور میانگین 100 هزار بار نبض میزند و حدودا 2000 گالن خون در بدن پمپاژ می‌کند. برای یک اندامی که بزرگتر از یک مشت دست نیست و وزنی حدود 8-12 اونس دارد بسیار زیاد است. در…
شروع کار با یادگیری عمیق: 5 موردی که باید حتماً بدانید

شروع کار با یادگیری عمیق: 5 موردی که باید حتماً بدانید

می‌خواهید حرفه‌ی یادگیری عمیق خود را آغاز کنید؟ یادگیری عمیق می‌تواند یک حوزه‌ی پیچیده و دلهره آور برای تازه واردان باشد. مفاهیمی مانند لایه‌های پنهان، شبکه‌های عصبی کانولوشنال، پس انتشار خطا و مسائل جدیدی که هر روزه مطرح می‌شوند و…
انواع یادگیری در یادگیری ماشین

انواع مختلف یادگیری در یادگیری ماشین

با توجه به اینکه تمرکز اصلی حوزه‌ی یادگیری ماشین «یادگیری» است، انواع مختلف یادگیری وجود دارد که باید به عنوان متخصص به آنها مسلط باشیم. برخی از انواع یادگیری، زیرمجموعه‌هایی دارند که شامل انواع مختلف الگوریتم‌هاست مانند «یادگیری با ناظر».…
AlexNet: معماری که CNNها را به چالش کشید

AlexNet:معماری که CNNها را به چالش کشید

سال‌ها پیش، ما هنوز از دیتاست‌های کوچکی مثل CIFAR, NORB استفاده می‌کردیم که متشکل از ده‌ها هزار تصویر بودند. این دیتاست‌ها برای مدل‌های یادگیری ماشین مناسب بودند تا تسک‌های تشخیص ساده را یاد بگیرند. با این حال، زندگی واقعی هرگز…
هنر و هوش مصنوعی

هنر و هوش مصنوعی

ما به دلایل متعددی به هنر روی می آوریم: برای بیان عاطفه یا احساس، برای یادآوری رویدادها و احساسات گذشته، برای ارتباط برقرار کردن و برای تحصیل. به طور خلاصه، هنر چیزی است که خلق می‌کنیم تا بدانیم چه کسی…