هما کاشفی
چطور از Segment Anything Model (SAM) استفاده کنیم؟
در این پست میخواهیم به قابلیتهای مدل Segment Anything (SAM) بپردازیم. این مدل کارآمد و سریع را برای سگمنت بندی تصاویر بررسی میکنیم. با بیش از یک میلیارد ماسک روی یازده میلیون تصاویر دارای مجوز و احترام به حریم خصوصی،…
کار با GPT-4 در ایران بدون نیاز به ثبت نام و شماره مجازی (با New Bing)
Microsoft's Bing سالها برای بدست آوردن جایگاهی مناسب در میان موتورهای جستجو تلاش کرده است. اما تلاشهای اخیر این شرکت با افزودن ویژگی چت AI-powered Bing جان تازهای به این موتور جستجو بخشیده است. Bing جدید که اغلب با نام…
مدل CNN-RNN برای تولید کپشن تصاویر
ما انسان ها به راحتی می توانیم توصیفی برای تصاویر تولید کنیم. اما ماشین چطور می تواند برای تصاویری که به عنوان ورودی دریافت می کند توصیف تولید کند؟ به لطف پیشرفت های حاصل در حوزه های بینایی ماشین و…
معرفی مدل Segment Anything: اولین مدل پایه برای سگمنتبندی تصویر
سگمنت بندی (Segmentation) به معنی شناسایی پیکسلهای تصویر متعلق به یک شی است و یکی از تسکهای اصلی در بینایی ماشین است و در طیف گستردهای از برنامهها استفاده میشود از تحلیل تصاویر علمی گرفته تا ویرایش تصاویر. اما ایجاد…
OpenAI چیست؟ ChatGPT چطور جهان را به چالش میکشد؟
OpenAI یک شرکت تحقیقاتی است که هدف آن ارتقا و توسعهی هوش مصنوعی «دوستانه» است. سال گذشته ChatGPT و DALLE-2 توانستند جریان اصلی هوش مصنوعی را به خود اختصاص دهند و اکنون این شرکت به دنبال یافتن چند دوست جدید…
کدام مهمتر است؛ دانش حل مسئله یا دانستن زبان برنامه نویسی؟
دانش حل مسئله مهمتر است یا مهارت در برنامه نویسی؟ این پرسش از سالها قبل مطرح شد و هنوز هم یک چالش مهم و عمده به حساب میآید. میتوان گفت حل مسائل، عنصر مرکزی در علوم کامپیوتر است. برنامه نویسان…
شروع کار با یادگیری عمیق: 5 موردی که باید حتماً بدانید
میخواهید حرفهی یادگیری عمیق خود را آغاز کنید؟ یادگیری عمیق میتواند یک حوزهی پیچیده و دلهره آور برای تازه واردان باشد. مفاهیمی مانند لایههای پنهان، شبکههای عصبی کانولوشنال، پس انتشار خطا و مسائل جدیدی که هر روزه مطرح میشوند و…
انواع مختلف یادگیری در یادگیری ماشین
با توجه به اینکه تمرکز اصلی حوزهی یادگیری ماشین «یادگیری» است، انواع مختلف یادگیری وجود دارد که باید به عنوان متخصص به آنها مسلط باشیم. برخی از انواع یادگیری، زیرمجموعههایی دارند که شامل انواع مختلف الگوریتمهاست مانند «یادگیری با ناظر».…
AlexNet:معماری که CNNها را به چالش کشید
سالها پیش، ما هنوز از دیتاستهای کوچکی مثل CIFAR, NORB استفاده میکردیم که متشکل از دهها هزار تصویر بودند. این دیتاستها برای مدلهای یادگیری ماشین مناسب بودند تا تسکهای تشخیص ساده را یاد بگیرند. با این حال، زندگی واقعی هرگز…
هنر و هوش مصنوعی
ما به دلایل متعددی به هنر روی می آوریم: برای بیان عاطفه یا احساس، برای یادآوری رویدادها و احساسات گذشته، برای ارتباط برقرار کردن و برای تحصیل. به طور خلاصه، هنر چیزی است که خلق میکنیم تا بدانیم چه کسی…
مفهوم کانولوشن در CNN
اگر بخواهیم تفاوت اصلی لایههای کانولوشن را با لایههای معمول شبکههای عصبی بیان کنیم، میتوانیم بگوییم لایههای Dense الگوهای global را در فضای ویژگی ورودی خود یاد میگیرند در حالیکه لایههای کانولوشن الگوهای local را یاد میگیرند. برای مثال یک…
درک شبکههای عصبی بازگشتی و LSTM
اگر تابحال از Apple’s Siri و Google voice search یا Google Translate استفاده کردهاید، باید بدانید که این اپلیکیشنها از شبکههای عصبی بازگشتی (RNN) استفاده میکنند که جدیدترین الگوریتمها برای دادههای توالی هستند. RNN اولین الگوریتمی است که به دلیل…