مروری بر مفاهیم پایه ی تصویر و پردازش تصویر

محمد نوری زاده چرلو
12 بهمن 1392

مروری بر مفاهیم پایه ی تصویر و پردازش تصویر

در بخش قبل درباره ی مسیر بینایی انسان صحبت کردیم. در این بخش در نظر داریم که مروری بر مفاهیم پایه ی تصویر و پردازش تصویر داشته باشیم.

1.دیجیتال کردن تصویر

تصاویر دیجیتال یک سری مزایا دارند که میتوان به ذخیره آسان و پردازشهای (post-processing) آسان آنها اشاره کرد.

دیجیتالی کردن تصویر

در تصویر بالا فرایند دیجیتال کردن یک تصویر آنالوگ نشان داده شده است. تصویر آنالوگ در ابتدا به صورت مکانی کوانتیزه شده، و سپس در مرحله بعد مقادیر شدت روشنایی آن کوانتیزه می شود و به بعد کامپیوتر منتقل شده و به صورت تصویر دیجیتال ذخیره می شود و میتوان پردازش های بعدی را روی این تصویر اعمال کرد. در تصویر زیر هم نحوه ثبت یک تصویر xray نشان داده شده است.

نحوه ثبت یک تصویر xray

2.تصویر دیجیتال چیست؟

تصویر دیجیتال توسط تجهیزات و دستگاه‌های مخصوص تصویربرداری ثبت می‌شود و برخلاف چشم انسان که تنها به طیف مرئی الکترومغناطیسی محدود می شود، ماشین‌های تصویربردای تمام طیف‌های الکترومغناطیسی را میتوانند تصویربرداری کنند. مثل تصاویر mri، تصاویر الترواسوند، تصاویر ct، تصاویر pet و غیره.

تصویری که توسط یک دستگاه ثبت می‌شود، تصویر دیجیتال نامیده میشود. تصویر دیجیتال، نمایش عددی(باینری، رنگی، خاکستری) از یک تصویر است.

یک تصویر دیجیتال را در کامپیوتر به صورت یک تابع دوبعدی( f(x,y تعریف می کنند که در آن x و y هر مختصات مکانی در روی صفحه هستند و دامنه f به نام شدت روشنایی یا سطح خاکستری تصویر در آن نقطه نامیده می شود، هنگامی که x,y م مقادیر شدت روشنایی همگی کمیتهای محدود گسسته باشند، به آن تصویر دیجیتال گفته میشود.

اگر تصویری آنالوگ باشد، می توان آن را به تصویر دیجیتال تبدیل کرد. در دیجیتال کردن تصویر دو مرحله اساسی انجام می شود: کوانتیزه‌سازی مکانی و کوانتیزه‌سازی شدت روشنایی.

مفهوم عبارت کوانتیزه‌سازی این است که یک متغیر نمیتواند هر مقداری بگیرد، و تنها مقادیر خاصی میتواند داشته باشد. برای مثل تنها مقادیر صحیح را میتواند داشته باشد و اعداد اعشاری بین این اعداد را نمی تواند بگیرد.

کوانتیزه سازی مکانی

هنگام دیجیتال کردن تصویر، به یک شیء نوری تابیده می شود و نور توسط سطح شیء بازتاب می شود. نور بازتابی توسط فتودیود ثبت شده و به صورت رستری در فضای دوبعدی ذخیره می‌شوند، به این فرایند نمونه‌بردای مکانی و یا کوانتیزه‌سازی مکانی گفته می‌شود. هرچقدر تعداد نمونه ها بیشتر باشد، تصویر دقیقتری از منظره یا شیء گرفته خواهد شد، اما این باعث می شود که فضای زیادی برای ذخیره تصویر دیجیتال در کامپیوتر نیاز داشته باشیم، نرخی که نمونه ها ثبت میشوند، نرخ نمونه بردای یا فرکانس نمونه برداری (fs) می نامند و با تعداد نمونه‌هایی که در هر واحد فاصله، در هر سانتی متر یا در هر اینچ (dpi) ثبت می‌شوند، توصیف می شود. فاصله بین نمونه ها، d، برابر با 1/fs می باشد. در تصویر روبرو نحوه کوانتیزه سازی مکانی و زمانی نشان داده شده است.

فرکانس نمونه برداری معمولا در هر دو جهت یکسان است. اطراف هر نقطه در تصویر آنالوگ یک ناحیه مربعی شکل در نظر گرفته می شود، و این منطقه به یک پیکسل در تصویر دیجیتال تبدیل می‌شود. فرکانس نمونه برداری فاصله بین نمونه ها را مشخص می کند.

در تصویر دیجیتال، فاصله x و y دیگر پیوسته نیست، بلکه مقادیر گسسته ای دارند. هرچقدر اندازه پیکسلها بزرگ باشد، رزولوشن مکانی (در ادامه توضیح داده ایم) تصویر کم خواهد شد و تصویر مناسبی که جزئیات را نشان دهد را نخواهیم داشت. اگر اندازه پیکسلها کم باشد، رزولوشن مکانی تصویر افزایش خواهد یافت اما تا یک زمانی که اندازه پیکسلها از اندازه رزولوشن مکانی مسیر بینایی انسان کوچکتر نباشد.

اما سوالی که اینجا مطرح می شود این است که فاصله بین نمونه ها چقدر باشد تا ما بتوانیم یک تصویر دقیق با جزئیات کافی ثبت کنیم؟ تمام تصاویر حاوی ترکیبی از جزئیات هستند، برخی از اندازه کوچک و برخی در اندازه بزرگ هستند. یک ریاضیدان فرانسوری به نام فوریر متوجه شد که تمام الگوهای تکراری را میتوان توسط یک سری الگوهای سینوسی و کسینوسی با فرکانسهای مختلف نمایش داد.

فرکانس های بالا حاوی اطلاعات مربوط به جزئیات تصویر مثل لبه‌ها تیز، می باشند، و فرکانسهای پایین مناطقی از تصویر که تغییرات کمی دارند می باشند. برای اینکه بتوانیم تصویری ثبت کنیم تا به اندازه کافی حاوی اطلاعات مربوط به جزئیات باشد، نیاز است با فرکانسی تصویر را نمونه برداری کنیم که این فرکانس باید حداقل دوبرابر حداکثر فرکانس موجود در تصویر باشد. این قضیه به تئوری نمونه برداری نایکوئیست معروف است.

نمونه برداری نایکوئیست

برای اینکه بتوانیم یک الگوی متناوب را بازسازی کنیم، حداقل به دو نمونه در هر چرخه نیاز داریم. اگر تعداد کمتری در هرچه نمونه برداری شود، الگوی ساخته شده، فرکانس کمتری نسبت به مقدار واقعی خود خواهد داشت. فرکانس نایکوئیستfN، نصف فرکانس نمونه برداری است بنابراین فرکانس نایکوئیست مساوی یا بیشتر از بیشترین فرکانس موجود در الگو می باشد.

نایکوئیست

مفهوم aliasing

اگر یک تصویر کوانتیزه شده مکانی، اطلاعاتی در فرکانسهای بیشتر از فرکانس نایکوئیست داشته باشند، این تصویر درست نمونه برداری نشده است و اطلاعات فرکانس بالای تصویر با فرکانسهای پایین نمایش داده خواهند شد، به این پدیده Aliasing گفته می شود. فرکانس aliasing برابر با رابطه زیر است:

aliasing

برای مثال، اگر فرکانس نمونه برداری یک تصویر 10mm−1 باشد، یعنی 10 نمونه در هر میلمیتر ثبت شوند، در این صورت فرکانس نایکوئیست برابر با 5mm−1 می باشد. یک نمونه با فرکانس مکانی 7mm−1 بدرستی نمونه برداری نخواهد شد و پدیده aliasing اتفاق خواهد افتاد.

در یک تصویر پیچیده اگر فرکانس نمونه برداری به اندازه کافی بزرگ نباشد، در فرکانس‌های بالا aliasing اتفاق خواهد افتاد و در تصویر نمونه‌برداری شده، اطلاعات فرکانس بالا به صورت aliased در فرکانسهای پایین ظاهر خواهند شد.

تئوری نمونه برداری را می توان به جای عبارت فرکانس مکانی از عبارت فاصله استفاده کرد. فاصله نمونه برداری،d (اندازه پیکسل)، باید کوچکتر یا مساوی نصف معکوس حداکثر فرکانس مکانی در تصویر باشد. بنابراین برای اینکه یک تصویر دقیق دیجیتال بسازیم باید فاصله نمونه برداری حداقل نصف اندازه کوچکترین عنصر موجود در تصویر باشد.

تئوری نمونه برداری

پدیده ی aliasing

در عمل تمامی سیستمها دیجیتال برای اینکه بتوانند تصویر با حجم پایین تری تولید کنند، فرکانس نمونه برداری آنها یک مقدار کمتر از مقدار بهینه است. و این باعث می شود که در فرکانسهای بالا تاحدودی alasing داشته باشند، و برای اینکه بتوان اثر این پدیده را کم کرد یک روش این است که تصویر آنالوگ را قبل از اینکه به دیجیتال تبدیل کنیم، smooth کنیم، که با این کار در واقع ما مولفه‌های فرکانس بالا را حذف می کنیم. با اینکار تا حدود از وقوع این پدیده جلوگیری می کنیم، ولی بهترین راه نمونه برداری با فرکانس های بالا می باشد.

در تصویر زیر(سمت چپ) تصویر اثر Miore مشاهده می‌شود و تصویر سمت راست اثر smoothing را نشان می‌دهد، اما بهترین گزینه این است که تصویربرداری دوباره با یک فرکانس بالا انجام شود تا تصویر دقیق‌تری ثبت شود.

اثر Miore و اثر smoothing

کوانتیزه کردن شدت روشنایی

پیکسل‌های گسسته شکل یافته اطراف هر موقعیت مکانی در تصویر آنالوگ، یک تصویری که کونتیزه‌سازی مکانی شده، را تشکیل می دهند، اما مقادیر هر پیکسل هنوز کوانتیزه نشده است. جهت ایجاد یک تصویر دیجیتال، لازم است که مقادیر پیوسته به مقادیر گسسته تبدیل شوند. همانطور که قبلا ذکر کردیم، کونتیزه‌سازی شدت روشنایی تصویر، مرحله دوم در دیجیتال کردن تصویر است و بعد از کوانتیزه‌سازی مکانی انجام می‌شود.

کوانتیزه کردن شدت روشنایی

بسیاری از تصاویر دیجیتال عمق 8 بیتی دارند، یعنی برای هر پیکسل 8 بیت حافظه اختصاص می دهند، در نتیجه هر پیکسل حداکثر 256 سطح شدت روشنایی می تواند داشته باشد. در زمان کوانتیزه سازی شدت روشنایی، هر مقدار پیکسل باید به یکی از این 256 سطح شدت روشنایی تبدیل شود. یعنی مقدار هر پیکسل با نزدیکترین مقدار بین 0-255 جایگزین می شود. تصویر آنالوگ بعد از طی مراحل کوانتیزه‌سازی مکانی و شدت روشنایی به تصویر دیجیتال تبدیل می شود.

3.انواع تصویر

دو نوع تصویر وجود دارد: تصویر رستری و تصویر برداری. تصویر رستری توسط نرم افزاری‌های مبتنی بر پیکسل یا با استفاده از اسکنر و دوربین ایجاد می‌شوند. و بسیار رایج هستند(از قبیل jpeg, png, gif) و به طور گسترده در وب استفاده می شوند. تصاویر برداری توسط نرم افزارهای برداری ایجاد می شوند و برای تصاویری که روی محصولات فیزیکی اعمال می‌شوند رایج هستند.

تصویر رستری و برداری

فرق بین تصویر رستری و تصویر برداری؟

مدل برداری (vector) :

در مدل برداری عوارض جهان واقعی بوسیله عناصر هندسی مثل نقطه، خط و سطح، نمایش داده می شوند. ذخیره داده در مدل برداری نیز به دو صورت منظم و نامنظم صورت میگیرد.

مدل رستری (raster):

رستر شامل مجموعه ای از نقاط یا سلولهایی است که عوارض زمین را در یک شبکه منظم می پوشاند. به طوریکه کل سطح گرافیکی نقشه به شبکه ای از سلولهای ریز و منظم که پیکسل نیز نامیده می شود، تقسیم میشود. پیکسل، یک موقعیت در سطح زمین است و فرمت رستری، یک آرایه m*n ازاین پیکسل هاست. هر لایه مجموعه ای از این پیکسل ها و مقادیر مربوط به آنهاست.

تصویر رستری و برداری

تفاوت تصویر رستری و برداری

براساس خط، منحنی ها (محاسبات ریاضیاتی که اشکال را تشکیل می دهند)	براساس پیکسل
نرم افزارهای برداری برای طراحی لوگو، نقشه های فنی و برای تصاویری که روی محصولات کشیده میشوند، بهترین هستند	نرم افزارهای رستری برای ویرایش تصاویر و ایجاد تصاویر با رنگهای پیوسته با ترکیب رنگهای نرم بهترین هستند
بدون اینکه کیفیت خود را از دست بدهند در به هر اندازه ای میتواند تغییر مقیاس کرد.	به طور بهنه نمیتوان سایز تصویر را تغییر داد. تصاویر باید در اندازه های مطلوب ایجاد یا اسکن شوند.
ابعاد بالاو تصاویر با جزئیات بالا معادل با اندازه بالا است	به روزلوشن وابسته نیست در هر اندازه ای میتوان پرینت گرفت
پرینت با تعداد رنگ کم سخت است	تعداد رنگها را برای کاهش هزینه ها میتوان کم کرد

4.پیکسل چیست؟

کوچکترین عضو یک تصویر رستری است. هر تصویر رستری دیجیتال از تعداد محدودی پیکسل تشکیل شده است. در تصاویر دیجیتالی پیکسل ( Pixel) کوچکترین جزء ساختاری (element) یک تصویر را گویند. پیکسل را بعضاً در مباحث مربوط به گرافیک و تصویر، نقطه نامیده و آن را کوچکترین نقطه تشکیل دهنده تصویر نیز می‌خوانند.

نمونه زیر، تصویری را نمایش می‌دهد (سمت چپ) که بخشی از آن به میزان قابل توجهی بزرگ شده (سمت راست). در این بخش، پیکسل‌های تشکیل‌دهنده تصویر به شکل مکعب‌های کوچکی قابل مشاهده‌اند.

مفهوم پیکسل

5.پردازش تصویر دیجیتال چیست؟

پردازش تصویر، به استفاده از الگوریتهای کامپیوتری جهت اعمال تغییرات روی تصویر گفته می شود. در مقایسه با پردازش تصویر آنالوگ، روش‌های مبتنی بر پردازش تصویر دیجیتال دارای مزیت‌های متعددی هستند که از آن جمله می‌توان به توانایی استفاده از الگوریتم‌های متعدد و پیچیده و همچنین عدم افزودن نویز در هنگام پردازش تصویر اشاره کرد.

در پردازش تصویر، تسکهای زیر را میتوان روی تصاویر انجام دهیم:

کلاسبندی
ناحیه بندی
تجزیه و تحلیل سیگنال چندگانه
شناسایی الگو
تبدیلات

رزلوشون تصویر رستری

از این به بعد منظورمان از تصویر، تصویر رستری هست و تمام مباحثی که مطرح میکنیم برروی تصاویر رستری اعمال خواهیم کرد. در زیر تعاریف مختلفی از رزولوشن براساس منابع مختلف قرار می دهیم. مطالعه کننده برای اطلاعات بیشتر میتواند به منبع مورد نظر رفته و به طور کامل مطالب را بخواند.

رزولوشن به تعداد پیسکلهای موجود در یک تصویر برمیگردد و رزولوشن بعضی مواقع با ارتفاع و عرض یک تصوزر و یا تعداد پیکسلهای کل تصویر تشخیص داده می شود.

روزلوشن مکانی اندازه کوچکترین جزء یک تصویر است. به طور کمی رزولوشن مکانی را به شکلهای مختلف میتوان بیان کرد. رزولوشن با معیارهای مختلفی اندازه گیری میشود، جفتهای خط در واحد فاصله، نقطه ها(پیکسلها) در واحد فاصله مرسوم ترین روشهای اندازه گیری هستند

وضوح تصویر، یا قدرت تفکیک‌پذیری تصویر ( Image resolution)

در علوم تصویری به توانایی یک سیستم برای متمایزسازی جزئیات یک تصویر در یک سیگنال تصویری را گویند. اغلب این نوع رزولوشن به بزرگی یا کوچکی پیکسل‌های تصویر بستگی دارد، و می‌توان مقدار تفکیک‌پذیری تصویر را با یکای جفت خط بر واحد طول سنجید.

رزولوشن پیکسلی

اگر معیار ما برای رزولوشن، تعداد پیکسلها باشد، در تصویر زیر به راحتی میتوان مشاهده کرد که هرچقدر تعداد پیکسلها بیشتر باشد تصویر وضوح بیشتری خواهد داشت. ولی ممکن است تصویر تعداد پیکسلهای زیادی داشته باشد ولی رزولوشن مکانی خوبی نداشته باشد.

رزولوشن پیکسلی

رزولوشن مکانی

در رادیولوژی به توانایی سیستم تصویربرداری در جدا کردن دو تا شی گفته می شود. تکنکیهای رزولوشن مکانی پایین در تفکیک دو شی ای که خیلی بهم نزدیک هستند، ناتوان هستند. و نمیتوانند بین دو شی تفکیکی قائل شوند. اینکه تا چه حد میتوان دو خط را در یک تصویر از هم تفکیک کرد، روزلوشن مکانی تعیین می کند، و به خواص سیستم تصویر برداری وابسته است نه به تعداد پیسکلهای تصویر. در زیر تصویر سمت چپ با اینکه تعداد پیکسلهای بیشتری نسبت به تصویر سمت راست دارد، ولی کیفیت و وضوج کمتری دارد. بنابراین تعداد پیکسلها شرط کافی برای محاسبه رزولوشن نیمتواند باشد. ولی شرط لازم است.

رزولوشن مکانی

رزولوشن زمانی

به دقت اندازه گیری برحسب زمان برمیگردد. یک ویدیو از فریمهای مختلفی تشکیل شده است. هر چقدر تعداد فریمها بیشتر باشد، رزولوشن زمانی بالایی خواهیم داشت و حرکتهای اشیاء متحرک را بهتر نمایش خواهیم داد. التبه باید رزولوشن زمانی از سرعت حرکت اشیائ بیشتر باشد تا بتواند حرکات را دنبال کند. اگر تعداد فریمها خیلی بالا باشد، تصویر آهسته ای مشاهده خواهیم کرد، همانند صحنه های آهسته در فوتبال یک نکته جالب اینکه اگه رزولوشن زمانی با سرعت حرکت اشیائ یکی باشد، تصویر ایستایی خواهیم دید. زیرا تغییرات نمیتوانیم ببینیم.

موفق باشید