مقدمه: مجموعه عملیات و روش هایی که برای کاهش عیوب و افزایش کیفیت ظاهری تصویر مورد استفاده قرار می گیرد، پردازش تصویر نامیده می شود.حوزه های مختلف پردازش تصویر را می توان شامل بهبود تصاویر مختلف پزشکی مانند آشکار سازی تومور های مغز یا پهنای رگ های خونی و ...
، افزایش کیفیت تصاویر حاصل از ادوات نمایشی مانند تصاویر تلویزیونی و ویدیویی، ارتقا متون و شکل های مخابره شده در رسانه های مختلف مانند شبکه و فاکس و همچنین بهبود کیفیت روش های کنترل توسط بینایی ماشین و درک واقعی تر مناظر توسط ربات ها دانست.
اگرچه حوزه ی کار با تصاویر بسیار گسترده است ولی عموما محدوده ی مورد توجه در چهار زمینه ی بهبود کیفیت ، بازسازی تصاویر مختل شده، فشرده سازی تصویر و درک تصویر توسط ماشین متمرکز می گردد.
در اینجا سه تکنیک اول بررسی خواهد شد.
از آنجایی که برای کار روی تصاویر با پیکسل ها سروکار داریم و هر پیکسل نشان دهنده ی یک عنصر از یک آرایه ی دوبعدی است، کار روی تصاویر همواره با کار روی ماتریس ها عجین شده است.
ماتریس اسپارس یا ماتریس خلوت ، ماتریسی است که درایه های صفر آن زیاد باشد و در نتیجه ذخیره ی عناصر صفر مقرون به صرفه نیست و همواره سعی در کاهش ذخیره ی این عناصر است تا بتوان عملیات ماتریسی را سریع تر انجام داد.
در کار با تصویر با اینگونه ماتریس ها زیاد برخورد می کنیم .
در این پروژه ابتدا تکنیک ها و روش های مختلف پردازش تصویر را معرفی می کنیم.
در بخش بعد الگوریتم های موازی را شرح می دهیم که در GPU کاربرد دارند و با معماری موازی آشنا می گردیم.
در بخش سوم برخی از الگوریتم های مربوط به ماتریس خلوت را مورد بررسی قرار می دهیم و در نهایت در بخش چهارم کاربرد این ماتریس ها را در پردازش تصویر معرفی خواهیم نمود.
و در آخر، پیاده سازی یکی از ا لگوریتم های مبحث فشرده سازی را روی تصاویر باینری، انجام خواهیم داد و با یکی از الگوریتم های فشرده سازی مربوط به تصاویر باینری به نام Run length coding مقایسه خواهیم نمود.
بخش اول روش های پردازش تصویر توجه و روی آوردن به روش های پردازش تصاویر به اوایل سال 1920 باز می گردد، زمانی که عکس های دیجیتال برای اولین بار توسط کابل های زیردریایی از نیویورک به لندن فرستاده شد.با این حال، کاربرد مفهوم پردازش تصویر تا اواسط 1960 گسترش وپیشرفت چندانی نیافت.
در 1960 بود که کامپیوتر های نسل سوم دیجیتال به بازار آمد که می توانست سرعت و حافظه بالای مورد نیاز برای پیاده سازی الگوریتم های پردازش تصویر رافراهم کند.
از آن پس، تجربه در این زمینه گسترش یافت.
مطالعات و تحقیقات زیادی در این موضوع در علوم مختلف از جمله : مهندسی، علوم کامپیوتر، علوم اطلاعات، فیزیک، شیمی، بیولوژی و داروسازی انجام شد.
نتیجه ی این تلاش ها در تکنیک های پردازش تصویر در مسائل مختلف - از بهبود کیفیت و بازیابی تصاویر گرفته تا پردازش اثر انگشت در مسائل تجاری – خود رانشان داد.
در این فصل بر آنیم که تکنیک ها و روش های مختلف پردازش تصویر را معرفی و بررسی کنیم.
اما پیش از پرداختن به روش ها ، برخی تعاریف پایه را ذکر خواهیم کرد.
1-1 تصویر دیجیتالی: تصویر به عنوان ترجمه image نشانگر یک شکل دو بعدی می باشد که توسط یک وسیله ی حساس به نور مانند دوربین به وجود آمده باشد.
اما picture (عکس) نشانگر هر گونه شکل دو بعدی مانند یک تابلوی نقاشی و یا یک دست نوشته است.
مقصود از تصویر دیجیتال ، digital image می باشد.
یک تصویر را می توان توسط تابع دوبعدی f(x,y) نشان داد که در آن x و y را مختصات مکانی و مقدار f در هر نقطه را شدت روشنایی تصویر درآن نقطه می نامند.
اصطلاح سطح خاکستری نیز به شدت روشنایی تصاویر مونوکروم (monochrome) اطلاق میشود .
تصاویر رنگی نیز از تعدادی تصویر دوبعدی تشکیل می شود.
زمانی که مقادیر x و y و مقدار f(x,y) با مقادیر گسسته و محدود بیان شوند ، تصویر را یک تصویر دیجیتالی می نامند.
دیجیتال کردن مقادیر x و y را Sampling و دیجیتال کردن مقدار f(x,y) را quantization گویند.
برای نمایش یک تصویر M * N از یک آرایه دو بعدی ( ماتریس) که M سطر و N ستون دارد استفاده می کنیم .
مقدار هر عنصر از آرایه نشان دهنده ی شدت روشنایی تصویر در آن نقطه است.
در تمام توابعی که پیاده سازی می شود ، هر عنصر آرایه یک مقدار 8 بیتی است که می تواند مقداری بین 0 و 255 داشته باشد.
مقدار صفر نشان دهنده ی رنگ تیره ( سیاه ) و مقدار 255 نشان دهنده رنگ روشن ( سفید ) است.
به عنوان مثال تصویر زیر که سایز آن 265×288 است از یک ماتریس که دارای 288 سطر و 265 ستون است برای نمایش تصویر استفاده می کند شکل 1-1 هر پیکسل از این تصویر نیز مقداری بین 0 و 255 دارد .
نقاط روشن مقادیری نزدیک به 255 و نقاط تیره مقادیر نزدیک به 0 دارد.
همه ی توابع پردازش تصویر از این مقادیر استفاده کرده و اعمال لازم را بر روی تصویر انجام می دهند.
2-1 تعریف رنگ و ویژگی های آن: برای ارایه ی یک تعریف صحیح از رنگ باید علاوه بر پدیده های فیزیکی و قوانین حاکم بر آن، نتیجه ی حاصل از این پدیده های فیزیکی که ذهنی می باشد را نیز در نظر گرفت.
از دیدگاه فیزیکی ایجاد رنگ به 3 عامل بستگی دارد که عبارتند از : 1)منبع نوری که جسم را روشن می کند.
2)جسم که به وسیله منع نوری روشن می شود.
3)چشم و مغز که رنگ را دریافت می کند.
اگرچه بهترین دریافت کننده ای که می تواند رنگ را بسنجد و در مورد آن دریک لحظه قضاوت نماید چشم و مغز انسان می باشد، اما به جز چشم نور یاب های دیگری مانند فتو تیوپها و فتوسلها نیز در سنجش رنگ توسط دستگاه ها به کار می روند.
جهت ایجاد رنگ های متفاوت، منبع نوری باید علاوه بر انرژی مناسب، توزیع کافی در طیف مریی بین 380 تا 760 نانومتر را داشته باشد و مشاهده کننده نیز از بینایی رنگی معمول و نرمالی برخوردار باشد.
به علاوه محیط مشاهده نیز از فضای مناسبی برای تشخیص جسم برخوردار باشد.
بدیهی است که با تغییر هر یک از سه عامل اصلی ایجاد کننده ی رنگ یعنی منبع نوری، جسم و مشاهده کننده تغییراتی دررنگ ظاهر شده ایجاد خواهد شد.
به سیستم هایی که بیان و تنظیم رنگ را ارایه می دهند " فضای رنگ " گویند.
در ادامه به تعریف چند سیستم فضای رنگ رایج می پردازیم.
1-2-1 فضای رنگ HSV : به منظور بررسی رفتار یک انسان در موردرنگ و تقسیم بندی آنان فرض می گردد که شخصی که هیچ تجربه قبلی راجع به رنگ ندارد قصد دارد سنگ هایی با رنگ های مختلف را طبقه بندی نموده و از لحاظ رنگ آن ها را منظم و نامگذاری نماید.
فرض می شود اولین کار شخص جدا کردن سنگ های رنگی از سنگ های غیر رنگی مانند سیاه و سفید و خاکستری باشد.
در میان سنگ های غیر رنگی می توان ردیف منطقی از رنگ های سفید و خاکستری روشن و خاکستری تیره و سیاه ایجاد نمود و یا به عبارت دیگر در میزان روشنایی آن ها تفکیک قایل شد.
نام دیگر آن کیفیت ارزش* می باشد.
در مورد سنگ های رنگی می توان آن ها را ابتدا از نظر ته رنگ یا فام** از یکدیگر جدا ساخت.
یعنی آنها را به رنگ های قرمز و آبی و زرد و نارنجی و غیره تقسیم بندی نمود و در هر طبقه ی رنگی نیز مجددا آنها را در دسته های کوچکتری مانند قرمز ته آبی و یا ته زرد و...
قرار داد.
علاوه بر آن هر سری از رنگ ها با فام مشخص را می توان دوباره بنا به کم رنگی مانند سنگ های آکروماتیک مجددا تقسیم بندی کرد.
مثلا یک سری سنگ های با فام قرمز می تواند از صورتی کمرنگ تا قرمز گیلاسی تقسیم بندی شود.
دراین صورت هر سنگ قرمز دراین سری از لحاظ کمرنگی می تواند یک مشابه در سری سنگ های خاکستری آکروماتیک داشته باشد.
علاوه بر دو مولفه ی ( ارزش و فام) که شخص در تفکیک رنگ ها انتخاب نموده، مولفه دیگری نیز برای تشخیص موجود است.
* value ** Hue مثلا اگر یک سنگ قرمز آجری با یک سنگ درخشان قرمز گوجه فرنگی مقایسه شود اختلافی در فام و ارزش( روشنایی) مشاهده نمی شود در واقع هیچکدام زردتر یا آبی تر از دیگری نیست و به علاوه از لحاظ روشنایی نیز تفاوتی وجود ندارد و با یک خاکستری در سری آکروماتیک معادلند.
ولی هرکسی تفاوت آن ها را تشخیص می دهد.
مولفه سوم در اینجا مشخص می شود و آن خلوص رنگیا اشباع رنگ* نام دارد.
در شکل 2-1 سیستم رنگ یا فضای رنگ HSV نمایش داده شده که بر اساس همین سه مولفه تعریف می شود.
* saturation شکل 2-1 شکل 3-1 شکل 4-1 2-2-1 فضای رنگ RGB: در این سیستم فرض می شود که هررنگ در یک فضای سه بعدی از سه مولفه رنگی مستقل قرمز ، سبز و آبی تشکیل شده است.
فضای رنگ RGB متداول ترین فضای رنگ به کار گرفته شده در پردازش تصویر می باشد.
دوربین های رنگی ، پویشگرها و صفحه های نمایشی در اغلب موارد دارای سیگنال های ورودی و خروجی تعریف شده در این فضای رنگ می باشند.
مقادیر خاکستری در روی قطر اصلی تعریف می شود که سیاه در مختصات R=0,G=0,B=0 و سفید در نقطه ای با مختصات R=G=B=max تعریف می شود که max=255 و دلیل آن استفاده از 1 بایت برای هر رنگ است.
اشکال عمده ی این فضا، همبستگی زیاد بین مولفه های رنگی است.
به نحوی که همبستگی R-B حدود 78/0 و برای R-G حدود 94/0 می باشد.
شکل5-1 3-1پردازش تصویر (Image Processing ) پردازش تصاویر امروزه بیشتر به موضوع پردازش تصویر دیجیتال گفته میشود که شاخهای از دانش رایانه است که با پردازش سیگنال دیجیتال که نماینده تصاویر برداشته شده با دوربین دیجیتال یا پویش شده توسط پویشگر هستند سر و کار دارد.
پردازش تصاویر دارای دو شاخه عمدهٔ بهبود تصاویر و بینایی ماشین است.
بهبود تصاویر دربرگیرندهٔ روش هایی چون استفاده از فیلتر محوکننده و افزایش تضاد برای بهتر کردن کیفیت دیداری تصاویر و اطمینان از نمایش درست آنها در محیط مقصد (مانند چاپگر یا نمایشگر رایانه) است، در حالی که بینایی ماشین به روش هایی میپردازد که به کمک آنها میتوان معنی و محتوای تصاویر را درک کرد تا از آنها در کارهایی چون رباتیک استفاده شود.
در واقع اگر a(m,n) یک پیکسل در تصویر باشد ، این پیکسل بعد از عملیات پردازش به b(m,n) تبدیل خواهد شد.
گذشته از روش های ارتباط دو تصویر قبل و بعد از پردازش، فرآیند پردازش در دو سطح کلی مقدماتی و پیشرفته صورت می پذیرد.
در سطح مقدماتی ، هدف به دست آوردن اطلاعات تصویر و بهبود ظاهر آن توسط انسان می باشد.
و شامل حذف نویز، جداسازی اجسام از زمینه ی تصویر، رمزگذاری و فشرده سازی می باشد.
سطح پیشرفته استفاده از ا طلاعات تصویرجهت استفاده در کامپیوتر می باشد که به بینایی ماشین تعبیر می شود.
دراینجا به تکنیک های مختلف پردازش تصاویر در سطح مقدماتی خواهیم پرداخت .
1-3-1 بهبود کیفیت تصویر( image enhancement ) : بهبود کیفیت ظاهری تصویر از مباحث مهم در پردازش تصویر می باشد که به منظور کار در هر گیرنده ای می تواند مورد استفاده قرار گیرد.
مواقعی پیش می آید که جزییات تصویر به دلیل نورپردازی نا مناسب یا اشکالات مختلف نا شی از تصویر برداری نامناسب کیفیت ظاهری مطلوبی ندارد که در این صورت می توان با استفاده از روش های مختلف پردازش، آن ها را بهبود بخشید.
به علاوه ممکن است که در اثر مخابره ی تصویر، نویز مختصری بر روی آن تاثیر گذاشته باشد که در این صورت باید توان نویز را کاهش داد.
به طور کلی می توان روش های بهبود ظاهر تصویر را به دو گروه تقسیم کرد : الف: روشهایی که مبتنی بر مقادیر روشنایی اصلی تصویر بوده و پردازش درحوزه مکان* صورت می گیرد.
ب:روش هایی که مبتنی بر تبدیلات تصویر می باشد و پردازش در حوزه تبدیل** (مانند فرکانس) صورت پذیرفته و سپس با تبدیل معکوس تصویر قابل رؤیت و دریافت است.
1-1-3-1بهبود کیفیت تصویر در حوزه مکان : اصطلاح حوزه مکان به کل پیکسل های تشکیل دهنده ی تصویر اشاره دارد و روش های حوزه مکان روش هایی هستند که به طور مستقیم بر روی پیکسل ها کار می کنند.
توابع پردازش تصویر در حوزه مکان را می توان به صورت: g(x,y)=T[f(x,y)] بیان کرد که f(x,y) مربوط به تصویر ورودی و g(x,y) مربوط به پیکسل متنا ظر آن در تصویر پردازش شده است وT یک عملگر روی f است که در یک همسایگی پیکسل (x,y) تعریف می شود.
* spatial domain ** frequency domain همانطور که درشکل 6-1 نشان داده شده، روش تعریف همسایگی حول (x,y) استفاده از زیر تصویر های کوچک مربعی یا مستطیلی به مرکز (x,y) می باشد.
مرکز زیر تصویر مثلا با شروع از گوشه چپ بالای تصویر پیکسل به پیکسل جا به جا می شود و در هر نقطه (x,y) با استفاده از T مقدار g تعیین می شود.
شکل6-1 تکنیک های بهبود تصویر را با بررسی توابع تبدیل سطوح خاکستری که مبتنی بر شدت روشنایی یک نقطه هستند شروع می کنیم.
تابع تبدیل این توابع می تواندخطی یا غیر خطی باشد.
نکته مهم دراین روش ها که روش نقطه ای نامیده می شوند آن است که مقدار روشنایی هر پیکسل فقط و فقط بستگی به روشنایی پیکسل متنا ظر در تصویر اصلی دارد.
در ادامه ی این بحث شدت روشنایی پیکسل ها قبل و بعد از پردازش را به ترتیب با r و s نمایش می دهیم.
برای آشنایی با سطوح خاکستری شکل 7-1 را در نظر بگیرید.
این شکل سه نوع اصلی از توابع که اغلب برای بهبود تصویر به کار می روند را نشان می دهد.
این توابع عبارتند از : خطی (تبدیل های منفی و همانی ) لگاریتمی(تبدیل های لگاریتم و لگاریتم معکوس) نمایی (تبدیلات توان n ام و ریشه n ام) شکل7-1 تابع همانی تابع کم اهمیتی است که در آن شدت روشنایی خروجی با روشنایی ورودی برابر است و تنها برای کامل بودن شکل آورده شده است.
قرینه ی یک تصویر با سطوح خاکستری در محدوده [0,L-1] با استفاده از تبدیل منفی نشان داده شده در شکل، با رابطه S=L-1-r به دست می آید.
هدف این است که ترتیب سیاه به سفید عکس شود طوری که با افزایش شدت روشنایی ورودی روشنایی تصویر خروجی کاهش یابد.
این تبدیلات بیشتر در تصاویر پزشکی کاربرد دارد.
فرم کلی تبدیلات لگاریتمی نشان داده شده در شکل به صورت S=c log (1+r) است که c ثابت مقیاس بوده و فرض می شود r ≥ 0 .
با استفاده از این تبدیل محدوده تغییرات روشنایی به سوی مقادیر روشن تر فشرده می گردد.
این روش برای واضح ساختن تصاویر تاریک می تواند مناسب باشد.
تبدیل نمایی دارای فرم کلی s=crγ می باشد که ثابت های c و γ مثبت هستند.
در این روش مقادیر روشنای بیشتر به سمت سطوح تاریک پیش می رود.
یکی دیگر از تبدیلات، تبدیلات هیستوگرام است که برا ی توضیح آن لازم است ابتدا تعریفی از هیستوگرام داشته باشیم.
هیستوگرام : تعداد نقاطی از تصویر که روشنایی یکسانی دارند را نمایش می هد.
هر پیکسل از تصویر دارای روشنایی ri می باشد.
جهت رسم هیستوگرام ، تعداد تمام پیکسل های دارای روشنایی ri شمرده می شود که با ki نشان داده می شود.
سپس مقادیر kiبرحسب ri رسم می شود.
به شکل حاصل هیستگرام گویند.
معمولا هیستوگرام به صورت میله ای رسم می شود.
ولی می توان فقط پوش آن را در نظر گرفت و به طور پیوسته رسم نمود.
در صورتیکه مقادیر ki بر تعداد کل نقاط موجود در تصویر تقسیم شود، مقادیر آن متناسب با تابع توزیع احتمال یک متغیر تصادفی خواهد بود.
چگونگی توزیع هیستوگرام می تواند نشانگر توصیف کلی از سطوح روشنایی تصویر باشد.
برای چشم بشر، بهترین رؤیت زمانی اتفاق می افتد که هیستوگرام دارای توزیع یکنواخت باشد.
در شکل 8-1 چند تصویر مختلف و هیستوگرام آن نشان داده شده است.
شکل8-1 همانطور که گفته شد تغییر هیستوگرام یکی دیگر از روش های بهبود تصاویر در حوزه مکان است.
در این روش، هدف یافتن توابع انتقال مناسب به منظور تغییر هیستوگرام تصویر در جهت مطلوب می باشد، هرچند باید همواره نکات زیر را مد نظر داشت: محدوده ی تغییرات رو شنایی همچنان ثابت باقی بماند.
ترتیب نقاط تصویر جدید مشابه تصویر اصلی بماند.
یعنی نقطه ای که تاریکترین بوده همچنان تاریکترین بماند.
نکات فوق سبب می شود که رعایت شرایط زیر برای تابع انتقال s=T(r) ضروری باشد: الف- رابطه ی انتقال باید دارای خاصیت تابع باشد، یعنی به ازای هر r، فقط و فقط یک مقدار s محاسبه گردد.
هر چند لزومی ندارد که تابع یک به یک نیز باشد.
ب- تابع انتقال T(x) در فاصله ی 0 ≤ r≤ L-1 به طور یکنوا فزایش یابد چنانکه: r1≤ r2 T(r1) ≤ T(r2) در اثر این شرط ترتیب روشنایی نقاط در تصویر اصلی و جدید یکسان خواهد بود.
ج- اگر≤ r 0 ≤s=T(r) همانطور که ذکر شد مقادیر تابع هیستوگرام می تواند شکل تابع احتمال را داشته باشد.
پس اگر تعداد نقاط با روشنایی ri ، برابر i k باشد، در یک تصویر N*N می توان تابع چگالی احتمال را به صورت رابطه زیر تعریف کرد: ρr (ri) = ki /N2 , 0 ≤ ri ≤ L 0 ≤ i ≤M که M تعداد سطوح روشنایی متغیر گسسته ی r می باشد.
در نتیجه مساله تغییر هیستوگرام ، به تغییر تابع چگالی احتمال منجر می گردد.
در روش یکسان سازی هیستوگرام ، هدف تغییر هیستوگرام تصویر اصلی به شکل یک هیستوگرام با توزیع یکنواخت می باشد و تابع انتقال آن به صورت : si = T (ri) = ∑ij=1 kj / N2 = ∑ij=1 ρr (rj) 0 ≤ si ≤ L 0 ≤ i ≤M که با رابطه فوق ، تابع T(r) در شرایط ذکر شده ، صدق می کند.
روش فوق، روش متداول بهبود کیفیت تصویر می باشد.
روشن ترین نقطه ی تصویر به بالاترین سطح روشنایی ممکن تغییر می یابد و نتیجه ی آن تقریب هیستوگرام جدید به تابع یکنواخت می باشد.
درشکل 9-1 چند نمونه ی مختلف از یک تصویر و تصاویر یکسان ساز شده ی آن به همراه هیستوگرام های مربوطه نشان داده شده است.
شکل 9-1 عملیات حسابی- منطقی به روی تصاویر به شیوه ی پیکسل به پیکسل بین 2 یا چند تصویر اجرا می شود.
(البته به جز عملگر NOT که تنها روی یک تصویر اعمال می شود.) به عنوان مثال تفاضل 2 تصویر، تصویر جدیدی را ایجاد می کند که پیکسلی که در نقطه ی (x,y) قرار دارد حاصل اختلاف پیکسل های واقع در همان مکان درتصاویر اولیه است.
همانطور که می دانید AND,OR,NOT قادر به پیاده سازی هر عمل منطقی می باشند پس پیاده سازی همین سه عمل منطقی کافی است.
همانطور که قبلا گفتیم در برخی از روش ها مقدار روشنایی جدید پیکسل g(x,y) به مقدار روشنایی f(x,y) و پیکسل های همسایه ی آن بستگی دارد.
این زیر تصویر را ما سک یا پنجره گویند و به این روش ها فیلتر مکانی گویند.
نوع پردازش می تواند خطی یا غیر خطی باشد.
طرز کار این روش در شکل 10-1 نمایش داده شده است.
معمولا روال کار به این صورت است که مرکز ثقل پنجره یعنی w(0,0) به روی پیکسل f(x,y) قرار گرفته و مقدار پیکسل متناظر با مرکز پنجره برای تصویر جدید، g(x,y) ، با توجه به پیکسل های همسایه و وزن های پنجره محاسبه می گردد.
در پردازش های خطی استفاده از یک پنجره جهت وزن دهی به پیکسل مورد نظر و همسایگان آن به نحوی صورت می گیرد که مجموع وزن دهی شده به عنوان مقدار جدید تصویر در نظر گرفته می شود.
در شکل10-1 نتیجه فیلتر خطی ، R ، در نقطه ی (x,y) با رابطه ی زیر محاسبه می گردد.
R=w(-1,1)f(x-1,y-1)+w(-1,0)f(x-1,y)+…+w(0,0)f(x,y)+ … +w(1,0)f(x+1,y)+w(1,1)f(x+1,y+1) برای فیلتر های غیر خطی می توان دو مورد فیلتر بیشینه و فیلتر کمینه را نام برد.
که اولی برای یافتن روشن ترین نقاط همسایگی و دومی برای منظور مخالف به کار می رود.
شکل 10-1 2-1-3-1 بهبود کیفیت تصویر در حوزه فرکانس : پردازش درحوزه فرکانس از جمله روش هایی می باشد که مقدار هر پیکسل در تصویر پردازش شده را به تمام پیکسل های موجود در تصویر اصلی مرتبط می سازد.
در این مورد، مشخصه ی مطلوبی در حوزه فرکانس به صورتH(u,v) در نظر گرفته می شود.
F (u, v) = F {f(x, y)} G (u, v) =F (u, v) H (u, v) g(x, y) =F-1{G (u,v)} بلوک دیاگرام نشان داده شده در شکل 11-1 نحوه ی پردازش را نشان می دهد.
در ادامه به بررسی دو فیلتر پایین گذر و بالا گذر در حوزه فرکانس می پردازیم.
شکل 11-1 لبه ها و سایر تغییرات سریع در سطوح خاکستری تصویر ( نظیر نویز ) به میزان زیادی در محتوای فرکانس بالای تبدیل فوریه ی تصویر سهیم هستند.
بنابراین مات کردن ( هموار کردن ) در حوزه فرکانس، با تضعیف محدوده ی مشخصی از مولفه های فرکانس بالای تبدیل فوریه ی تصویر حاصل می گردد.
هدف، انتخاب تابع تبدیل H(u,v) است که با تضعیف مولفه های فرکانس بالای F(u,v) ، G(u,v) را بدهد.
به این نوع فیلترها، پایین گذر می گویند.
به فیلترهای پایین گذر به دلیل کارکرد خاص آنان فیلترهای هموارساز نیز می گویند.
یک فیلتر پایین گذر ایده آل دو بعدی (ILPF) فیلتری است که تابع انتقال آن در رابطه ی 1 if D (u, v) ≤ D0 H (u, v) = 0 if D (u, v) > D0 صدق کند.
در این رابطه D0 یک کمیت غیر منفی معین است و D(u,v) فاصله ی نقطه ی (u,v) تا مبدا صفحه ی فرکانسی می باشد ؛ یعنی D (u, v) = (u2 + v2 )1/2 شکل12-1 پرسپکتیو سه بعدی، نمایش فیلتر به صورت تصویر و سطح مقطع شعاعی H(u,v) را به صورت تابعی از u و v نشان می دهد.
ایده آل بودن فیلتر بدین معناست که تمام فرکانس های درون دایره با شعاع D0 بدون تضعیف عبور داده می شوند، در حالیکه تمام فرکانس های خارج آن دایره کاملا تضعیف می شوند.
تابع انتقال فیلتر پاین گذر باترورث (BLPF) از مرتبه ی n و با فرکانس قطع در فاصله ی D0 از مبدا با رابطه ی تعریف می گردد.
شکل13-1 تابع انتقال BLPF را نشان می دهد.
شکل 12-1 شکل 13-1 بر خلاف ILPF ، تابع انتقال BLPF ناپیوستگی تیز که باعث تعیین فرکانس قطع مشخصی بین فرکانس های عبور داده شده و فیلتر شده گردد، ندارد.
برای فیلتر هایی که توابع انتقال با تغییرات آرام دارند، معمولا منحنی فرکانس قطع در نقاطی که H(u,v) برابر کسر معینی از مقدار بیشینه اش باشد تعریف می شود.
در معادله ی فوق، وقتی D(u,v)= D0 باشد، H(u,v)=0.5 (50 درصد کمتر از مقدار بیشینه) می باشد.
مقدار دیگری که عموما استفاده می شود، 1/√2 برابر مقدار بیشینه ی H(u,v) است.
یکی دیگر از فیلترهای پایین گذر که بیشترین کاربرد را دارد، فیلتر گوسی (GLPF) یا زنگوله ای شکل می باشد.
به دلیل خاصیت توابع نمایی، شکل آن در حوزه ی فرکانس نیز به صورت گوسی باقی می ماند.
شکل 14-1 تابع انتقال GLPF را نشان می دهد.
شکل14-1 چون لبه ها و سایر تغییرات سریع در سطوح خاکستری با مولفه های فرکانس بالا مرتبط هستند، می توان با یک فرآیند فیلتر کردن بالاگذر که بدون تغییر اطلاعات فرکانس بالای تبدیل فوریه، مولفه های فرکانس پایین را تضعیف می کند، تصویر را تیز کرد.
به فیلترهای بالاگذر فیلترهای تیزکننده نیز می گویند.
فیلتر بالاگذر ایده آل (IHPF) دوبعدی، فیلتری است که تابع انتقال آن در رابطه ی صدق می کند.
در این معادله D0 فاصله قطع از مبدا فرکانسی می باشد.
این فیلتر متضاد فیلتر پایین گذر ایده آل می باشد، زیرا تمام فرکانس های درون دایره ای به شعاع D0 را تضعیف می کند، در حالیکه تمام فرکانس های خارج از دایره را بدون تضعیف عبور می دهد.
تابع انتقال فیلتر بالاگذر باترورث (BHPF) از مرتبه ی n و با فرکانس قطع به فاصله ی D0 از مبدا با رابطه ی تعریف می شود.
تابع انتقال فیلتر بالاگذر گوسی (GHPF) به صورت زیر تعریف می شود.
شکل 15-1 پرسپکتیو سه بعدی، نمایش فیلتر به صورت تصویر و سطح مقطع شعاعی هر سه فیلتر بالاگذر را نشان می دهد.
ردیف بالا فیلتر ایده آل ، ردیف وسط فیلتر باترورث و ردیف پایین فیلتر گوسی می باشد.
شکل15-1 2-3-1 بازسازی تصاویر: یکی دیگر از تکنیک های پردازش تصویر، بازسازی تصاویر می باشد.
هدف از بازسازی تصاویر استفاده از فرآیندهایی جهت به دست آوردن یک تصویر مطلوب از یک تصویر تخریب شده است.
اگرچه در مواقعی نمی توان به تصویر مطلوب رسید ولی می توان تاثیر اختلال را کمینه کرد به نحوی که گاهی تیز کردن لبه های تصویر نیز می تواند کافی باشد.
تخریب تصویر به علت تنظیم نامناسب دوربین، حرکت نسبی دوربین و جسم مورد تصویربرداری، انعکاس ناخواسته ی نورها از منابع غیر قابل کنترل، ایده آل نبودن سیستم های تصویر برداری و مخابراتی و ...
صورت می گیرد.
روش های مختلفی در پردازش تصاویر تخریب شده به منظور بازسازی آنان موردتوجه قرار می گیرند که از جمله ی آن ها می توان به موارد زیر اشاره کرد : از بین بردن مات شدگی در تصویر حذف نویز در تصویر بهبود تمایز و دیگر معیارهای رؤیت تصویر تعریف مدلی از تخریب می تواند در درک مفاهیم و همچنین به یافتن روابطی برای بازسازی تصویر کمک کند.
در یک حالت کلی و بدون ایجاد خطا های بزرگ می توان یک سیستم تخریب کننده و بازسازی را به صورت شکل 16-1 مدل سازی نمود.
همانطور که در شکل نشان داده شده است، تابع تخریب به همراه نویز جمع شونده بر روی تصویر ورودی f(x,y) اعمال می شود تا تصویر تخریب شده ی g(x,y) تشکیل شود.
با معلوم بودن g(x,y) و دانستن تابع تخریب H و نوع نویز جمع شونده η(x,y) می توان ، تقریبی از تصویر اصلی را به دست آورد.
شکل16-1 اگر H یک فرآیند خطی و تغییر ناپذیر با مکان باشد، آنگاه تصویر تخریب شده در حوزه ی مکان با رابطه زیر مشخص می شود : g(x,y)=h(x,y)* f(x,y) +η(x,y) با فرض H=1 ، تنها با تخریب توسط نویز سروکار خواهیم داشت.
در ادامه به بررسی چند تابع چگالی احتمال نویز ، که اهمیت بیشتری دارند می پردازیم.
نویز گوسی: به دلیل تشابه رابطه ی آن در هر دو حوزه ی مکان و فرکانس، نویز گوسی ( نرمال ) در عمل بسیار مورد استفاده قرار می گیرد.
تابع چگالی احتمال (PDF) متغیر تصادفی z با توزیع نرمال با رابطه ی زیر مشخص می شود : که z نشان دهنده ی سطح خاکستری، μ میانگینِ z و σ2 واریانس آن می باشد.
نمودار این تابع در شکل 17-1 نشان داده شده است.
نویز ریلی: تابع چگالی احتمال نویز ریلی به صورت زیر تعریف می شود: و میانگین و واریانس آن با روابط زیر تعیین می گردد.
نمودار چگالی ریلی در شکل17-1 نشان داده شده است.
نویز ارلانگ ( گاما ) : تابع چگالی احتمال نویز گاما به صورت زیر تعریف می شود: در این رابطه a > 0 و b یک عدد صحیح مثبت می باشد.
میانگین و واریانس این تابع چگالی در زیر آمده است و نمودار آن را در شکل 17-1 مشاهده می کنید.
نویز نمایی : تابع چگالی، میانگین و واریانس نویز نمایی به صورت زیر است : نویز نمایی حالت خاصی از نویز گاما است، وقتی که b=1 باشد.
شکل 17-1 نمودار تابع چگالی آن را نشان می دهد.
نویز یکنواخت : تابع چگالی ، میانگین و واریانس نویز نمایی به صورت زیر است : و نمودار تابع چگالی آن در شکل 17-1 آمده است.
نویز ضربه ( نمک و فلفل ) : تابع چگالی احتمال نویز ضربه به صورت زیر است : نمودار تابع چگالی آن در شکل 17-1 نشان داده شده است.
شکل17-1 در ادامه به بررسی چند فیلتر که جهت حذف نویز به کار می رود، خواهیم پرداخت.
فیلتر میانگین ریاضی : این فیلتر به صورت خطی عمل می کند و در نتیجه کارکرد آن مانند کانولوشن بوده و در حوزه ی فرکانس نیز قابل بررسی است.
کهxy S نشان دهنده ی مختصات زیر تصویر و m و n ابعاد زیر تصویر می باشد.
در این صورت، تصویر جدید مقداری محو شدگی در مرزهای خود خواهد داشت.
فیلتر میانگین در حوزه ی فرکانس مشابه یک فیلتر پایین گذر عمل می کند.
هر چه میزان نویز بیشتر باشد، یا اشیاء درون تصویر از اندازه ی بزرگتری برخوردار باشند، لازم است از پنجره بزرگتری استفاده کرد که سبب افزایش خاصیت محو شدگی شده و کیفیت ظاهری تصویر را کاهش می دهد، هرچند که گاهی نسبت توان سیگنال به نویز را افزایش می دهد.
فیلتر میانگین هندسی : این فیلتر به صورت زیر تعریف می شود : فیلتر میانه: این فیلتر یکی از مؤثرترین فیلترهای غیرخطی جهت حذف نویز در تصاویر می باشد.
پنجره ای مربعی به اندازه ی (2k+1)×(2k+1) - که k عددی طبیعی است – در نظر گرفته شده و مرکز ثقل آن به روی تک تک پیکسل ها ی تصویر شیفت داده می شود.
آنگاه مقدار میانی موجود داخل پنجره به عنوان پاسخ خروجی برای پیکسل مرکزی در نظر گرفته می شود.
این فیلتر توانایی حذف نویز ضربه را دارد، هر چند توان کاهش نویز گوسی را به خوبی دارا نیست.
از دیگر مزایای ویژه ی این فیلتر آن است که مقدار جدید روشنایی در تصویر ایجاد نمی کند.
مشکل اصلی این فیلتر جابه جایی محل لبه به اندازه یک یا دو پیکسل می باشد.
فیلترهای بیشینه و کمینه : روابط این فیلترها به صورت زیر است : فیلتر نقطه میانی : این فیلتر به صورت زیر تعریف می شود : 3-3-1 کدینگ و فشرده سازی تصویر: یکی دیگر از روش ها ی پردازش تصویر، کدینگ و فشرده سازی می باشد که در این قسمت مختصرا به آن می پردازیم.
در این روش سعی داریم داده های اضافی را حذف کنیم.
ذکر این نکته ضروری است که داده با اطلاعات متفاوت است.
در واقع از داده استفاده می شود تا به اطلاعات برسیم.
معمولا تعداد داده ها بیشتر از اطلاعات داخل آن هاست و ما در این تکنیک سعی میکنیم که داده هایی که اطلاعات ندارد و redundancy خوانده می شود را حذف کنیم.
به سه دلیل ممکن است از کدینگ استفاده شود: فشرده سازی اطلاعات تصویر برای کاهش حجم آنها انتقال یا ارسال تصاویر استخراج ویژگی ها روش های فشرده سازی به دو گروه تقسیم می شود: Lossless: هیچگونه اطلاعاتی از بین نمی رود.