مقاله بهبود شناسایی آرم در سند های تصویری مبتنی بر الگوریتم ژنتیک

Word - pdf 2 MB 34595 9
مشخص نشده مشخص نشده کامپیوتر - IT
قیمت قدیم:۱۲,۰۰۰ تومان
قیمت: ۷,۶۰۰ تومان
دانلود فایل
  • بخشی از محتوا
  • وضعیت فهرست و منابع
  • چکیده -تشخیص آرم یکی از راه های تشخیص منابع اسنادو اطلاعاتی درباره یک سند می باشد.در این مقاله شناسایی و تشخیص آرم ها در تصاویر متنی بیان می شود.بدین صورت که ابتدا تصاویر به سگمنت هایی تقسیم شده ، توسط فاز تشخیص آرم، برای هر سگمنت ویژگی هایی بر پایه آمار اولیه در مورد مؤلفه های پیکسل های سیاه درون هر بخش محاسبه می شود.با استفاده از این ویژگی ها، شبکه عصبی تکاملی بر پایه الگوریتم ژنتیک، سگمنت ها را بر اساس احتمال وجود آرم یا عدم وجود آن دسته بندی می نماید.در نهایت  در مجموعه انتخابی به عنوان مجموعه آرم ها، فاز انطباق آرم به کمک ویژگی های هندسی  محلی  و مستقل  انجام می شود. نتایج نشان می دهد که استفاده از شبکه عصبی تکاملی به منظور شناسایی آرم، با ارائه نتایج مطلوب به عنوان دستاوردی جدید در کنار دیگر روش ها قابل استفاده می باشد.

     

    کلمات کلیدی   -استخراج ویژگی ، الگوریتم ژنتیک، تابع ارزیاب، شبکه عصبی تکاملی

     

     

    1- مقدمه

      مسئله تشخیص آرم از گرایش های بزرگ در حوزه سند خصوصا برای پایگاه داده ها می باشدو مزیت آن امکان بالقوه اش برای تشخیص منابع اسنادوکلی گویی اش برای مسئله تشخیص واطلاعات معنایی در مورد متن است.در زمینه کاربرد سندهای تصویری، تشخیص آرم های مشابه با دو شیوه قابل انجام است .اول- سندی که شامل یک آرم باشد را به عنوان ورودی وارد نموده و سیستم ، آرم را به عنوان یکی از اعضای مجموعه کوچک آرم های شناخته شده  یا به عنوان آرمی که در حال حاضر در پایگاه داده موجود نیست ، طبقه بندی می کند.دوم -آرم خاصی را (شناخته شده یا شناخته نشده) در پایگاه داده ای از اسناد اندیس گذاری نموده و اسنادی که شامل آن آرم باشند را استخراج می نماید. نمونه ای از یک سندتصویری در شکل1 نشان داده شده است.مسئله شناسایی آرم را می توان در سه مرحله تقسیم بندی نمود]2,1[:

    1- بخش بندی1 : تصویر سند به تصاویرکوچکتری که شامل ارتباطات منطقی بخش هایی از سند می باشد، تقسیم می شود.

    2- تشخیص آرم2 : ویژگی هایی از بخش ها استخراج می شوند سپس در دسته بندی بخش ها، بر پایه اینکه احتمالا شامل آرم هستند یا خیر،استفاده می شوند.

    3-انطباق آرم3:مجموعه منتخب آرم هادر فاز2 با پایگاه داده شامل کلیه آرم هاانطباق پیدا می کنند تا آرم دقیقا شناسایی و تعیین شود. در اکثر کاربردها هدف نهایی فاز سوم می باشد]5-2[.

     

     

     

    1Segmentation

    2Logo Detection

    3Logo Matching

     

     

    شکل1- نمونه ای از سند تصویری

                                              

    از آنجا که انطباق آرم(فاز سوم) روند محاسباتی گسترده ای خواهد داشت فاز تشخیص آرم بخش های شامل آرم را هرس می کند]7,6,1[.

    تشخیص آرم به عنوان یکی از کاربردها در حوزه شناسائی الگو،در سال های اخیر مورد بحث و بررسی واقع شده است.بسیاری از نظریه های مطرح شده براساس نگرش های نحوی و روش های آماری می باشد.در نگرش نحوی با دانش نوع متن،به وسیله موقعیت آرم در صفحه ،آرم منتخب قابل شناسایی است]2.[

    ازمهمترین روش های آماری می توان به مواردذیل اشاره نمود: استخراج شانزده ویژگی آماری هر بخش واشتقاق مجموعه ای از قوانین بااستفادهازالگوریتم]ID38[ استفاده ازشبکه های عصبی بازگشتی rnns)) با انتقال دقیق آرم با نمایش درختm تایی ]6[،به کارگیری Edgebackpropagationدرتصاویر شامل نویز ]9 [و نیز تشخیص آرم تحت تبدیل هایی مانند انتقال ،تغییر مقیاس و چرخش ]2 [ .

     فاز انطباق آرم از ثابت های هندسی به عنوان ویژگی های پیچیده تر استفاده می کند. مقاله حاضر با تمرکز برفاز دوم ،با به کارگیری شبکه عصبی تکاملی نتایج قابل قبولی ارائه می دهد.

    در ادامه فاز تشخیص آرم  شرح داده خواهد شد به طوریکه به منظور حفظ استقلال روش پیشنهادی از فرضیاتی در مورد چیدمان متن استفاده نمی کنیم که این از مزایای روش به شمار می رود.

     

    2- روش پیشنهادی

     

    شناسایی دقیق یک آرم شامل سه مرحله کلی بخش بندی تصویر ،تشخیص آرم و انطباق آرم می باشد.بخش بندی تصویر با استفاده از الگوریتمtop-down سلسله مراتبی ]2[ ، مسئله انطباق آرم نیز در

    ]1 [تشریح شده است. این مقاله بر مسئله تشخیص آرم تاکید داشته که با در اختیار گرفتن مجموعه ای از بخش ها به عنوان ورودی (تصاویر متنی بخش بندی شده در فاز اول )،پس از استخراج ویژگی ،با استفاده از شبکه عصبی تکاملی،بر پایه الگوریتم ژنتیک ،آن هارا به دو مجموعه قطعه های شامل آرم و قطعه های بدون آرم افراز می نماید] 11,10[.

     

    2-1- استخراج ویژگی

    ابتداسند هااسکن ویک تصویر باینری برای هر سند تولید می شود. سپس بر روی هر یک،روال بخش بندی اجرا می شودکه نتیجه آن مجموعه ای از تصاویربخش هاست. الگوریتم بخش بندی مورد استفاده یک الگوریتم بالا به پائین سلسله مراتبی با شمای بخش بندی درختی  X-Yمی باشد ]2[.هربخش پس از نرمال شدن، در مجموعه بزرگی از بخش هاقرار داده می شود.

    از هر بخش ویژگی هایی آماری مرتبط با پیکسل های سیاه رنگ مشتق شده استخراج می شود .بیشترین بخش محاسباتی این فرآیند محاسبه مؤلفه های متصل به هم است ، که بدین منظور از توابع Morphology  در نرم افزار Matlab استفاده شده است.با شناسایی مولفه های متصل به هم استخراج ویژگی به آسانی قابل انجام است،این ویژگی ها در عین سادگی،به طور چشمگیری در تمایز قائل شدن بین آرم ها و غیر آرم ها مؤثر می باشد. در شکل 1 مجموعه ویژگی های بکار رفته لیست شده اند .

    2-2- شبکه های عصبی

     

    شبکه های عصبی ساختارهایی مناسب در جهت شناسایی ودسته بندی الگوها می باشند.با این وجود دارای محدودیت هایی نیز هستند ،مسئله آموزش یکی از بزرگترین

    محدودیت ها در این شبکه هاست. الگوریتمی که برای این منظور به کار برده می شود نمی تواند لزوما یک جواب بهینه را متضمن شود.

    درکاربردهای واقعی الگوریتم  پس انتشار4 خطاممکن است که به مجموعه ای از وزن ها همگرایی پیدا کند که بهینه نمی باشند (کمتر از حد بهینه هستند) و همچنین نمی توانند از این مجموعه جواب ها بگریزند.GA ،تکنیک مؤثری به منظور بهینه سازی است،در مقاله حاضر از این الگوریتم در بهینه سازی وزن های شبکه استفاده شده است ، معماری شبکه(تعداد نرون ها و ارتباطات) نیز به روش سعی و خطا انتخاب شده است.

     

       لیست ویژگی های استفاده شده

     

    1- تعداد مؤلفه ها

    2- میانگین ناحیه مؤلفه

    3- میانگین طول مؤلفه

    4-انحراف معیارطول مؤلفه

    5- میانگین عرض مؤلفه

    6- ماکسیمم ناحیه مؤلفه

    7- ماکسیمم طول مؤلفه

    8- ماکسیمم عرض مؤلفه

    9- طول بخش

    10- عرض  بخش

    11- چگالی بخش

    12- ماکسیمم طول       وابسته با طول بخش

    13- ماکسیمم عرض وابسته با عرض بخش

    14-نسبت شیب محدوده

     هر بخش

    15-انحراف معیار چگالی افقی

    16-انحراف معیار چگالی عمودی

     

    2-3- بهینه سازی وزنی تکاملی

    گام اول در بهینه سازی کد کردن مسئله در قالب کروموزوم می باشد.در روش پیشنهادی از وزن های ارتباطی شبکه به عنوان ژن های کروموزوم استفاده می شود.

      مثالی از شبکه عصبی

     

     وزن های اولیه شبکه به صورت تصادفی در فاصله]1,1-[انتخاب می شوند.مجموعه ای از وزن ها در قالب یک ماتریس مربعی قابل نمایش است ،در این ماتریس هر عدد مربوط به وزن لینک بین دو نرون می باشد.عدد صفر بیانگر عدم ارتباط است .ساختار هر کروموزوم مجموعه ای از ژن هاست که هر ژن به صورت وزن (ارتباط بین 2 نرون)قابل تعریف است. به عنوان مثال شبکه ترسیمی در شکل 2 دارای 8 ارتباط می باشد که متناظر با آن در ماتریس 8 مقدار غیر صفر وجود داشته که به ترتیب ستونی در کروموزوم جایگذاری می شود.

  • فهرست:

    ندارد.
     

    منبع:

     

     

     [1] S. Seiden, M. Dillencourt, S. Irani, R. Borry, T. Murphy, “Logo detection in document images”.

    [2] D. S. Doermann, E. Rivlin, I. Weiss, “Logo recognition using geometric invariants,” Proceedings of  the second  International Conference on Document Analysis and Recognition,1993.p.894-7.

    [3] A. Lawrence Spitz, “Logotype Detection in Compressed  Images using Alignment Signatures,” Daimler Benz  Research and Technology Center, 1510  Page Mil Road, Palo Alto, California 94304 USA.

     [4] M. Gori, M. Maggini, S. Marinai, J. Q. Sheng, G. Soda,  “Edge-backpropagation for noisy logo recognition,” Dipartimento di Ingegneria dell'Information, Universita di Siena, Italy, Feb 2002.

     [5]  J. Neumann, H.  Samet, A.  Soer, “Integration of local and global shape analysis for logo classification,” Pattern Recognition Letters, 23 pp. 1449-1457, 2003.

     [6] D. Pham, Jinsong. Yang, “Logo Detection in Document Images with Complex Backgrounds.”  Griffith University QLD 4111, Australia.

    [7] J. Zhou, D. P. Lopresti, p. Sarkar, “Identification of Logos from Document Images,”  Matsushita Electric Industrial o., Ltd., Osaka(JP). Aug.14, 1998.

    [8] J. R. Quinlin, M. Kaufmann, “C4.5: Programs for Machine Learning,” San Mateo, California, 1992.

      [9] A. W. M. Smeulders, M. Worring, S.  Santini, A.  Gupta, R. Jain,  “Content-based image retrieval at the end of the early years,” IEEE Transactions on Pattern Analysis and Machine Intelligence, 22(12) pp. 1349-1380, 2000.

    [10] CH. Huang ,  L. Chen,  Y.  Chen , M. Chang, “Evaluating the process of a genetic algorithm to improve the  back-propagation network: A Monte Carlo study,”  Expert Systems with Applications xxx (2008) xxx–xxx

    [11] Evolutionary Neural Network : The University of Melbourne: Assoc. Proffesor  Baikunth  Nath

     [12] D. S. Doermann, Document Processing Group Log Database, University of Maryland,  URL

    http://documents.cfar.umd.edu/resources/database/UMDlogo.html

     

رسوبات انتقالی توسط رودخانه‌ها مشکلات زیادی خصوصاً جهت بهره‌برداری از سدها و سازه‌های آبی به وجود می‌آورند. در ده‌های اخیر تحقیقات بزرگی برای درک مکانیسم انتقال رسوب در جریان‌های طبیعی صورت گرفته است. تخلیه‌های صنعتی و پساب‌های کشاورزی به داخل سیستم آبزیان باعث می‌شود که رسوبات کف توسط موادسمی آلوده شوند. به همین ترتیب وقتی رژیم رودخانه تغییر می‌نماید این رسوبات آلوده به پایین ...

چکیده: در عصر حاضر در بسیاری از موارد ماشین ها جایگزین انسانها شده اند و بسیاری از کارهای فیزیکی که در گذشته توسط انسانها انجام می گرفت امروزه توسط ماشین ها صورت می گیرد . اگرچه قدرت کامپیوترها در ذخیره، بازیابی اطلاعات و اتوماسیون اداری ،.. غیر قابل انکار است، اما همچنان مواردی وجود دارد که انسان ناچار است خودش کارها را انجام دهد. اما به طور کلی ، موارد مرتبط با ماشین شامل ...

در اين تمرين روش هاي استخراج ويژگي و روش هاي خطي و غير خطي دسته بندي را مورد مطالعه قرار مي‌دهيم. در ابتدا روش هاي مختلف استخراج ويژگي که از آن جمله PCA، LDA، روش قاب بندي و چند روش ديگر هستند را و سپس براي ويژگي هاي استخراج شده از روش هاي دسته بندي

هوش محاسباتي يا (Computational-Intelligence) CI به معناي استخراج هوش، دانش، الگوريتم يا نگاشت از دل محاسبات عددي براساس ارائه به روز داده‌هاي عددي است. سيستم‌هايCI در اصل سيستم‌هاي ديناميکي مدل آزاد (Model-free) را براي تقريب توابع و نگاشتها ارائه م

بيماران قلبي بعضي مواقع دچار حملات ناگهاني مي شوند که اين وضعيت باعث به وجود آمدن صدماتي در بيمار و يا باعث مرگ وي خواهد شد.حال با بررسي سيگنال ECG که شامل اطلاعات بسيار مهمي از وضعيت قلب است مي توان، بسياري از بيماري هاي قلبي را تشخيص داد. بنابراين

مقدمه در سالیان اخیر شاهد حرکتی مستمر از تحقیقات صرفاً تئوری به تحقیقات کاربردی در پردازش اطلاعات برای مسائلی که راه حلی برای آنها موجود نیست بوده ایم. با توجه به این حقیقت توجه زیادی به توسعه تئوریک سیستمهای دینامیکی هوشمند مدل- آزاد بر اساس داده های تجربی وجود دارد. شبکه های عصبی مصنوعی جزء آن دسته از سیستم های دینامیکی قرار دارند که با پردازش بر روی داده های تجربی دانش در ...

مفيد بودن شبکه عصبي آنالوگ مصنوعي بصورت خيلي نزديکي با ميزان قابليت آموزش پذيري آن محدود مي شود . اين مقاله يک معماري شبکه عصبي آنالوگ جديد را معرفي مي کند که وزنهاي بکار برده شده در آن توسط الگوريتم ژنتيک تعيين مي شوند . اولين پياده سازي VLSI ارائه

مقدمه شبکه هاي عصبي چند لايه پيش خور1 به طور وسيعي د ر زمينه هاي متنوعي از قبيل طبقه بندي الگوها، پردازش تصاوير، تقريب توابع و ... مورد استفاده قرار گرفته است. الگوريتم يادگيري پس انتشار خطا2، يکي از رايج ترين الگوريتم ها جهت آموزش شبکه ها

چکیده: شبکه‌های عصبی مصنوعی از مباحث جدیدی است که دانشمندان علوم کامپیوتر به آن علاقمند شده‌اند و برای پیشرفت هرچه بیشتر علوم کامپیوتر وقت و هزینه بسیاری را صرف آن کرده و می‌کنند. این موضوع با ایده گرفتن از سیستم عصبی بدن انسان و با هدف شبیه‌سازی هرچه بیشتر کامپیوتر به انسان شکل گرفت و تا حال به خوبی پیشرفته است. از جمله کاربردهای این بحث می‌توان از شناسایی الگوها, پردازش تصویر ...

امروزه با شکسته شدن پی در پی استقلال ، شاخه های مختلف علوم و بهره وری شاخه ای از شاخه ی دیگر و پیشبرد مسائل پیچیده خود، پیوستگی و لاینفک بودن تمامی شاخه های علوم را نمایان تر می سازد که سرمنشأ تمامی آنها از یک حقیقت نشأت گرفته و آن ذات باری تعالی است.اولین تلاش ها به منظور ارائه ی یک مدل ریاضی برای سیستم عصبی انسان در دهه 40 توسط Mcculloch , pitts انجام شد ، که حاصل آن یک نورون ...

ثبت سفارش
تعداد
عنوان محصول