اغلب تحقیقات انجام شده در زمینه تعیین هویت نویسنده بر روی زبان انگلیسی متمرکز بوده و تاکنون مطالعاتی در زمینه متون دستنویس فارسی گزارش نشده است.
بنابراین در این مقاله روشی برای تعیین هویت نویسنده بر اساس متن دست نویس فارسی پیشنهاد شده که به صورت برون خط و مستقل از متن انجام می شود.
بر اساس ایده مطرح شده در مطالعات قبلی، در روش پیشنهادی تصویر متن دست نویس به صورت یک بافت در نظر گرفته شده و پس از مرحله نرمال سازی، با کمک فیلترهای گابور ویژگی های متن استخراج می شود.
ویژگی روش پیشنهادی استفاده از بانک فیلتری است که با ساختار متون دستنویس فارسی و همچنین سیستم بینایی تناسب بیشتری دارد.
علاوه بر این روش جدیدی جهت استخراج ویژگیها از خروجی فیلترهای گابور پیشنهاد شده که مبتنی بر ویژگی انرژی گابور و گشتاورهای هندسی است.
همچنین برای اولین بار، روشهای مختلف استخراج ویژگی از خروجی فیلترهای گابور را برای مسئله تعیین هویت نویسنده مورد بررسی کامل قرار داده ایم.
تمامی این روشها به همراه دو روش ماتریس هم وقوعی و روش Said که مبتنی بر فیلترهای گابور می باشد و برای متون انگلیسی پیشنهاد شده است، را پیاده سازی نموده ایم.
نتایج اجرای روشها بر روی تصاویر دستخط 40 نفر که هیچ محدودیتی در نوع دستخط آنها وجود ندارد، نشان می دهد که روش پیشنهادی از کارایی بالاتری برای متون دستنویس فارسی برخوردار است.
در بین ویژگی های رفتاری دستخط افراد به راحتی قابل حصول است و علاوه بر این مطالعات نشان می دهند که افراد مختلف دارای دستخط های متفاوتی نیز می باشند.
به همین دلیل تعیین هویت افراد به کمک متون دست نویس آنها، به عنوان یک موضوع تحقیقاتی در طی سالهای اخیر مورد توجه قرار گرفته و کاربرد آن در زمینه مسائل امنیتی، حقوقی، کنترل دسترسی به سیستمها و فعالیتهای مالی می باشد.
هرچند که تعیین هویت بر اساس دستخط در مقایسه با ویژگیهای فیزیولوژیکی مثل الگوی عنبیه و اثر انگشت از دقت کمتری برخوردار است، اما این مسئله در جاهایی که اطلاعاتی بجز دستخط در دسترس نمی باشد و یا بعنوان مکملی جهت کارایی سیستمهای امنیتی و یاری رساندن به افراد خط شناس، کاربرد مشهودتری دارد.
در مسئله تعیین هویت هدف این است که با داشتن یک متن دستنویس، هویت نویسنده آن را مشخص کنیم.
هدف این مقاله این است که با ترکیب روشهای پردازش تصویر و شناسایی الگو راه حلی ماشینی برای تعیین هویت نویسنده ارایه دهد.
این روشها را می توان به دو دسته کلی زیر تقسیم کرد:
1- روشهای برون خط (off line): در این روشها فقط تصویر متن دستنویس در دسترس است و ویژگیها با توجه به کل تصویر یا ساختار کلمه ها و نویسه ها استخراج می شوند.
در این روشها بسیاری از اطلاعات دینامیکی که مربوط به طرز نوشتن افراد است، از دست می رود و این امر کار را نسبت به روشهای برخط مشکلتر می سازد.
روشهای برون خط را می توان به دو گروه کلی وابسته به متن و مستقل از متن نیز دسته بندی کرد.
در روشهای وابسته به متن، باید متن ثابتی توسط نویسنده نوشته شود تا بتوان هویت وی را مشخص نمود اما در روشهای مستقل از متن، با استفاده از هر نوع متنی هویت نویسنده آن مشخص می گردد.
2- روشهای برخط (on line): در این روشها علاوه بر ویژگیهای برون خط از اطلاعات دینامیکی مثل فشار قلم، ترتیب نوشتن، سرعت نوشتن، فرم ضربه های قلم و غیره نیز استفاده می شود.
بنابراین بدلیل داشتن اطلاعات بیشتر، تعیین هویت با دقت بیشتری انجام می شود اما این روشها کاربردهای محدودتری را شامل می شوند.
فرض منحصر به فرد بودن دستخط افراد، بصورت علمی توسط Srihari بررسی شده است [2و1].
در این مطالعه 1000 نفر از بین جمعیت چندین ایالت مختلف آمریکا و بر اساس تفاوت سن، نژاد، تحصیلات و جنسیت انتخاب شدند و از آنها خواسته شد که متن مشخصی را سه مرتبه و بر روی یک کاغذ بدون خط و با خودکار مشکی بنویسند.
سپس ویژگیهایی در سطح کل متن، پاراگراف، خط و کلمه از متون دست نویس استخراج شده و با کمک فاصله اقلیدسی تعیین هویت انجام می شود.
از جمله کارهای انجام شده در زمینه تعیین هویت نویسنده، می توان به مواردی چون روش مبتنی بر ارزیابی اطلاعات [3]، استفاده از ویژگی کانتور اجزاء متصل [4]، روش مبتنی بر ویژگیهای لبه [5]، کدگذاری هیستوگرام نمای عمودی با کمک مورفولوژی (6) و روش مبتنی بر مدل مخفی مارکوف [7] اشاره کرد.
اغلب روشهای مذکور برای متن ثابت ارایه شده اند و نیازمند تقطیع متن می باشند.
چون هدف ما ارایه روشی خودکار جهت تعیین هویت نویسنده بوده و محدودیتی برای نوع دستخط های مورد بررسی قرار نداده ایم، بنابراین استفاده از روشهایی که نیازمند تقطیع خودکار و کامل متن به کلمات و حروف می باشند، مورد نظر نیست.
بنابراین در این مقاله با استفاده از یک روش مبتنی بر بافت، متن دستنویس را به صورت تصویر بافت در نظر گرفته و مسئله تعیین هویت نویسنده به مسئله طبقه بندی بافت تبدیل می گردد.
2- روش پیشنهادی
در این روش از ایده مطرح شده در [8] استفاده شده و تصویر متن دست نویس بصورت یک بافت در نظر گرفته شده است.
برای این منظور ابتدا مراحل نرمال سازی بر روی تصویر متن انجام شده و سپس ویژگیهای متن به کمک بانکی از فیلترهای گابور استخراج می شوند.
با کمک این ویژگیها و یک طبقه بندی کننده هویت متن دست نویس ورودی تعیین می گردد.
در ادامه به شرح هر یک از این مراحل خواهیم پرداخت.
در این روش از ایده مطرح شده در [8] استفاده شده و تصویر متن دست نویس بصورت یک بافت در نظر گرفته شده است.
در ادامه به شرح هر یک از این مراحل خواهیم پرداخت.
2-1- نرمال سازی تصویر روشهای تحلیل بافت را نمی توان مستقیماً برای تصویر متن دست نویس به کار گرفت و ابتدا باید تصویر را نسبت به تأثیر عواملی مثل فاصله خطوط، کلمات و غیره نرمال سازی نمود تا بلوکی یکنواخت از متن دست نویس مورد نظر حاصل شود.
مراحل نرمال سازی تصویر متن عبارتند از: (الف) به منظور استخراج خطوط و کلمات موجود در متن، معمولاً از منحنی نمای نیم رخ تصویر باینری استفاده می شود [9].
در این مقاله ما نسخه ای تغییر یافته از این الگوریتم که برای تصاویر سطوح خاکستری پیشنهاد شده [10]، را استفاده نموده ایم.
ابتدا نمای نیم رخ افقی تصویر محاسبه شده و سپس با یک فیلتر پایین گذر گاسین هموارسازی می شود.
هموارسازی ماکزیمم های محلی را حذف نموده و حساسیت به نویز را کاهش می دهد.
در شکل 1 تصویر متن دستنویس، منحنی نیم رخ افقی و منحنی هموارسازی شده متناظر با آن را مشاهده می کنیم.
در این منحنی قله ها متناظر با فاصله بین خطوط و دره ها متناظر با مرکز خطوط متن هستند که برای یافتن قله ها یا خطوط در متن می توان نقاط صفر در مشتق منحنی را محاسبه نمود.
به دلیل خطی بودن کانولوشن، هموارسازی و مشتق گیری را می توان در یک مرحله انجام داد.
پس برای یافتن خطوط متن کافی است منحنی نمای نیم رخ افقی را با مشتق تابع گاسین فیلتر نماییم.
*********** شکل 1: استخراج خطوط متن الف) تصویر متن ب) منحنی نیم رخ افقی ج) منحنی نیم رخ افقی پس از هموارسازی (ب) هر یک از خطوط متن که در مرحله قبل پیدا شدند، باینری شده و سپس نمای نیم رخ عمودی مربوط به آن محاسبه می شود.
با کمک این منحنی فاصله های بین کلمات را پیدا می کنیم و فاصله هایی که اندازه آنها از 5 نقطه بیشتر باشد را با مقدار 5 نقطه نرمال می کنیم.
بنابراین فاصله کلمات حداکثر 5 نقطه خواهد بود و فاصله های کمتر از 5 نقطه نیز بعنوان فاصله های بین حروف در نظر گرفته می شوند.
همچنین در صورتی که انتهای خط خالی باشد، با تکرار مجدد آنرا به حدی پر می کنیم که طول خط به اندازه مشخصی (در این مقاله 256 نقطه) برسد.
فاصله بین خطوط متن را نیز با مقدار مشخصی تنظیم می کنیم.
مرحله نرمال سازی فاصله بین کلمات، فاصله بین خطوط و پر کردن خطوط در شکل 2-الف ارایه شده است.
(ج) در صورت خالی بودن بخش انتهایی تصویر، آنرا با تکرار مجدد خطوط ابتدایی تصویر به نحوی پر می کنیم که طول تصویر به اندازه مشخصی (در این مقاله 384 نقطه) برسد.
در شکل 2-ب تصویر نرمال سازی شده نهایی ارایه شده است.
******************* شکل 2: الف) نرمال سازی بین کلمات، فاصله خطوط و پرکردن انتهای خطوط ب) پرکردن بخش انتهایی (تصویر نهایی) 2-2- استخراج ویژگی به منظور ارایه روشی کارا جهت تعیین هویت نویسنده، باید ویژگی هایی را در نظر گرفت که بیانگر تفاوت دستخط های مختلف می باشند.
بنابراین در این مقوله استفاده از ویژگی های معرفی شده در مطالعات OCR مناسب به نظر نمی رسد زیرا هدف طراحی این ویژگی ها، تشخیص کلمات و حروف مستقل از تفاوت دستخطهای مختلف می باشد.
به دلیل کارایی خوب فیلتر گابور در بحث تحلیل بافت و کاربردهای مشابه [12و11و8]، محاسبه ویژگیها را بر این اساس انجام دادیم.
برای این منظور طراحی بانک فیلتر گابور را بر اساس نتایج تجربی و مطالعات انجام شده در زمینه نحوه عملکرد سیستم بینایی انجام داده ایم وبرای استخراج ویژگی، یک روش جدید بر اساس گشتاورهای هندسی و انرژی گابور پیشنهاد کرده ایم.
همچنین با استفاده از بانک فیلتر طراحی شده، سایر روشهای موجود برای استخراج ویژگی مبتنی بر فیلترهای گابور را بررسی و مقایسه نموده ایم.
علاوه بر این ویژگی های مبتنی بر ماتریس هم وقوعی و روش ارائه شده توسط Said را به عنوان دو روش مقایسه ای دیگر مورد بررس قرار داده ایم.
2-2-1- استخراج ویژگی روش پیشنهادی تحقیقات علم فیزیولوژی نشان می دهد که پردازش اطلاعات تصویری در سیستم بینایی، توسط مجموعه ای از مکانیسم های موازی به نام کانالها انجام می شود به طوریکه هر کانال برای یک باند فرکانسی کم پهنا و با جهت مشخص تنظیم می گردد.
به لحاظ ریاضی هر یک از این کانالها با یک جفت فیلتر میان گذر گابور مدل سازی می شوند.
ما در روش پیشنهادی از فیلترهای گابور چند کانالی که در [13] معرفی شده اند، استفاده کرده ایم.
ویژگی این فیلترها در نظرگرفتن یافته های تجربی در طراحی آنهاست و با رابطه زیر تعریف می شوند: (1) در این رابطه زوج مرکز فیلتر را مشخص می کند و پارامتر نیز انحراف معیار تابع گاسین است که اندازه محدوده پذیرش فیلتر را تعیین می کند.
مقدار شکل کشیدگی توابع یا محدوده پذیرش را مشخص می کند و مثلاً برای مقدار 1= شکل توابع گابور در حوزه فرکانس بصورت دایره و برای مقادیر 1 (2) در این رابطه پاسخ فیلتر گابور و f(x,y) نیز تصویر بلوک مورد نظر می باشد.
بر همین اساس مقدار انرژی گابور که از ترکیب پاسخ یک جفت سلول ساده با اختلاف فاز 2/ بدست می آید، با رابطه زیر تعریف می شود: (3) انرژی گابور رفتار سلولهای پیچیده سیستم بینایی را مدل سازی می کند و به عنوان ویژگی مؤثر در بسیاری از روشهای تحلیل بافت مورد استفاده قرار می گیرد [13و8].
بر اساس نتایج تجربی، پهنای باند فرکانسی برای سلولهای ساده ی قشر بینایی در حدود 1 اکتاو است [14]، بنابراین نسبت که تعیین کننده پهنای باند فرکانسی است با مقدار ثابت 0/56 مقداردهی می شود به نحوی که براساس رابطه زیر پهنای باند کانال برابر 1 اکتاو شود: (4) بر اساس مطالعاتی که Wiesel , Hubel [15] انجام داده اند، سلولهای ساده در راستای جهت های خاصی با پهنای باند تقریبی ْ30 حساس هستند.
بنابراین در روش پیشنهادی برای هشت جهت و همچنین سه فرکانس مکانی مقدار انرژی گابور را محاسبه نموده و 24 تصویر پاسخ بدست می آید.
انتخاب فرکانسها و جهت ها باید به نحوی باشد که دامنه فرکانسی پوشش داده شود (شکل 3).
*********** شکل 3: دامنه فرکانس پوشش داده شده با 24 فیلتر انتخابی در هر کانال، پاسخ های فیلترهای گابور ارایه کننده نواحی است که در راستای جهت و فرکانس کانال می باشند.
یک معیار مهم برای تفکیک نمودن بافت های مختلف این است که ویژگیهای مربوط به شکل هر یک از این نواحی را استخراج نماییم.
در این مقاله استخراج ویژگی از خروجی فیلترهای گابور را با استفاده از گشتاورهای هندسی انجام داده ایم.
گشتاور مرتبه (p+q) برای ناحیه ی R از تصویر فیلتر شده ی E1 با رابطه زیر محاسبه می شود: (5) از پنج ماسک ارایه شده در شکل 4 برای محاسبه گشتاورها و استخراج ویژگی استفاده نموده ایم.
این ماسک ها به هر 24 تصویر فیلتر شده اعمال می شوند و به ازای هر تصویر فیلتر شده E1، پنج تصویر گشتاور Mik (k=1,2,3,4,5) بدست خواهد آمد.
شکل 4: ماسکهای استفاده شده جهت محاسبه تصاویر گشتاورها برای اینکه تصاویر گشتاوری که دارای آمارگان مرتبه دو یا شدت روشنایی یکسان می باشند، از یکدیگر متمایز شوند، یک تبدیل غیرخطی به تصاویرگشتاورها اعمال شده و سپس بردار ویژگی نهایی بر اساس قدرمطلق انحراف از میانگین تصویر حاصل به دست می آید: (6) Fik به عنوان kامین ویژگی است که از تصویر فیلتر شده E1 با اندازه n*m محاسبه می شود.
نیز مقدار میانگین مربوط به تصویر گشتاور Mik است.
تابع تانژانت هایپربولیک که برای تبدیل غیرخطی مورد استفاده قرار گرفته، شکلی لگاریتمی دارد و در مطالعات Farrokhnia , Jain نیز بعنوان آشکارساز حباب ها مورد استفاده قرار گرفته است [16].
پارامتر شکل لگاریتمی تابع tanh را کنترل می کند و بر اساس نتایج تجربی مقدار 0/25 را اختیار می کند.
2-2-2- انرژی گابور انرژی گابور بعنوان یک ویژگی مفید در روشهای مبتنی بر فیلترهای گابور مورد استفاده قرار می گیرد.
همچنین فیلترهای گابور چند کانالی و ویژگی انرژی گابور در [11]، برای تعیین نوع زبانِ متون چاپی به کار رفته اند.
Zhu از انرژی گابور برای شناسایی نوع قلم در زبان انگلیسی و چینی استفاده کرد [12].
در این مقاله مقدار انرژی گابور را برای بانک فیلتر طراحی شده محاسبه نموده و چون شکل هیستوگرام تصاویر پاسخ اغلب شبیه به یک تابع گاسین است [11]، بنابراین میانگین و انحراف معیار هر 24 تصویر انرژی گابور محاسبه شده و بردار ویژگی نهایی را تشکیل می دهند.
برای هر تصویر بلوک ورودی یک بردار ویژگی 48 تایی بدست خواهد آمد.
2-2-3- تبدیل فوریه انرژی گابور Tan [17] مجموعه ای از ویژگی هایی را پیشنهاد نمود که بر اساس تبدیل فوریه انرژی گابور محاسبه شه و نسبت به چرخش نیز حساس نمی باشند.
با کمک این ویژگیها، نوع زبان در متون چاپی تشخیص داده می شود.
در این روش ابتدا انرژی گابور محاسبه شده و سپس مقدار متوسط برای تصویر انرژی گابور با رابطه زیر محاسبه می گردد: (7) تصویر انرژی گابور و مساحت تصویر انرژی گابور است.
برای یک فرکانس ثابت ، تبدیل فوریه یا بسادگی محاسبه شده و ضرایب فوریه به عنوان ویژگی بکار می روند.
اگر تعداد جهت ها در یک فرکانس مشخص برابر M باشد، آنگاه حداکثر تعداد ویژگیهای مستقل با توجه به گسسته بودن تابع ، برابر M/2+1 خواهد بود.
این ویژگیها برای بانک فیلتر پیشنهادی محاسبه شده و برای هر تصویر بلوک ورودی 15)5*3) ویژگی بدست خواهد آمد.
2-2-4- فیلترهای گابور متقارن Farrokhnia , Jain در [16] بانکی از فیلترهای گابور متقارن را برای تقطیع بافت مورد استفاده قرار داده اند.
فیلترهای متقارن بر اسا رابطه (1) و به ازای فاز بدست می آیند.
ما این فیلترها را با استفاده از بانک فیلتر طراحی شده، محاسبه نموده و سپس میانگین و انحراف معیار هر تصویر پاسخ را به عنوان ویژگی در نظر گرفته ایم.
2-2-5- تبدیل غیرخطی فیلترهای گابور متقارن در روشی که Farrokhnia , Jain پیشنهاد نمودند [16]، بانکی از فیلترهای گابور متقارن به تصویر ورودی اعمال شده و سپس هر کدام از تصاویر پاسخ به یک تبدیل غیرخطی tanh فرستاده می شوند.
پس برای هر نقطه تصویر، یک بردار ویژگی nتایی که n تعداد فیلترهای گابور در بانک مورد نظر است، بدست می آید.
بردارهای ویژگی متناظر با هر نقطه خوشه بندی شده و تقطیع تصویر بافت به kخوشه را فراهم می نمایند.
این ویژگی نیز برای بانک فیلتر مورد نظر محاسبه شده و میانگین و انحراف معیار هر 24 تصویر حاصل را به عنوان بردار ویژگی نهایی مورد استفاده قرار می دهیم.
2-2-6- روش Said در این مقاله ویژگی هایی که توسط Said [8] برای متون دستنویس انگلیسی پیشنهاد شده را نیز مورد بررسی قرار داده ایم.
در این روش فیلترهای گابوری که در [18] معرفی شده است، استفاده شده و هر کانال توسط یک جفت فیلتر گابور مدل سازی می شود.
مقدار انرژی گابور به ازای چهار جهت ْ0,45,90,135 و چهار فرکانس f=32,16,8,4 محاسبه می شود و میانگین و انحراف معیار آن به عنوان ویژگی مورد استفاده قرار می گیرند.
2-2-7- ماتریس هم وقوعی ماتریس هم وقوعی به عنوان یک روش سنتی در بحث تحلیل بافت پیاده سازی شده و نتایج آن مورد بررسی قرار گرفته اند.
ماتریس هم وقوعی بلوک مورد نظر به ازای چهار جهت ْ0,45,90,135 و چهار فاصله d=1,2,3,4 محاسبه شده و به دلیل باینری بودن تصاویر، یک ماتریس هم وقوعی 2*2 به ازای هر جهت و فاصله مشخص به دست می آید.
به دلیل تقارن قطری، سه عنصر از چهار عنصر هر ماتریس به عنوان ویژگی در نظر گرفته می شود که در نهایت برای هر تصویر بلوک ورودی 48 ویژگی بدست خواهد آمد.
2-3- تعیین هویت نویسنده در مسئله تعیین هویت نویسنده، استفاده از روشهایی چون ماشین بردار پشتیبان یا شبکه های عصبی چند لایه چندان مناسب به نظر نمی رسد زیرا بار محاسباتی این روشها برای داده های واقعی توجیه پذیر نخواهد بود.
بنابراین از فاصله اقلیدسی وزن دار و فاصله x2 جهت تعیین هویت استفاده نموده ایم.
چون فاصله x2 دارای دقت بهتری بود، در این مقاله فقط نتایج مربوط به این طبقه بندی کننده ارائه می شوند.
فاصله x2 برای ویژگی های دو متن مورد نظر با رابطه زیر تعریف می شود: (8) در این رابطه fki ویژگی kام متن ورودی iام و mkj میانگین ویژگی kام نویسنده jام است که با استفاده از بلوکهای آموزشی مربوط به وی محاسبه می شود.
3- نتایج تجربی برای ارزیابی روش پیشنهادی و سایر روشهای بررسی شده در این مقاله، از 40 فرد با تحصیلات، سن و جنسیت مختلف خواسته شد که متن دلخواهی را بر روی یک برگه کاغذ A4 بنویسند.
سپس متون دستنویس را با رزولوشن 300dpi اسکن نموده و مراحل باینری کردن و نرمال سازی را انجام دادیم.
********** شکل 5: چند نمونه از متون دستنویس افراد مختلف در نتیجه برای هر نویسنده یک تصویر نرمال سازی شده با اندازه 256*384 بدست آمد.
تصویر را به شش بلوک 128*128 که با همدیگر هم پوشانی ندارند، تقسیم نموده و چهار بلوک را برای مرحله آموزش و دو بلوک را برای مرحله آزمایش در نظر گرفتیم.
در شکل 5 نمونه هایی از دستخط افراد مختلف را مشاهده می کنیم.
با ارزیابی روش پیشنهادی برای نمونه های آزمایشی، نتایج نرخ تعیین هویت صحیح بر اساس فاصله x2 در جدول 1 آورده شده است.
همچنین ترکیب مختلف ویژگیها را بررسی نموده و مشخص شد که تعیین هویت برای های کوچکتر یا بعبارتی فرکانسهای بالاتر، با صحت بیشتری انجام شده است.
ویژگی میانگین نیز نسبت به ویژگی انحراف معیار حاوی اطلاعات بیشتری است.
برای سایر روشها نیز ترکیب مختلف ویژگیها بررسی شد که به دلیل تعداد زیاد جدولها، در این مقاله فقط بهترین نتیجه مربوط به هر روش در جدول 2 خلاصه شده است.
نتایج نشان می دهد که نرخ تعیین هویت صحیح برای ویژگی تبدیل فوریه انرژی گابور کمتر از ویژگی انرژی گابور است اما باید در نظر داشت که طول بردار ویژگی کوچکتر و حساس نبودن نسبت به چرخش از امتیازات آنهاست.
علیرغم اینکه فیلترهای گابور متقارن در بحث تقطیع بافت عملکرد خوبی دارند [16]، نتایج این ویژگیها بیانگر این نکته است که این ویژگیها برای مسئله طبقه بندی بافت جهت تعیین هویت نویسنده، مناسب نمی باشند.
همچنین نتایج جدول 2 نشان می دهد که تبدیل غیرخطی بر روی خروجی فیلترهای گابور می تواند کارایی این فیلترها را تا حد زیادی افزایش دهد.
بررسی های ما نشان می دهد که در روش Said نیز تعیین هویت برای فرکانس های بالاتر و همچنین ویژگی میانگین با دقت بیشتری انجام شده است[1].
در مورد ماتریس هم وقوعی نیز استفاده از فاصله های کوچکتر نتایج بهتری داشته [1] و بهترین نرخ تعیین هویت صحیح یعنی %66/25 در لیست برخورد با اندازه 5 و به ازای d=1,2 حاصل شده است.
با بررسی نتایج مشخص می شود که روش پیشنهادی از کارایی بهتری برای متون دستنویس فارسی برخوردار است البته باید در نظر داشت که هدف ما مقایسه روش Said و روش پیشنهادی نیست زیرا در روش Said از فیلترهای گابوری استفاده شده که برای متون دستنویس انگلیسی کارایی دارند و بنابراین ویژگی روش پیشنهادی متناسب بودن فیلترهای گابور انتخابی با ساختار متون دستنویس فارسی و ارایه ویژگیهای کاراتر می باشد.
جدول 1: نرخ تعیین هویت صحیح (درصد) برای روش پیشنهادی، بر اساس فاصله x2 و اندازه لیست برخورد جدول 2: بهترین نرخ تعیین هویت صحیح (درصد) برای سایر روشها، بر اساس فاصله x2 و اندازه لیست برخورد اما در مجموع می توان نتیجه گیری کرد که کارایی روش پیشنهادی به دو دلیل بهتر از روش Said بوده است: اول اینکه مشخصات بانک فیلتر روش پیشنهادی با نتایج تجربی در مورد سیستم بینایی سازگارتر است و دوم اینکه تنوع جهت د دست نوشته های فارسی نسبت به انگلیسی کمتر است و معمولاً به دلیل سرکش ها و زیرکش ها یک جهت غالب را در متون دستنویس فارسی نمی توان یافت.
به همین دلیل نتایج Said بر روی متون دستنویس فارسی ضعیفتر از نتایجی است که با همین روش برای متون انگلیسی حاصل شده است [8].
در واقع در روش پیشنهادی با در نظر گرفتن جهت های بیشتر و روش استخراج ویژگی کاراتر، اطلاعات بیشتری در مورد جهت دست نوشته استخراج شده و نرخ تعیین هویت بالاتری بدست می آید.
همچنین نتایج بیانگر این است که روشهای مبتنی بر فیلتر گابور و مفهوم تجزیه چندکانالی نسبت به روشهای سنتی مثل ماتریس هم وقوعی، کارایی بهتری دارند.
4- جمع بندی در این مقاله روشی برای تعیین هویت نویسنده بر اساس متون دست نویس فارسی پیشنهاد شد که بصورت برون خط انجام شده و مستقل از متن می باشد.
نتایج فیلترهای گابور و ماتریس هم وقوعی بیانگر این است که در حوزه فرکانس به ازای فرانسهای بالاتر و در حوزه مکان به ازای همسایگی های نزدیکتر، نرخ تعیین هویت صحیح بهتری بدست می آید بنابراین احتمالاً در نظر گرفتن ویژگی هایی از بافت تصویر که جزییات بافت را شامل می شوند، نتایج بهتری خواهد داشت.
چون مسئله تعیین هویت نویسنده با استفاده از متن دستنویس فارسی اولین بار انجام می شود، این نتایج امیدوارکننده است و با بهبود مراحل پیش پردازش و نرمال سازی تصویر مثلاً تصحیح کجی خطوط، می توان به نتایج بهتری دست یافت.
علاوه بر این ویژگی های معرفی شده در این پروژه از نوع ویژگی های سراسری هستند که انتظار داریم با ترکیب آنها بهمراه ویژگیهای محلی، نتایج بهتری را بدست آوریم.
ویژگیهای محلی را می توان در سطح کل متن، پاراگراف، خط، کلمه و یا نویسه استخراج نمود.
[1و2و5].
مراجع [1] ف.
شهابی نژاد و م.
رحمتی، "تعیین و تأیید هویت افراد مبتنی بر متون دستنویس فارسی"، پایان نامه کارشناسی ارشد، دانشکده مهندسی کامپیوتر، دانشگاه صنعتی امیرکبیر، 1385.
[2] S.
N.
Srihari, H.
Arora, S.
H.
Cha and Sangjik Lee, “Individuality of handwriting,” Journal of Forensic Sciences, vol.
47, no.
4, pp.
1-17 , 2002.
[3] A.
Bensefia, T.
Paquet and L.
Heutte, “A writer identification and verification system,” Pattern Recognition Letters, vol.
26, issue 13, pp.
2080- 2092, 2005.
[4] L.
Schomaker and M.
Bulacu, “Automatic writer identification using connected-component contours and edge-based features of upper-case western script,” IEEE Trans.
On Pattern Analysis and Machine Intelligence, vol.
26, no.
6, pp.
787-798, 2004.
[5] M.
Bulacu, L.Schomaker, and L.
Vuurpijl, “Writer identification using edge-based directional features,” In Seventh Int, Conf.
on Document Analysis and Recognition, pp.
937-941, 2003.
[6] E.N.
Zois and V.
Anastassopoulos, “Morphological waveform coding for writer identification,” Pattern Recognition, vol.
33, pp.
385-398, 2000.
[7] A.
Schlaphach and H.
Budke, “Using HMM based recognizers for writer identification and verification,” IEEE Proc.
Of 9th Int.
Workshop on Frontiers in Handwriting Recognition, pp.
167-172, 2004.
[8] H.
E.
Said, T.
Tan and K.
D.
Baker, “Personal identification based on handwriting,” Pattern Recognition, vol.
33, No.
1, pp.
149-160, 2000.
[9] J.
Ha, R.M.
Haralick and T.
Phillips, “Document page decomposition by the bounding-box projection techniques,” Proc.
Int.
Conf.
1119-1122, 1995.
[10] R.
Manmatha and L.
Rothfeder, “A scale space approach for automatically segmentation words from historical handwritten documents,” IEEE Trans.
27, no.
8, pp.
1212-1225,2005.
[11] G.S.
Peake, T.N.
Tan, “Script and language identification from document images,” In Proc.
Of the BMVC `97, vol.2,pp.
610-619, 1997.
[12] Y.
Zhu, T.N.
Tan and Y, Wang, “Font recognition based on global texture analysis,” IEEE Trans.
23, No.
1192-1200, 2001.
[13] P.
Kruizinga and , “Nonlinear operator for oriented texture,” IEEE Trans.
On Image Processing, vol.
8, no.
10, pp.
1395-1407, 1999.
[14] D.A.
Pollen and S.F.
Ronner, “Visual cortical neurons as localized spatial frequency filters,” IEEE Trans.
On Systems, Man and Cybernetics, vol.
13, no.
5, pp.
907-916, 1983.
[15] D.H.
Hubel and T.N.
Wiesel, “Receptive fields and functional architecture in two nonstriate visual areas 18 and 19 of the cat,” J.
of Neurophysiology, vol.
28, pp.
229-289, 1956.
[16] A.K.
Jain and F.
Farrokhnia, “Unsupervised texture segmentation using Gabor filters,” Pattern Recognition, vol.
24, no.
12, pp.
1167- 1186, 1991.
[17] T.N.
Tan, “Rotation invariant texture features and their use in automatic script identification,” IEEE Trans.
on Pattern Analysis and Machine Intelligence, vol.
20, no.
7, pp.
751-756, 1998.
[18] T.N.
Tan “Texture feature extraction via visual cortical channel modeling.” Proc.
of 11th IAPR Int.
conf.
Pattern Recognition, vol.
3, pp.
607-610, 1992.