اغلب تحقیقات انجام شده در زمینه تعیین هویت نویسنده بر روی زبان انگلیسی متمرکز بوده و تاکنون مطالعاتی در زمینه متون دستنویس فارسی گزارش نشده است. بنابراین در این مقاله روشی برای تعیین هویت نویسنده بر اساس متن دست نویس فارسی پیشنهاد شده که به صورت برون خط و مستقل از متن انجام می شود. بر اساس ایده مطرح شده در مطالعات قبلی، در روش پیشنهادی تصویر متن دست نویس به صورت یک بافت در نظر گرفته شده و پس از مرحله نرمال سازی، با کمک فیلترهای گابور ویژگی های متن استخراج می شود. ویژگی روش پیشنهادی استفاده از بانک فیلتری است که با ساختار متون دستنویس فارسی و همچنین سیستم بینایی تناسب بیشتری دارد. علاوه بر این روش جدیدی جهت استخراج ویژگیها از خروجی فیلترهای گابور پیشنهاد شده که مبتنی بر ویژگی انرژی گابور و گشتاورهای هندسی است. همچنین برای اولین بار، روشهای مختلف استخراج ویژگی از خروجی فیلترهای گابور را برای مسئله تعیین هویت نویسنده مورد بررسی کامل قرار داده ایم. تمامی این روشها به همراه دو روش ماتریس هم وقوعی و روش Said که مبتنی بر فیلترهای گابور می باشد و برای متون انگلیسی پیشنهاد شده است، را پیاده سازی نموده ایم. نتایج اجرای روشها بر روی تصاویر دستخط 40 نفر که هیچ محدودیتی در نوع دستخط آنها وجود ندارد، نشان می دهد که روش پیشنهادی از کارایی بالاتری برای متون دستنویس فارسی برخوردار است.
در بین ویژگی های رفتاری دستخط افراد به راحتی قابل حصول است و علاوه بر این مطالعات نشان می دهند که افراد مختلف دارای دستخط های متفاوتی نیز می باشند. به همین دلیل تعیین هویت افراد به کمک متون دست نویس آنها، به عنوان یک موضوع تحقیقاتی در طی سالهای اخیر مورد توجه قرار گرفته و کاربرد آن در زمینه مسائل امنیتی، حقوقی، کنترل دسترسی به سیستمها و فعالیتهای مالی می باشد. هرچند که تعیین هویت بر اساس دستخط در مقایسه با ویژگیهای فیزیولوژیکی مثل الگوی عنبیه و اثر انگشت از دقت کمتری برخوردار است، اما این مسئله در جاهایی که اطلاعاتی بجز دستخط در دسترس نمی باشد و یا بعنوان مکملی جهت کارایی سیستمهای امنیتی و یاری رساندن به افراد خط شناس، کاربرد مشهودتری دارد. در مسئله تعیین هویت هدف این است که با داشتن یک متن دستنویس، هویت نویسنده آن را مشخص کنیم. هدف این مقاله این است که با ترکیب روشهای پردازش تصویر و شناسایی الگو راه حلی ماشینی برای تعیین هویت نویسنده ارایه دهد. این روشها را می توان به دو دسته کلی زیر تقسیم کرد:
1- روشهای برون خط (off line): در این روشها فقط تصویر متن دستنویس در دسترس است و ویژگیها با توجه به کل تصویر یا ساختار کلمه ها و نویسه ها استخراج می شوند. در این روشها بسیاری از اطلاعات دینامیکی که مربوط به طرز نوشتن افراد است، از دست می رود و این امر کار را نسبت به روشهای برخط مشکلتر می سازد. روشهای برون خط را می توان به دو گروه کلی وابسته به متن و مستقل از متن نیز دسته بندی کرد. در روشهای وابسته به متن، باید متن ثابتی توسط نویسنده نوشته شود تا بتوان هویت وی را مشخص نمود اما در روشهای مستقل از متن، با استفاده از هر نوع متنی هویت نویسنده آن مشخص می گردد.
2- روشهای برخط (on line): در این روشها علاوه بر ویژگیهای برون خط از اطلاعات دینامیکی مثل فشار قلم، ترتیب نوشتن، سرعت نوشتن، فرم ضربه های قلم و غیره نیز استفاده می شود. بنابراین بدلیل داشتن اطلاعات بیشتر، تعیین هویت با دقت بیشتری انجام می شود اما این روشها کاربردهای محدودتری را شامل می شوند.
فرض منحصر به فرد بودن دستخط افراد، بصورت علمی توسط Srihari بررسی شده است [2و1]. در این مطالعه 1000 نفر از بین جمعیت چندین ایالت مختلف آمریکا و بر اساس تفاوت سن، نژاد، تحصیلات و جنسیت انتخاب شدند و از آنها خواسته شد که متن مشخصی را سه مرتبه و بر روی یک کاغذ بدون خط و با خودکار مشکی بنویسند. سپس ویژگیهایی در سطح کل متن، پاراگراف، خط و کلمه از متون دست نویس استخراج شده و با کمک فاصله اقلیدسی تعیین هویت انجام می شود. از جمله کارهای انجام شده در زمینه تعیین هویت نویسنده، می توان به مواردی چون روش مبتنی بر ارزیابی اطلاعات [3]، استفاده از ویژگی کانتور اجزاء متصل [4]، روش مبتنی بر ویژگیهای لبه [5]، کدگذاری هیستوگرام نمای عمودی با کمک مورفولوژی (6) و روش مبتنی بر مدل مخفی مارکوف [7] اشاره کرد. اغلب روشهای مذکور برای متن ثابت ارایه شده اند و نیازمند تقطیع متن می باشند. چون هدف ما ارایه روشی خودکار جهت تعیین هویت نویسنده بوده و محدودیتی برای نوع دستخط های مورد بررسی قرار نداده ایم، بنابراین استفاده از روشهایی که نیازمند تقطیع خودکار و کامل متن به کلمات و حروف می باشند، مورد نظر نیست. بنابراین در این مقاله با استفاده از یک روش مبتنی بر بافت، متن دستنویس را به صورت تصویر بافت در نظر گرفته و مسئله تعیین هویت نویسنده به مسئله طبقه بندی بافت تبدیل می گردد.
2- روش پیشنهادی
در این روش از ایده مطرح شده در [8] استفاده شده و تصویر متن دست نویس بصورت یک بافت در نظر گرفته شده است. برای این منظور ابتدا مراحل نرمال سازی بر روی تصویر متن انجام شده و سپس ویژگیهای متن به کمک بانکی از فیلترهای گابور استخراج می شوند. با کمک این ویژگیها و یک طبقه بندی کننده هویت متن دست نویس ورودی تعیین می گردد. در ادامه به شرح هر یک از این مراحل خواهیم پرداخت.