فایل ورد کامل مقاله مقایسه ویژگیهای مبتنی بر فیلترهای گابور و ارائه روشی نوین برای تشخیص هویت نویسنده بر اساس دستنوشتههای فارسی
توجه : به همراه فایل word این محصول فایل پاورپوینت (PowerPoint) و اسلاید های آن به صورت هدیه ارائه خواهد شد
فایل ورد کامل مقاله مقایسه ویژگیهای مبتنی بر فیلترهای گابور و ارائه روشی نوین برای تشخیص هویت نویسنده بر اساس دستنوشتههای فارسی دارای ۲۵ صفحه می باشد و دارای تنظیمات در microsoft word می باشد و آماده پرینت یا چاپ است
فایل ورد فایل ورد کامل مقاله مقایسه ویژگیهای مبتنی بر فیلترهای گابور و ارائه روشی نوین برای تشخیص هویت نویسنده بر اساس دستنوشتههای فارسی کاملا فرمت بندی و تنظیم شده در استاندارد دانشگاه و مراکز دولتی می باشد.
توجه : در صورت مشاهده بهم ریختگی احتمالی در متون زیر ،دلیل ان کپی کردن این مطالب از داخل فایل ورد می باشد و در فایل اصلی فایل ورد کامل مقاله مقایسه ویژگیهای مبتنی بر فیلترهای گابور و ارائه روشی نوین برای تشخیص هویت نویسنده بر اساس دستنوشتههای فارسی،به هیچ وجه بهم ریختگی وجود ندارد
بخشی از متن فایل ورد کامل مقاله مقایسه ویژگیهای مبتنی بر فیلترهای گابور و ارائه روشی نوین برای تشخیص هویت نویسنده بر اساس دستنوشتههای فارسی :
مقایسه ویژگی های مبتنی بر فیلترهای گابور و ارایه روشی جدید برای تعیین هویت نویسنده بر اساس دست نوشته فارسی
چکیده
اغلب تحقیقات انجام شده در زمینه تعیین هویت نویسنده بر روی زبان انگلیسی متمرکز بوده و تاکنون مطالعاتی در زمینه متون دستنویس فارسی گزارش نشده است. بنابراین در این مقاله روشی برای تعیین هویت نویسنده بر اساس متن دست نویس فارسی پیشنهاد شده که به صورت برون خط و مستقل از متن انجام می شود. بر اساس ایده مطرح شده در مطالعات قبلی، در روش پیشنهادی تصویر متن دست نویس به صورت یک بافت در نظر گرفته شده و پس از مرحله نرمال سازی، با کمک فیلترهای گابور ویژگی های متن استخراج می شود. ویژگی روش پیشنهادی
استفاده از بانک فیلتری است که با ساختار متون دستنویس فارسی و همچنین سیستم بینایی تناسب بیشتری دارد. علاوه بر این روش جدیدی جهت استخراج ویژگیها از خروجی فیلترهای گابور پیشنهاد شده که مبتنی بر ویژگی انرژی گابور و گشتاورهای هندسی است. همچنین برای اولین بار، روشهای مختلف استخراج ویژگی از خروجی فیلترهای گابور را برای مسئله تعیین هویت نویسنده مورد بررسی کامل قرار داده ایم. تمامی این روشها به همراه دو روش ماتریس هم وقوعی و روش Said که مبتنی بر فیلترهای گابور می باشد و برای متون انگلیسی پیشنهاد شده است، را پیاده سازی نموده ایم. نتایج اجرای روشها بر روی تصاویر دستخط ۴۰ نفر که هیچ محدودیتی در نوع دستخط آنها وجود ندارد، نشان می دهد که روش پیشنهادی از کارایی بالاتری برای متون دستنویس فارسی برخوردار است.
واژه های کلیدی: تعیین هویت نویسنده، دست نوشته، فیلتر گابور چند کانالی، ماتریس هم وقوعی
۱- مقدمه
در بین ویژگی های رفتاری دستخط افراد به راحتی قابل حصول است و علاوه بر این مطالعات نشان می دهند که افراد مختلف دارای دستخط های متفاوتی نیز می باشند. به همین دلیل تعیین هویت افراد به کمک متون دست نویس آنها، به عنوان یک موضوع تحقیقاتی در طی سالهای اخیر مورد توجه قرار گرفته و کاربرد آن در زمینه مسائل امنیتی، حقوقی، کنترل دسترسی به سیستمها و فعالیتهای مالی می باشد. هرچند که تعیین هویت بر اساس دستخط در مقایسه با ویژگیهای فیزیولوژیکی مثل الگوی عنبیه و اثر انگشت از دقت کمتری برخوردار است، اما این مسئله در جاهایی که اطلاعاتی بجز دستخط در دسترس نمی باشد و یا بعنوان مکملی جهت کارایی سیستمهای
امنیتی و یاری رساندن به افراد خط شناس، کاربرد مشهودتری دارد. در مسئله تعیین هویت هدف این است که با داشتن یک متن دستنویس، هویت نویسنده آن را مشخص کنیم. هدف این مقاله این است که با ترکیب روشهای پردازش تصویر و شناسایی الگو راه حلی ماشینی برای تعیین هویت نویسنده ارایه دهد. این روشها را می توان به دو دسته کلی زیر تقسیم کرد:
۱- روشهای برون خط (off line): در این روشها فقط تصویر متن دستنویس در دسترس است و
ویژگیها با توجه به کل تصویر یا ساختار کلمه ها و نویسه ها استخراج می شوند. در این روشها بسیاری از اطلاعات دینامیکی که مربوط به طرز نوشتن افراد است، از دست می رود و این امر کار را نسبت به روشهای برخط مشکلتر می سازد. روشهای برون خط را می توان به دو گروه کلی وابسته به متن و مستقل از متن نیز دسته بندی کرد. در روشهای وابسته به متن، باید متن ثابتی توسط نویسنده نوشته شود تا بتوان هویت وی را مشخص نمود اما در روشهای مستقل از متن، با استفاده از هر نوع متنی هویت نویسنده آن مشخص می گردد.
۲- روشهای برخط (on line): در این روشها علاوه بر ویژگیهای برون خط از اطلاعات دینامیکی مثل فشار قلم، ترتیب نوشتن، سرعت نوشتن، فرم ضربه های قلم و غیره نیز استفاده می شود. بنابراین بدلیل داشتن اطلاعات بیشتر، تعیین هویت با دقت بیشتری انجام می شود اما این روشها کاربردهای محدودتری را شامل می شوند.
فرض منحصر به فرد بودن دستخط افراد، بصورت علمی توسط Srihari بررسی شده است [۲و۱]. در این مطالعه ۱۰۰۰ نفر از بین جمعیت چندین ایالت مختلف آمریکا و بر اساس تفاوت سن، نژاد، تحصیلات و جنسیت انتخاب شدند و از آنها خواسته شد که متن مشخصی را سه مرتبه و بر روی یک کاغذ بدون خط و با خودکار مشکی بنویسند. سپس ویژگیهایی در سطح کل متن، پاراگراف، خط و کلمه از متون دست نویس استخراج شده و با کمک فاصله اقلیدسی تعیین هویت انجام می شود. از جمله کارهای انجام شده در زمینه تعیین هویت نویسنده، می توان به مواردی چون روش مبتنی بر ارزیابی اطلاعات [۳]، استفاده از ویژگی کانتور اجزاء متصل [۴]، روش مبتنی بر ویژگیهای لبه [۵]، کدگذاری هیستوگرام نمای عمودی با کمک مورفولوژی (۶) و روش مبتنی بر مدل مخفی
می باشند. چون هدف ما ارایه روشی خودکار جهت تعیین هویت نویسنده بوده و محدودیتی برای نوع دستخط های مورد بررسی قرار نداده ایم، بنابراین استفاده از روشهایی که نیازمند تقطیع خودکار و کامل متن به کلمات و حروف می باشند، مورد نظر نیست. بنابراین در این مقاله با استفاده از یک روش مبتنی بر بافت، متن دستنویس را به صورت تصویر بافت در نظر گرفته و مسئله تعیین هویت نویسنده به مسئله طبقه بندی بافت تبدیل می گردد.
۲- روش پیشنهادی
در این روش از ایده مطرح شده در [۸] استفاده شده و تصویر متن دست نویس بصورت یک بافت در نظر گرفته شده است. برای این منظور ابتدا مراحل نرمال سازی بر روی تصویر متن انجام شده و سپس ویژگیهای متن به کمک بانکی از فیلترهای گابور استخراج می شوند. با کمک این ویژگیها و یک طبقه بندی کننده هویت متن دست نویس ورودی تعیین می گردد. در ادامه به شرح هر یک از این مراحل خواهیم پرداخت.
۲-۱- نرمال سازی تصویر
روشهای تحلیل بافت را نمی توان مستقیماً برای تصویر متن دست نویس به کار گرفت و ابتدا باید تصویر را نسبت به تأثیر عواملی مثل فاصله خطوط، کلمات و غیره نرمال سازی نمود تا بلوکی یکنواخت از متن دست نویس مورد نظر حاصل شود. مراحل نرمال سازی تصویر متن عبارتند از:
(الف) به منظور استخراج خطوط و کلمات موجود در متن، معمولاً از منحنی نمای نیم رخ تصویر باینری استفاده می شود [۹]. در این مقاله ما نسخه ای تغییر یافته از این الگوریتم که برای تصاویر سطوح خاکستری پیشنهاد شده [۱۰]، را استفاده نموده ایم. ابتدا نمای نیم رخ افقی تصویر محاسبه شده و سپس با یک فیلتر پایین گذر گاسین هموارسازی می شود. هموارسازی ماکزیمم های محلی را حذف نموده و حساسیت به نویز را کاهش می دهد. در شکل ۱ تصویر متن دستنویس، منحنی نیم رخ افقی و منحنی هموارسازی شده متناظر با آن را مشاهده می کنیم. در این منحنی قله ها متناظر با فاصله بین خطوط و دره ها متناظر با مرکز خطوط متن هستند که برای یافتن قله ها یا خطوط در متن می توان نقاط صفر در مشتق منحنی را محاسبه نمود. به دلیل خطی بودن کانولوشن، هموارسازی و مشتق گیری را می توان در یک مرحله انجام داد. پس برای یافتن خطوط متن کافی است منحنی نمای نیم رخ افقی را با مشتق تابع گاسین فیلتر نماییم.
***********
شکل ۱: استخراج خطوط متن الف) تصویر متن ب) منحنی نیم رخ افقی ج) منحنی نیم رخ افقی پس از هموارسازی
(ب) هر یک از خطوط متن که در مرحله قبل پیدا شدند، باینری شده و سپس نمای نیم رخ عمودی مربوط به آن محاسبه می شود. با کمک این منحنی فاصله های بین کلمات را پیدا می کنیم و فاصله هایی که اندازه آنها از ۵ نقطه بیشتر باشد را با مقدار ۵ نقطه نرمال می کنیم. بنابراین فاصله کلمات حداکثر ۵ نقطه خواهد بود و فاصله های کمتر از ۵ نقطه نیز بعنوان فاصله های بین حروف در نظر گرفته می شوند. همچنین در صورتی که انتهای خط خالی باشد، با تکرار مجد فاصله بین خطوط و پر کردن خطوط در شکل ۲-الف ارایه شده است.
(ج) در صورت خالی بودن بخش انتهایی تصویر، آنرا با تکرار مجدد خطوط ابتدایی تصویر به نحوی پر می کنیم که طول تصویر به اندازه مشخصی (در این مقاله ۳۸۴ نقطه) برسد. در شکل ۲-ب تصویر نرمال سازی شده نهایی ارایه شده است.
*******************
شکل ۲: الف) نرمال سازی بین کلمات، فاصله خطوط و پرکردن انتهای خطوط ب) پرکردن بخش انتهایی (تصویر نهایی)
۲-۲- استخراج ویژگی
به منظور ارایه روشی کارا جهت تعیین هویت نویسنده، باید ویژگی هایی را در نظر گرفت که بیانگر تفاوت دستخط های مختلف می باشند. بنابراین در این مقوله استفاده از ویژگی های معرفی شده در مطالعات OCR مناسب به نظر نمی رسد زیرا هدف طراحی این ویژگی ها، تشخیص کلمات و حروف مستقل از تفاوت دستخطهای مختلف می باشد. به دلیل کارایی خوب فیلتر گابور در بحث تحلیل بافت و کاربردهای مشابه [۱۲و۱۱و۸]، محاسبه ویژگیها را بر این اساس انجام دادیم. برای این منظور طراحی بانک فیلتر گابور را بر اساس نتایج تجربی و مطالعات انجام شده در زمینه نحوه
عملکرد سیستم بینایی انجام داده ایم وبرای استخراج ویژگی، یک روش جدید بر اساس گشتاورهای هندسی و انرژی گابور پیشنهاد کرده ایم. همچنین با استفاده از بانک فیلتر طراحی شده، سایر روشهای موجود برای استخراج ویژگی مبتنی بر فیلترهای گابور را بررسی و مقایسه نموده ایم. علاوه بر این ویژگی های مبتنی بر ماتریس هم وقوعی و روش ارائه شده توسط Said را به عنوان دو روش مقایسه ای دیگر مورد بررس قرار داده ایم.
۲-۲-۱- استخراج ویژگی روش پیشنهادی
تحقیقات علم فیزیولوژی نشان می دهد که پردازش اطلاعات تصویری در سیستم بینایی، توسط مجموعه ای از مکانیسم های موازی به نام کانالها انجام می شود به طوریکه هر کانال برای یک
باند فرکانسی کم پهنا و با جهت مشخص تنظیم می گردد. به لحاظ ریاضی هر یک از این کانالها با یک جفت فیلتر میان گذر گابور مدل سازی می شوند. ما در روش پیشنهادی از فیلترهای گابور چند کانالی که در [۱۳] معرفی شده اند، استفاده کرده ایم. ویژگی این فیلترها در نظرگرفتن یافته های تجربی در طراحی آنهاست و با رابطه زیر تعریف می شوند:
(۱)
در این رابطه زوج مرکز فیلتر را مشخص می کند و پارامتر نیز انحراف معیار تابع گاسین است که اندازه محدوده پذیرش فیلتر را تعیین می کند. مقدار شکل کشیدگی توابع یا محدوده پذیرش را مشخص می کند و مثلاً برای مقدار ۱= شکل توابع گابور در حوزه فرکانس بصورت دایره و برای مقادیر ۱< به صورت بیضی خواهد بود. پارامتر طول موج تابع cos و مشخص کننده فرکانس مکانی /۱ مربوط به کانال مورد نظر می باشد. پارامتر که مقداری بین ۰ و را انتخاب می کند، جهت مربوط به کانال را تعیین می نماید. در واقع دو پارامتر و مشخص کننده مکان کانال مورد نظر در نقشه فرکانسی و پارامتر نیز تعیین کننده فاز است. پاسخ فیلتر گابور از کانولوشن تابع معرفی شده در رابطه (۱) با تصویر بلوک مورد نظر به دست خواهد آمد:
(۲)
در این رابطه پاسخ فیلتر گابور و f(x,y) نیز تصویر بلوک مورد نظر می باشد. بر همین اساس مقدار انرژی گابور که از ترکیب پاسخ یک جفت سلول ساده با اختلاف فاز ۲/ بدست می آید، با رابطه زیر تعریف می شود:
(۳)
انرژی گابور رفتار سلولهای پیچیده سیستم بینایی را مدل سازی می کند و به عنوان ویژگی مؤثر در بسیاری از روشهای تحلیل بافت مورد استفاده قرار می گیرد [۱۳و۸]. بر اساس نتایج تجربی، پهنای باند فرکانسی برای سلولهای ساده ی قشر بینایی در حدود ۱ اکتاو است [۱۴]، بنابراین ن
سبت که تعیین کننده پهنای باند فرکانسی است با مقدار ثابت ۰/۵۶ مقداردهی می شود به نحوی که براساس رابطه زیر پهنای باند کانال برابر ۱ اکتاو شود:
(۴)
بر اساس مطالعاتی که Wiesel , Hubel [15] انجام داده اند، سلولهای ساده در راستای جهت های خاصی با پهنای باند تقریبی ْ۳۰ حساس هستند. بنابراین در روش پیشنهادی برای هشت جهت و همچنین سه فرکانس مکانی مقدار انرژی گابور را محاسبه نموده و ۲۴ تصویر پاسخ بدست می آید. انتخاب فرکانسها و جهت ها باید به نحوی باشد که دامنه فرکانسی پوشش داده شود (شکل ۳).
***********
شکل ۳: دامنه فرکانس پوشش داده شده با ۲۴ فیلتر انتخابی
در هر کانال، پاسخ های فیلترهای گابور ارایه کننده نواحی است که در راستای جهت و فرکانس کانال می باشند. یک معیار مهم برای تفکیک نمودن بافت های مختلف این است که ویژگیهای مربوط به شکل هر یک از این نواحی را استخراج نماییم. در این مقاله استخراج ویژگی از خروجی فیلترهای گابور را با استفاده از گشتاورهای هندسی انجام داده ایم. گشتاور مرتبه (p+q) برای ناحیه ی R از تصویر فیلتر شده ی E1 با رابطه زیر محاسبه می شود:
(۵)
از پنج ماسک ارایه شده در شکل ۴ برای محاسبه گشتاورها و استخراج ویژگی استفاده نموده ایم. این ماسک ها به هر ۲۴ تصویر فیلتر شده اعمال می شوند و به ازای هر تصویر فیلتر شده E1، پنج تصویر گشتاور Mik (k=1,2,3,4,5) بدست خواهد آمد.
شکل ۴: ماسکهای استفاده شده جهت محاسبه تصاویر گشتاورها
برای اینکه تصاویر گشتاوری که دارای آمارگان مرتبه دو یا شدت روشنایی یکسان می باشند، از یکدیگر متمایز شوند، یک تبدیل غیرخطی به تصاویرگشتاورها اعمال شده و سپس بردار ویژگی نهایی بر اساس قدرمطلق انحراف از میانگین تصویر حاصل به دست می آید:
(۶)
Fik به عنوان kامین ویژگی است که از تصویر فیلتر شده E1 با اندازه n*m محاسبه می شود. نیز مقدار میانگین مربوط به تصویر گشتاور Mik است. تابع تانژانت هایپربولیک که برای تبدیل غیرخطی مورد استفاده قرار گرفته، شکلی لگاریتمی دارد و در مطالعات Farrokhnia , Jain نیز بعنوان آشکارساز حباب ها مورد استفاده قرار گرفته است [۱۶]. پارامتر شکل لگاریتمی تابع tanh را کنترل می کند و بر اساس نتایج تجربی مقدار ۰/۲۵ را اختیار می کند.
۲-۲-۲- انرژی گابور
انرژی گابور بعنوان یک ویژگی مفید در روشهای مبتنی بر فیلترهای گابور مورد استفاده قرار می گیرد. همچنین فیلترهای گابور چند کانالی و ویژگی انرژی گابور در [۱۱]، برای تعیین نوع زبانِ متون چاپی به کار رفته اند. Zhu از انرژی گابور برای شناسایی نوع قلم در زبان انگلیسی و چینی استفاده کرد [۱۲]. در این مقاله مقدار انرژی گابور را برای بانک فیلتر طراحی شده محاسبه نموده و چون شکل هیستوگرام تصاویر پاسخ اغلب شبیه به یک تابع گاسین است [۱۱]، بنابراین میانگین و انحراف معیار هر ۲۴ تصویر انرژی گابور محاسبه شده و بردار ویژگی نهایی را تشکیل می دهند. برای هر تصویر بلوک ورودی یک بردار ویژگی ۴۸ تایی بدست خواهد آمد.
۲-۲-۳- تبدیل فوریه انرژی گابور
Tan [17] مجموعه ای از ویژگی هایی را پیشنهاد نمود که بر اساس تبدیل فوریه انرژی گابور محاسبه شه و نسبت به چرخش نیز حساس نمی باشند. با کمک این ویژگیها، نوع زبان در متون چاپی تشخیص داده می شود. در این روش ابتدا انرژی گابور محاسبه شده و سپس مقدار متوسط برای تصویر انرژی گابور با رابطه زیر محاسبه می گردد:
(۷)
تصویر انرژی گابور و مساحت تصویر انرژی گابور است. برای یک فرکانس ثابت ، تبدیل فوریه یا بسادگی محاسبه شده و ضرایب فوریه به عنوان ویژگی بکار می روند. اگر تعداد جهت ها در یک فرکانس مشخص برابر M باشد، آنگاه حداکثر تعداد ویژگیهای مستقل با توجه به گسسته بودن تابع ، برابر M/2+1 خواهد بود. این ویژگیها برای بانک فیلتر پیشنهادی محاسبه شده و برای هر تصویر بلوک ورودی ۱۵)۵*۳) ویژگی بدست خواهد آمد.
- لینک دانلود فایل بلافاصله بعد از پرداخت وجه به نمایش در خواهد آمد.
- همچنین لینک دانلود به ایمیل شما ارسال خواهد شد به همین دلیل ایمیل خود را به دقت وارد نمایید.
- ممکن است ایمیل ارسالی به پوشه اسپم یا Bulk ایمیل شما ارسال شده باشد.
- در صورتی که به هر دلیلی موفق به دانلود فایل مورد نظر نشدید با ما تماس بگیرید.
یزد دانلود |
دانلود فایل علمی 