لینک کوتاه : https://magicfile.ir/?p=2067
دانلود الگو سورس کد OCR در سی شارپ بصورت API
امروز در این پست برای شما کاربران عزیز وبسایت فایل سحرآمیز یک الگو سورس کد OCR در سی شارپ بصورت API را آماده دانلود قرا دادهایم. که میتوانید فایلهای تصویری یا یا کتاب الکترونیکی PDF را به فایل متنی TXT تبدیل کنید.
با توجه به محتوای ارائه شده در لینک مربوطه، این پست به ارائه یک الگو سورس کد OCR (تشخیص نویسه خوان نوری) در زبان برنامهنویسی C# (سی شارپ) به صورت API میپردازد.
OCR (Optical Character Recognition) یا تشخیص نویسه خوان نوری فرآیندی است که به کمک آن میتوان متون موجود در تصاویر یا اسناد دیجیتال را به متون قابل ویرایش و جستجو در رایانه تبدیل کرد. این کار به کمک نرمافزارهای مخصوص OCR انجام میپذیرد.
ویژگیهای این سورس کد OCR در سی شارپ بصورت API بصورت زیر میباشد
- برنامهنویسی شده بصورت API OCR
- قابلیت تبدیل تصاویر و فایل PDF به فایل متنی TXT
- انتخاب چندین زبان از جمله فارسی برای تبدیل
- ذخیره سازی متن تبدیل شده
- دارای دوهسته برای تبدیل
- خروجی دوگانه بصورت متنی و جیسون
در این پست یک الگو سورس کد OCR را در اختیار کاربران قرار دادهاند که به صورت API قابل استفاده است. API یا واسط برنامهنویسی کاربردی، راهی برای تعامل برنامهها با یکدیگر است. در این مورد، API OCR به برنامه نویسان اجازه میدهد تا بتوانند با استفاده از سورس کد ارائه شده، قابلیت تشخیص متون را به برنامه های خود اضافه کنند.
سورس کد ارائه شده شامل کلاسها و متدهای مورد نیاز برای پیادهسازی OCR است که توسعه دهندگان میتوانند آن را در پروژه های خود مورد استفاده قرار دهند. این الگو سورس کد میتواند برای تبدیل فایل های تصویری یا PDF به متون قابل ویرایش مورد استفاده قرار گیرد.
بهطور کلی، این الگو سورس کد OCR در سی شارپ بصورت API مجموعه ای کامل از اطلاعات مربوط به OCR و ارائه یک الگو سورس کد قابل استفاده در این زمینه است که توسعه دهندگان میتوانند از آن در برنامه های خود بهره ببرند.
نمونه تصاویر در زمان اجرا
درباره نویسه خوان نوری با سرواژه OCR بیشتر بدانید
نویسد خواهند نوری [۱] که با سرواژه OCR∗ شناخته میشود، عبارت است از تشخیص (recognition) خودکار متون موجود در تصاویر اسناد و تبدیل آنها به متون قابل جستجو و ویرایش توسط رایانه. تصویر سند غالباً توسط روبشگر یا دوربین دیجیتال تولید میشود. این تصاویر شامل تعدادی پیکسل با رنگهای مختلف است که هر رنگ با ترکیب سه رنگ اصلی سبز، آبی و قرمز ساخته میشوند. از دید انسان، یک سند ممکن است ارزش اطلاعاتی زیادی داشته باشد، لیکن از دید رایانه تصویر یک سند با تصویر یک منظره تفاوتی ندارد، چرا که هر دوی آنها مجموعهای از پیکسلها هستند. برای اینکه بتوان از اطلاعات نوشتاری تصویر سند استفاده کرد، بایستی به نحوی نوشتههای موجود در سند را تشخیص دهیم. چنین کاری توسط نرمافزارهای نویسد خواهند نوری انجام میشود.
نویسد خواهند نوری ابتدا تنها در مورد بازشناسی ارقام و حروف چاپی بکار گرفته میشد. سامانه نویسد خواهند مثل یک نفر ماشیننویس، متن سند را میخواهندد و آن را به قالب مناسب برای ذخیره در رایانه تبدیل میکند. معمولاً اسکنر، تصاویر مورد نیاز برای تشخیص نویسد را فراهم میآورند. سامانه نویسد خواهند، اشیاء موجود در تصویر سند را که ارقام، حروف، علائم و کلمات هستند، بازشناسی کرده و رشته متناظر با آنها را در قالب مناسب ذخیره میکند. یک فایل تصویری، حجم زیادی دارد و جستجوی متنی در آن ممکن نیست. این در حالی است که فایل خروجی سامانه نویسد خواهند بسیار کم حجم و قابل جستجو است.
سامانههای نویسد خواهند مثل بسیاری از سامانههای هوشمند دیگر، پیچیدگی زیادی دارد. پردازش تصویر و بازشناسی الگو دو مبحث اصلی در این سامانهها هستند. پیچیدگی این سامانهها برای زبانهای گوناگون، متفاوت است. به عنوان مثال نوشتن نویسد خواهندی نوری برای زبانهای لاتین به دلیل اینکه حروف آنها بهطور مجزا نوشته میشود آسانتر است از زبانهایی مثل فارسی و عربی که حروف یک کلمه به یکدیگر میچسبند. این موضوع به علاوه جمعیت کم کاربران زبان فارسی، سبب شده سامانههای نویسد خواهند زبان فارسی نقاط ضعف زیادی داشته باشند. البته در سالهای اخیر تلاشهای قابل تقدیری از سوی برخی شرکتهای فعال در زمینه پردازش تصویر انجام شده که برخی از آنها منجر به محصولات قابل قبولی شدهاست.
برای شما کاربر عزیز پیشنهاد دانلود داده میشود.