OCR : Optical Character Recognition
โปรแกรมแปลงตัวอักษร
Fusion Solution บริการพัฒนาระบบ ที่ปรึกษา และติดตั้ง OCR จาก Technogoly ล่าสุดจาก Microsoft ที่รองรับภาษาไทย ( Azure Cognitive Service ) รวมถึงระบบการบริหารจัดการเอกสาร ตามมาตราฐานของ Abbyy และ CMMi 3 บริการพัฒนา การเชื่อมต่อระบบเอกสารกับ SAP หรือ Office 365
OCR คือ Optical Character Recognition (OCR) เป็นวิธีการแปลง ข้อมูลที่อยู่ในรูปของสิ่งพิมพ์ ให้เป็นข้อความ แล้ว นำ ข้อความหรือตัวอักษร ตัวเลข ไปบันทึกในรูปแบบที่วิเคราะห์ต่อได้เช่น Database Excel word ซึ่งการทำงานจะเป็นแบบอัตโนมัติ ไม่ต้องใช้คนมานั่งอ่าน แล้ว Re key ให้เกิดงานที่ซ้ำซ้อน
การทำงานของระบบไม่ต้องมีการติดตั้ง Software ใน Server ระบบทั้งหมดทำงานบน Cloud Service ของ Azure
Automate document classifying, sorting and capturing data solutions
ประมวลผลดึงข้อมูลที่อยู่ในเนื้อหาเอกสารที่มีลักษณะโครงสร้างตายตัว, แบบกึ่งมีโครงสร้าง และแบบไม่มี โครงสร้างอย่าง อัตโนมัติ เช่น เอกสารจํานอง, รายการธุรกรรมของบัญชีเงินฝาก, แบบฟอร์มภาษี, แบบสอบถาม, แบบฟอร์มใบ สมัคร, เอกสารสัญญา และใบแจ้งหนี้ เป็นต้น
Power Automate AI เป็น ระบบการประมวลผลภาพเอกสารที่สามารถแยกชุด แบ่งประเภท และอ่านข้อมูลจากภาพเอกสารได้ โดยอัตโนมัติ ด้วยความสามารถของ AI Builder ของ Microsoft 365 ทำให้สามารถจับข้อมูลจากภาพเอกสาร นำไปพัฒนา กระบวนการจัดการเอกสารและข้อมูลขององค์กรแบบอัตโนมัติ สามารถจับข้อมูลได้จากภาพเอกสารที่มีรูปแบบและไม่มี รูปแบบได้
มีความแม่นยำสูงในการจับข้อมูลจากภาพเอกสารทั้งภาษาไทยและภาษาอังกฤษ สามารถประมวลผลด้วย ความรวดเร็วด้วย scalable data processing
- Data Capture for All Types of Documents
- Automated Document Separation and Classification
- High performance and responsiveness
- Flexible export options
OCR Main Features
- นำเข้าภาพเอกสารเข้าไปประมวลผลผ่าน Watch/Hot Folder, Web Servicer (RESTful API)
- รองรับไฟล์ภาพ BMP, DCX, DjVu, GIF, JBIG2, JPEG, JPEG 2000, PCX, PNG, PDF, TIFF และ multi TIFF
- มีความสามารถด้านการประมวลผลภาพแบบอัตโนมัติ (Image Processing Automated) ประกอบด้วย image de- skewing, despeckling (image clean-up การทำให้ภาพมีความคมชัดขึ้น), mirroring and inverting และ color filtering ก่อนนำภาพไป OCR
- สามารถแบ่งชุดและแยกประเภทของเอกสาร (Separation and Classification) โดยการอ่านจาก Pattern และ ข้อมูลในภาพเอกสาร
- สามารถจับข้อมูลตัวพิมพ์ (Printed) บนภาพเอกสารด้วยเทคโนโลยี OCR: Optical Character Recognition สำหรับภาษาไทย และภาษาอังกฤษ และภาษาอื่นๆ รวม 200 ภาษา
- สามารถจับข้อมูลที่เขียนด้วยมือ (Hand-printed) บนภาพเอกสารด้วยเทคโนโลยี ICR: Intelligent Character Recognition) สำหรับภาษาอังกฤษ ที่อยู่ใน Fields, Frames, Underlined fields, Boxes และ Comb-style fields เป็นต้น
- สามารถอ่านข้อมูลเครื่องหมายถูก กากบาท และวงกลม โดยใช้เทคโนโลยี OMR: Optical Mark Recognition
- สามารถอ่านข้อมูล Bar Code และ QR Code โดยใช้เทคโนโลยี OBR: Optical Bar-code Recognition
- มี Verification Station โปรแกรมสำหรับตรวจสอบข้อมูลที่อ่านได้ภาพเอกสาร โดยสามารถ
- ตรวจสอบตามเงื่อนไข Rules- based verification เช่น ตั้งค่าให้ตรวจสอบตามระดับความถูกต้องของ ข้อมูล (Recognition Confidential Level)
- มีระบบ Task ในการแบ่งงานกันทำสำหรับผู้ตรวจสอบข้อมูล
- ติดตั้งบน Windows 7 ขึ้นไป
- สามารถส่งออกข้อมูล (Data Output) เป็น CSV และบันทึกลงบน Database
- สามารถส่งออกภาพที่ประมวลผลแล้วเป็น PDF หรือ Searchable PDF หรือ PDF/A และสามารถลดบีบอัดไฟล์ PDF และ PDF/A ให้มีขนาดเล็กลงด้วย MRC: Mixed Raster Content
- มีรายงานติดตามผลการทำงานทุกขั้นตอน
- ส่งไฟล์เอกสารและข้อมูลเก็บที่ SharePoint และ One Drive
- สามารถพัฒนาเพิ่มเติมเพื่อเชื่อมต่อกับกระบวนการทำงานและระบบอื่นได้
- รองรับการเชื่อมต่อกับ Robotic Process Automation (RPA)
คำถามเกี่ยวกับ Solution OCR ด้วย Microsoft Power Automate ( AI Builder )
- การคิดราคาของการทำ OCR มีกี่แบบ
- Microsoft ไม่ได้คิดเป็นราคาต่อ OCR เพราะ OCR เป็น Feature ที่อยู่ใน License ของ Power Automate ดังนั้นการจะต้องการทำ OCR ต้องซื้อ License ของ Power Auotmate
- ราคาเริ่มต้นจะเริ่มที่ 40 $ user/month จะสามารถเรียก OCR ได้ 5000 ครั้ง
- สามารถใช้เครื่องมือ ในการคำนวณค่าใช้จ่ายได้จาก Link นี้
- ใน Solution ประกอบด้วย Service อะไรบ้าง
- Software OCR : English, Thai, Chinese (simplified and traditional), Japanese, Korean and Vietnamese etc
- Searchable PDF export
- One-year SMUA (Software Maintenance Upgrade and Assurance)
- Support Incidents and Troubleshooting 5×8
- ความถูกต้องของการแปลงเป็นตัวอักษร
- ภาษาไทย ประมาณ 80 %
- ตัวเลข 100 %
- ภาษาอังกฤษ ประมาณ 95 %
- ความถูกต้องขึ้นกับคุณภาพของ File ด้วย
- กรณีที่ระบบอ่านภาษาไทยไม่ถูกต้องมีขั้นตอนรองรับยังไง
- ระบบจะมีการประเมินความถูกต้องของการอ่าน เมื่อประมาณการค่าความถูกต้องต่ำกว่าที่กำหนด จะส่งให้เจ้าหน้าที่ตรวจสอบอีกครั้ง