- 1 What is Alfresco Document Data Capture Pro? (Sky OCR Pro with PDF Extractor)
- 2 Why is Alfresco Document Data Capture Pro so important?
- 3 The Difference between OCR Pro and OCR lite
- 4 Zonal OCR Pro is related to Model Manager and Advanced Custom Search
- 5 Sky OCR Pro Configuration
- 6 Creating Folder Rules for PDF Extraction
- 7 Changing Template Name
- 8 Selecting Documents Template
- 9 Managing Document Previewer
- 10 Enable and Disable Templates
- 11 Deleting Templates
- 12 Adjust Showing Rows
- 13 Sky OCR Pro Accesses Control
What is Alfresco Document Data Capture Pro? (Sky OCR Pro with PDF Extractor)
Alfresco Document Data Capture Pro หรือ Sky OCR Pro เป็นฟังก์ชันพิเศษที่พัฒนาโดยผู้เชี่ยวชาญด้านระบบการจัดการเอกสารจากบริษัท Skytizens มีความสามารถในการตรวจจับข้อความตัวอักษรที่อยู่ในไฟล์รูปภาพ แล้วนำมาแปลงค่าให้กลายเป็นข้อความตัวอักษรด้วยระบบดิจิทัลที่สามารนำไปสืบค้นได้ มาพร้อมกับเวอร์ชัน Professional ที่เพิ่มประสิทธิภาพในการจัดการเนื้อหาได้อย่างแม่นยำและฟังกชั่นการใช้งานขั้นสูง (สามารถศึกษาความหมายเพิ่มเติมของ OCR ได้ที่ Alfresco Wiki)
โดยเวอร์ชัน Professional มาพร้อมกับเทมเพลตอัจฉริยะ (Smart template) ที่สามารถคัดแยกและจัดการข้อความตัวอักษรของเอกสารรูปแบบต่างๆ ที่อัพโหลดลงในระบบได้อัตโนมัติ พร้อมกับจัดเรียง (Sort) เอกสารและตั้งชื่อไฟล์ใหม่ทั้งหมดโดยปราศจากการจัดการเพิ่มเติม เพื่อจัดเก็บข้อมูล Metadata ไว้ภายในระบบสำหรับการสืบค้นข้อมูลที่สะดวกและง่ายดาย ซึ่งเป็นฟังก์ชันที่รองรับการใช้งานพิเศษเพื่ออำนวยความสะดวกในการทำงานให้ระดับหน่วยงาน องค์กร และบริษัทได้อย่างมหาศาล
รองรับการทำงานที่มากกว่าเวอร์ชัน Lite โดยไม่ต้องพึ่งฟังก์ชันเสริมเพิ่มเติม ขยายประสิทธิภาพในการแปลงข้อความตัวอักษรให้แม่นยำมากขึ้น วิเคราะห์และจำแนกเอกสารที่เกี่ยวข้องโดยอัตโนมัติ สามารถกำหนดคำสั่งพิเศษด้วยภาษา Java เพื่อการใช้งานที่เต็มประสิทธิภาพ จัดเรียงข้อมูลอย่างเป็นระเบียบโดยอัตโนมัติ และอื่นๆ โดยปกติแล้วจะมีการใช้งานที่สัมพันธ์กับฟังก์ชัน Model Manager และ Custom Search
Why is Alfresco Document Data Capture Pro so important?
การนำข้อมูลที่อยู่ภายในเอกสารไปใช้ในการทำงานแบบ Paperless มีความสำคัญอย่างมากในการป้อนข้อมูลโดยอัตโนมัติ เพื่อช่วยให้การทำงานเอกสารได้อย่างรวดเร็วฉับไว สะดวกต่อการสืบค้น และนำข้อมูลไปใช้ต่อได้อย่างปลอดภัย โดย Sky OCR Pro เป็นการระบุตำแหน่งข้อความภายในไฟล์ภาพเพื่อแปลงข้อความลงในระบบดิจิทัล ที่ได้เพิ่มประสิทธิภาพในการระบุตำแหน่งตัวอักษร ยกระดับความสามารถในการจำแนกประเภทของเอกสารด้วย Template และประสิทธิภาพอื่นๆ เช่น
- เพิ่มประสิทธิภาพการระบุข้อความ – แสดงข้อความที่กำหนดไว้ได้อย่างถูกต้อง แม่นยำ ครบถ้วนมากยิ่งขึ้น
- ทำงานได้อย่างชาญฉลาด – คัดแยกเอกสารที่เกี่ยวข้องโดยอัตโนมัติ
- เพิ่มประสิทธิภาพของฟังก์ชัน – แก้ไขข้อผิดพลาดของระบบให้ทำงานได้อย่างเต็มประสิทธิภาพ
- ปลอดภัยยิ่งขึ้น – จัดเก็บเอกสารไปที่เซิฟเวอร์ขององค์กรโดยตรง
- สร้างได้ไม่จำกัด – สามารถสร้างเทมเพลตเพื่อรองรับการ OCR ได้ไม่จำกัดจำนวน
The Difference between OCR Pro and OCR lite
ฟังก์ชันการทำงานของ OCR Pro ยังคงคล้ายคลึงกับเวอร์ชั่น Lite แต่จะมุ่งเน้นไปที่การเพิ่มประสิทธิภาพและเพิ่มฟังก์ชันการใช้งานเพิ่มเติม โดย OCR Pro ได้เพิ่มศักยภาพในการแสกนตัวข้อความอักษรของเอกสารด้วยการสร้าง Template ได้จำนวนมาหาศาลเพื่อรองรับการอ้างอิงเอกสารในรูปแบบไฟล์ PDF ที่มีชุดข้อมูลที่แตกต่างกัน โดยจะมีการเพิ่มประสิทธิภาพและความสามารถในส่วนของการคัดแยกข้อมูลเอกสารได้หลากหลายเพื่อการใช้งานอย่างครอบคลุม เช่น รองรับการบันทึกคำสั่งการด้วยภาษา Java จัดเรียง และคัดแยก เป็นต้น ซึ่งจะใช้งานควบคู่กับฟังก์ชันเสริมอย่าง Alfresco ABBYY OCR Cloud เพื่อดึงศักยภาพสูงสุดในการจัดการข้อความภายในภาพ
การใช้งาน OCR Pro จะเกี่ยวข้องกับฟังก์ชันการสร้างเอกสารชนิดพิเศษอย่าง Model Manager ในการนำ Document type มาใช้ใน Template ของ OCR Pro สำหรับทำการอัพโหลดเอกสารในการแปลง Document type และเพิ่มข้อมูล Property หลังจากนั้นก็จะสามารถนำข้อมูลใน Property มาค้นหาในฟังก์ชันการสืบค้นแบบขั้นสูงอย่าง Advanced Custom Search ซึ่ง OCR Pro จะเป็นเหมือนตัวกลางในกระบวนการแปลง Document type ให้สามารถสืบค้นเอกสารใน Custom Search ได้อย่างง่ายดายมากยิ่งขึ้น ดังภาพที่ 1 (สามารถศึกษาวิธีใช้งาน Model Manger และ Custom Search ได้ที่ Alfresco Wiki)
Sky OCR Pro Configuration
วิธีใช้งาน Zonal Data Capture Pro อันดับแรกเข้าไปที่ตัวเลือก Skytizens Features บนแถบ Tools จากนั้นจะเข้าสู่หน้าฟีเจอร์ ให้เลือก Sky OCR Pro ที่หมวดหมู่ Tools เพื่อเข้าไปที่หน้าการจัดการหลักของ Sky OCR Pro จะพบกับส่วนประกอบพื้นฐานของ Template ต่างๆ ได้แก่ Name (ชื่อเทมเพลต), Document (เอกสารที่อัพโหลด), Document Type (ประเภทเอกสารที่อ้างอิง), Created By (ผู้สร้าง), Status (สถานะ), และ Actions (คำสั่ง) ดังภาพที่ 2
คำอธิบายของส่วนประกอบพื้นฐาน
- Name (ชื่อเทมเพลต) – แสดงชื่อเทมเพลตของเอกสารที่เกี่ยวข้อง
- Document (เอกสารที่อัพโหลด) – แสดงจำนวนของเอกสารที่อัพโหลดในเทมเพลต
- Document Type (ประเภทเอกสารที่อ้างอิง) – แสดงประเภทของเอกสารที่ใช้อ้างอิงเนื้อหาข้อความตัวอักษร
- Created By (ผู้สร้าง) – แสดงชื่อของผู้ที่สร้างเทมเพลต
- Status (สถานะ) – แสดงสถานะการใช้งาน ได้แก่ เปิดการใช้งาน (Enable), ปิดการใช้งาน (Disable)
- Actions (คำสั่ง) – แสดงปุ่มคำสั่งของเทมเพลต ได้แก่ Edit (ปุ่มแก้ไข), Delete (ปุ่มลบเทมเพลต)
- Create (สร้าง) – ปุ่มสร้างเทมเพลตใหม่
หมายเหตุ: ฟังก์ชันพิเศษนี้อนุญาตเฉพาะผู้ดูแลระบบ (Admin) มีสิทธิ์ในการกำหนดค่าของ Document Data Capture Pro เท่านั้น ซึ่งผู้ใช้อื่นไม่สามารถตั้งค่าในส่วนนี้ได้ และถ้าหากไม่มีการสร้าง Template ใดๆ จะไม่มีข้อมูลดังภาพที่ 2 ข้างต้น ปรากกฏอยู่
Creating New Templates
การสร้างเทมเพลต ขั้นตอนแรกให้คลิกปุ่ม Create เพื่อสร้างใหม่ จากนั้นระบบจะแสดงหน้าต่างเพื่อกรอกชื่อ Template (จำเป็นต้องระบุ) เมื่อตั้งเสร็จให้คลิกที่ปุ่ม Save เพื่อบันทึกการสร้าง เทมเพลตจะปรากฏบนหน้าแรกทันที ซึ่งสถานะจะปิดการใช้งานอยู่ โดยสามารถกำหนดสถานะเทมเพลตได้ภายหลัง ดังภาพที่ 3
ในกรณีที่มี Document type เดียวกันแต่ข้อมูลมีความแตกต่างกัน ให้ทำการสร้าง Template ให้มีจำนวนเท่ากันกับข้อมูลที่เปลี่ยนแปลงในเอกสาร
Uploading and Editing Document Templates
ขั้นตอนแรกแอดมินจำเป็นต้องอัพโหลดไฟล์ PDF ต้นฉบับอย่างน้อย 1 ฉบับขึ้นไป จึงจะสามารถทำการแก้ไขและกำหนดสิ่งต่างๆ ได้ โดยการอัพโหลดมีวิธีการดังต่อไปนี้
- คลิกที่ปุ่ม Edit ที่หัวข้อ Actions จากนั้นระบบจะเข้าสู่หน้ากำหนดค่า ซึ่งจำเป็นต้องอัพโหลดเอกสารจึงจะสามารถตั้งค่าเพิ่มเติมได้ ดังภาพที่ 4
โดยมีองค์ประกอบหลักต่างๆ ดังนี้
- Template Documents (เอกสารต้นแบบ) – สามารถเลือก และอัพโหลดไฟล์เอกสารต้นแบบเพื่อนำไปอ้างอิง ประกอบด้วย Select document (เลือกเอกสารที่อ้างอิง), Add document (เพิ่มเอกสารต้นแบบ)
- Destination Document (เอกสารปลายทาง) – กำหนดชื่อของเอกสารด้วยภาษา Java เพื่อใช้ในงานจัดเรียงและแสดงชื่อ ประกอบไปด้วย Document Name (ชื่อเอกสาร)
- Template Settings (ตั้งค่าเทมเพลต) – กำหนดชื่อและเปิดใช้งานเทมเพลต ประกอบไปด้วย
- Template Name (ชื่อเอกสาร) – สามารถเปลี่ยนหรือแก้ไขชื่อเทมเพลต
- Enabled Template (เปิดใช้งานเทมเพลต) – เปิด-ปิดใช้งานด้วยการคลิกที่ Checkbox
- Save (บันทึก) – บันทึกการตั้งค่า
- จากนั้นให้คลิกที่ Add Document เพื่อเพิ่มไฟล์ PDF ต้นฉบับ ที่หัวข้อ Template Documents จะปรากฏหน้าต่างอัพโหลดไฟล์ ให้คลิกที่ Select files to upload เพื่อเลือกเอกสารที่ต้องการ หลังจากการอัพโหลดเสร็จสิ้นแล้ว จะมีแถบหัวข้อใหม่เพิ่มขึ้นมาคือ Document Fields เพื่อการจัดการ Property ต่างๆ และปุ่มการทำงานเพิ่มเติมที่หัวข้อ Template Documents ดังภาพที่ 5
มีองค์ประกอบและคำอธิบายต่างๆ ดังนี้
- Document Fields (ช่องใส่ข้อมูลเอกสาร) – เป็นพื้นที่สำหรับใส่ข้อมูลต่างๆ ตาม Document type จาก Model Manager ได้ โดยสามารถเลือก Type ได้โดยจากพิมพ์ Key Word ภายในช่อง ซึ่งค่าเริ่มต้นจะอยู่ที่ cm:content (Content) ประกอบไปด้วย
- Document type (ประเภทเอกสาร) – กำหนด Type ของเอกสารที่อยู่ในระบบหรือที่สร้าง Model Manager โดยการพิมพ์ชื่อของ Type ที่ต้องการ
- Text (ข้อความ) – กำหนดข้อความอักษรที่อยู่ภายในรูปของเอกสารด้วยการคลิกที่ข้อความที่ไฮไลท์สีเหลืองอยู่ ซึ่งจะเปลี่ยนเป็นสีแดงเมื่อคลิกเลือก
- Regular Expression (นิพจน์ปกติ) – กำหนดนิพจน์ปกติเพื่อให้ค่าตรงกับ Text ที่เลือกไว้
- Value (ค่าตัวแปร) – กำหนดค่าของเทมเพลตเพื่อแสดงข้อมูลต่างๆ เช่น ชื่อเอกสาร ข้อมูล วันที่
- Test Result (ทดสอบผลลัพธ์) – แสดงผลลัพธ์ที่ตั้งค่าไว้ในแต่ละ Property ทำงานร่วมกับปุ่ม Test
- Assign (สั่งงาน) – ปุ่มสั่งงานให้ข้อความที่เลือกปรากฏลงบน Text
- Test (ทดสอบ) – ปุ่มทดสอบผลลัพธ์
- Info (ข้อมูล) – ปุ่มสำหรับดูข้อมูลของ
- Clear (ล้าง) – ล้างทุกข้อความ
- Help (ช่วยเหลือ) – แสดงคำสั่ง Java เพื่อระบุลงในแถบ Document Fields และ Destination Document
- Template Documents (เอกสารต้นแบบ) – หลังจากอัพโหลดเอกสารจะปรากฏปุ่มเพิ่มเติมสำหรับแก้ไข ลบ อัพเดท เปิดใช้งานการแหล่งอ้างอิง ประกอบด้วย
- Upload New Version (อัพโหลดเวอร์ชั่นใหม่) – อัพโหลดเอกสารเวอร์ชั่นใหม่แทนที่ตัวปัจจุบัน
- Delete Document (ลบเอกสารอ้างอิง) – ลบเอกสารที่เลือกไว้จาก Select Document
- Enabled Source (เปิดใช้งานการอ้างอิง) – Checkbox เพื่อกำหนดการเปิด-ปิดการใช้งานแหล่งอ้างอิงเอกสาร
Editing Document Fields
การกำหนดค่าเอกสารต้นแบบเพื่อใช้อ้างอิงข้อมูลที่เกี่ยวข้อง มีวิธีการดังนี้
- คลิกที่ปุ่ม Edit ที่หัวข้อ Actions จากนั้นระบบจะเข้าสู่หน้ากำหนดค่าและดูตัวอย่างเอกสารต้นแบบ ดังภาพข้างต้น
- คลิกที่ช่อง Document Type ของหัวข้อ Document Fields ทำการลบ Type เริ่มต้น “cm_content” จากนั้นกรอกชื่อ Type ของเอกสารลงไปในช่อง ระบบจะปรากฏ Type ที่มีอยู่ตามชื่อที่ใส่ สามารถเลือก Type พิเศษของ Model Manager หรือ Type ทั่วไปในระบบ Alfresco ได้ เพื่อกำหนด Property ดังภาพที่ 6
- เมื่อเปลี่ยน Type เสร็จสิ้น ให้คลิกเลือกข้อความที่มีไฮไลท์สีเหลืองในการจัดการตัวอย่างเอกสารที่แสดงอยู่ด้านซ้าย เมื่อคลิกที่ข้อความจะเปลี่ยนเป็นสีแดง จากนั้นให้คลิกที่ปุ่ม Assign เพื่อใส่ข้อความลงใน Text Box ดังภาพที่ 7
- ผู้ดูแลระบบสามารถตรวจสอบตำแหน่งและข้อมูลของข้อความที่ Assign โดยคลิกที่ปุ่ม Info จากนั้นระบบจะแสดงช่องข้อมูลในสีเหลืองด้านล่างของปุ่ม ดังภาพที่ 8
Replace Text
หากต้องการแทนที่ข้อความปัจจุบันสามารถทำได้โดยการคลิกที่ปุ่ม Info เพื่อดูข้อความที่ Assign ล่าสุด ให้คลิกที่ข้อความปัจจุบันเพื่อนำออก จากนั้นทำการ Assign ข้อความใหม่เพื่อแทนที่ Text เดิม ดังภาพที่ 9
หมายเหตุ: ช่อง Text จะไม่สามารถพิมพ์ข้อความตัวอักษรใดๆ ลงไปได้ เพื่อป้องกันการแก้ไขและดัดแปลงข้อมูล
Adding Variables
- ทำการกำหนดนิพจน์ปกติ (Regular Expression) ให้ตรงกับข้อความที่เลือก เช่น (.*) เป็นต้น จากนั้นกำหนดคำสั่ง Java ในช่อง Value ที่ต้องการแสดงใน Property เช่น {group1.toUpperCase()} ดังภาพที่ 10
- หากต้องการความชวยเหลือให้คลิกที่ปุ่ม Help จะปรากฏคำสั่งต่างๆ ดังภาพที่ 11
ตัวแปรต่างๆ มีคำสั่งในการทำงานที่แตกต่างกัน โดยมีตารางอธิบายค่าต่างๆ ดังต่อไปนี้
Available Variables | |
{prefix_property} | ใส่คำนำหน้า (Prefix) และชื่อ Property ของเอกสาร เช่น {cm_name} |
{groupN} | ระบุกลุ่มของตัวแปรเพื่อแสดงข้อมูลใน Property จากช่อง Text ที่กำหนดไว้ เช่น {group1} |
{day} | วันที่ |
{month} | เดือนแบบตัวเลข |
{byy} | พุทธศักราชแบบย่อ เช่น 63 |
{byyyy} | พุทธศักราชแบบสมบูรณ์ เช่น 2563 |
{gyy} | คริสต์ศักราชแบบย่อ เช่น 20 |
{gyyyy} | คริสต์ศักราชแบบสมบูรณ์ เช่น 2020 |
Available Functions | |
convertDate(format1,format2) | จัดรูปแบบและจำแนกวันที่ของตัวแปร String(ใช้คำสั่ง java ในรูปแบบ SimpleDateFormat) เช่น convertDate(‘MM’,’MMMM’) |
toUpperCase() | แปลงค่าตัวแปร String ให้เป็นตัวอักษรตัวพิมพ์ใหญ่ เช่น Oct > OCT |
toLowerCase() | แปลงค่าตัวแปร String ให้เป็นตัวอักษรตัวพิมพ์เล็ก เช่น Oct > oct |
replace(string,replacement) | แทนที่ตัวแปรด้วยการระบุค่า เช่น “123”.replace(“2″,”4”) > “143” |
replaceAll(regexp,replacement) | แทนที่ตัวแปรทั้งหมดด้วยการระบุค่า เช่น “1–3”.replace(“+”,”4″) > “143” |
isNull(default) | กลับคืนค่าเริ่มต้นหากตัวแปรมีค่าเป็น Null เช่น isNull(“Undefined”) |
split(regexp) | แบ่งค่าเป็น List of Values เช่น split(“_”) |
get(index) | นำส่วนประกอบของค่า List of Values เช่น get(0) |
join(str) | เชื่อมส่วนประกอบของค่า List of values โดยการใช้ตัวแปร String เป็นตัวกำหนดขอบเขต เช่น join(‘,’) |
getDataList(site,name,prop) | แบบฟอร์มของ List of values ที่มีข้อมูล Field และ Datalist เช่น getDataList(‘site’,’datalist’,’dl_name’) |
getDataList(site,name,prop,prop2) | แบบฟอร์ม List of values ที่มีข้อมูล Datalist และ Field ที่ค่านั้นเท่ากับ prop2 field เช่น getDataList(‘site’,’datalist’,’dl_name’,’dl_code’) |
getMasterData(names,parent,locale) | แบบฟอร์ม List of values ที่มีข้อมูล Master Data และ Field เช่น getMasterData(‘datalist’,’value’,’th_TH’) |
- จากนั้นคลิกปุ่ม Test เพื่อทดสอบการทำงานของคำสั่ง ผลลัพธ์จะแสดงที่ช่อง Test Result เพื่อทดสอบการใช้งานของคำสั่ง ซึ่งข้อมูลจะไม่ปรากฏหากคำสั่งนั้นๆ ไม่แสดงผลลัพธ์บน Test Result ดังภาพที่ 12
- ต่อมาให้คลิก Enabled Source ที่หัวข้อ Template Documents เพื่อเปิดใช้งานการอ้างอิงเอกสาร จากนั้นคลิก Enabled Template ที่หัวข้อ Template Settings เพื่อเปิดสถานะการใช้งานของเทมเพลต จากนั้นคลิก Save เพื่อบันทึกการตั้งค่า ดังภาพที่ 13
Clear All Texts and Variables
- หากต้องการลบข้อมูลให้คลิกที่ปุ่ม Clear เพื่อล้างข้อมูลทั้งหมดของแต่ละ Property ดังภาพที่ 14
Configuring Destination of Document Templates
การกำหนดค่าสำหรับเปลี่ยนชื่อเอกสารที่อัพโหลดไปยังโฟลเดอร์ปลายทางโดยอัตโนมัติ เพื่อง่ายต่อการสืบค้นและจัดระเบียบเอกสาร โดยมีวิธีการดังต่อไปนี้
- คลิกที่ปุ่ม Edit ที่หัวข้อ Actions จากนั้นระบบจะเข้าสู่หน้ากำหนดค่าและดูตัวอย่างเอกสารต้นแบบ ดังภาพข้างต้น
- ให้ไปที่ช่องว่างของ Document Name เพื่อกำหนดตัวแปรต่างๆ ด้วยการกรอกคำสั่ง Java ในหัวข้อ Destination Document เช่น {cm_name}-{day}-{month}-{gyyyy} เพื่อแสดงชื่อไฟล์เอกสาร วัน เดือน ปี เป็นต้น ดังภาพที่ 15
- หากต้องการความช่วยเหลือให้คลิกที่เครื่องหมาย (?) ตกใจท้ายช่อง จะปรากฏตัวแปรต่างๆ ที่สามารถกำหนดได้ตาม Document type ที่ผู้ดูแลระบบเลือก ซึ่งจะแตกต่างกันออกไปตาม Type จากนั้นคลิก Save ดังภาพที่ 16
โดยมีตัวแปรเบื้องต้นและคำอธิบายดังต่อไปนี้
Available Variables | |
{day} | วันที่ |
{month} | เดือนแบบตัวเลข |
{byy} | พุทธศักราชแบบย่อ เช่น 63 |
{byyyy} | พุทธศักราชแบบสมบูรณ์ เช่น 2563 |
{gyy} | คริสต์ศักราชแบบย่อ เช่น 20 |
{gyyyy} | คริสต์ศักราชแบบสมบูรณ์ เช่น 2020 |
{cm_name} | ชื่อเอกสาร |
{cm_title} | ชื่อหัวข้อเอกสาร |
{cm_description} | คำอธิบายของเอกสาร |
- เมื่อทำการอัพโหลดไฟล์ไปยังโฟลเดอร์ INPUT ระบบจะทำการเปลี่ยนชื่อเอกสารโดยอัตโนมัติ จากนั้นไปที่โฟลเดอร์ที่เก็บเอกสารเพื่อดูผลลัพธ์ของ Document Name ดังภาพที่ 17
Creating Folder Rules for PDF Extraction
การใช้งานการคัดแยกเอกสาร จัดเรียง และตั้งชื่อโฟลเดอร์โดยอัตโนมัติด้วยการกำหนด Rule สำหรับ Folder Input เพื่อสร้างคำสั่งในการคัดแยกอย่างมีประสิทธิภาพ โดยมีวิธีการดังต่อไปนี้ (สามารถศึกษาวิธีการกำหนดค่า Rule ได้ที่ Alfresco Wiki)
- สร้าง Folder Input เพื่อเป็นต้นทางในการอัพโหลดไฟล์เพื่อนำไปประมวลผล เช่น 01_INPUT เป็นต้น จากนั้นทำการ Manage Rules ด้วยการเพิ่มฟังก์ชัน Sky PDF Extraction ให้ทำการเลือกโฟลเดอร์ปลายทางสำหรับจัดเก็บเอกสารและโฟลเดอร์ Error เพื่อจัดเก็บเอกสารที่เกิดข้อผิดพลาด ดังภาพที่ 18
- Destination folder – ระบุโฟลเดอร์ปลายทางสำหรับจัดเก็บเอกสาร ประกอบไปด้วย
- Destination folder (โฟลเดอร์ปลายทาง) – ทำการจัดเก็บไปยังโฟลเดอร์ที่กำหนดไว้
- Error folder (โฟลเดอร์ไฟล์ Error) – โฟลเดอร์ปลายทางสำหรับจัดเก็บไฟล์ที่มีความผิดพลาด
- Relative path – สร้างโฟลเดอร์ย่อยเพิ่มเติมโดยอัตโนมัติ
- Rename the file name if already exists – เปลี่ยนชื่อไฟล์ที่ซ้ำกัน
- ให้ทำการเลือกโฟลเดอร์ปลายทางหลังการประมวลผลและจัดเก็บไฟล์ภายในไซต์ต่างๆ หากต้องการสร้างโฟลเดอร์ย่อยเพิ่มเติมให้กำหนดที่ Relative path เพื่อใส่ชื่อโฟลเดอร์ เช่น A/B/C/1/2/3, 01/02/03, หรือ Tax/2020 เป็นต้น โดยอักขระ “ / ” จะทำหน้าที่แบ่งจำนวนโฟลเดอร์ และสามารถเปลี่ยนชื่อไฟล์ที่ซ้ำกันได้ในกรณีที่การอัพโหลดไฟล์และประมวลผลมีข้อมูลที่ตรงกัน จากนั้นคลิก Create ดังภาพที่ 19
หมายเหตุ: PDF Extraction จำเป็นต้องทำงานเป็นพื้นหลัง (Run in Background) เท่านั้น
Uploading Files
ทำการอัพโหลดไฟล์ไปที่โฟลเดอร์ Input เพื่อใช้งานการ OCR ระบบจะประมวลผลเอกสารที่คล้ายคลึงกันมากที่สุด จากนนั้นจะคัดแยก และตั้งชื่อไฟล์ตามที่ผู้ดูแลระบบได้กำหนดไว้ใน Template ได้ดังภาพที่ 20
- หากเปิดดูไฟล์เอกสารจะพบว่าข้อมูลทั้งหมดได้ถูกนำมาวางไว้ที่ Property เรียบร้อยแล้ว ดังภาพที่ 21
Uploading Fails
หากพบเอกสารที่มีข้อมูลที่ผิดพลาดหรือไม่ตรงกับ Data type ระบบจะทำการย้ายเอกสารไปยังโฟลเดอร์ Error โดยอัตโนมัติ ดังภาพที่ 22 (สามารถศึกษาความหมายของ Data type เพิ่มเติมได้ที่ Alfresco Wiki)
เมื่อคลิก Edit SkyArea OCR properties จะพบกับข้อมูลที่ Error โดยจะแสดงเป็นไอคอนสีส้ม หากค่าของ Data type นั้นไม่ถูกต้อง ดังภาพที่ 23
โดยมีคำอธิบายดังต่อไปนี้
- สีเขียว 🟢 – ข้อมูลของ Data type ถูกต้องสมบูรณ์
- สีเหลือง 🟡 – ค่าใดค่าหนึ่งของ Data Type ไม่ถูกต้อง
- สีแดง 🔴 – ไม่มีข้อมูลใน Property
Changing Template Name
ผู้ดูแลระบบสามารถเปลี่ยนแปลงชื่อของ Template ต่างๆ ได้ ตามต้องการ โดยมีวิธีการดังต่อไปนี้
- คลิกที่ปุ่ม Edit ที่หัวข้อ Actions จากนั้นระบบจะเข้าสู่หน้ากำหนดค่าและดูตัวอย่างเอกสารต้นแบบ ดังภาพข้างต้น
- เมื่อเข้ามาที่หน้าแก้ไขให้คลิกที่ช่อง Template Name ของหัวข้อ Template Settings เพื่อทำการแก้ไขชื่อ Template จากนั้นคลิก Save ดังภาพที่ 24
- เมื่อกลับที่หน้าหลักจะพบว่าชื่อของ Template ได้เปลี่ยนเป็นที่เรียบร้อยแล้ว ดังภาพที่ 25
Selecting Documents Template
ผู้ดูแลระบบสามารถเลือกเอกสารต้นแบบเพื่อนำมาแก้ไขได้หลากหลาย โดยการคลิกที่ช่องว่างของ Select Document ที่หัวข้อ Template Document จากนั้นจะมีเอกสารที่อัพโหลดไวให้เลือกตามต้องการ ดังภาพที่ 26
-
Update New Version
นอกจากนี้ยังสามารถอัพเดทเอกสารได้ หากต้องการปรับเปลี่ยนต้นฉบับ โดยคลิกที่ปุ่ม Update New Version ด้านล่างของหัวข้อ Template Document จะปรากฏหน้าต่างสำหรับเลือกไฟล์เอกสารเพื่ออัพโหลด ดังภาพที่ 27
เมื่ออัพโหลดเสร็จสิ้น ระบบจะเปลี่ยนเอกสารเวอร์ชั่นใหม่ทันที ดังภาพที่ 28
-
Enable and Disable Source
- การเปิดการใช้งานการอ้างอิงเอกสาร ให้ทำการคลิกที่กล่องทำเครื่องหมายถูก Enabled Source ด้านล่างของหัวข้อ Template Document เพื่อเปิด-ปิดการใช้งานได้ทันที ดังภาพที่ 29
- หากต้องการปิดใช้งานการอ้างอิงให้คลิกที่กล่องทำเครื่องหมายอีกครั้งเพื่อนำออก ดังภาพที่ 30
-
Delete Document Source
การลบ Template Document เมื่อไม่ต้องการใช้อ้างอิง สามารถทำได้โดยการคลิกที่ปุ่ม Delete Document ด้านล่างของหัวข้อ Template Document จะปรากฏหน้าต่างเพื่อยืนยันการลบเอกสาร ให้ทำการคลิกปุ่ม Delete เพื่อลบทันที ดังภาพที่ 31
Managing Document Previewer
ผู้ดูแลระดับสามารถปรับมุมมองการแสดงผลตัวอย่างของเอกสาร เช่น ย่อ (Zoom out), ขยาย (Zoom in) จัดพื้นที่ (Area), และตรึงข้อความ (Anchor) บนหน้า Preview ได้อย่างอิสระ โดยมีวิธีการดังต่อไปนี้
- Zoom in and Zoom out
คลิกที่ไอคอนปรับ Scale เพื่อปรับขนาดจากซ้ายไปเพื่อขยายขนาด หรือขวาไปซ้ายเพื่อย่อขนาด ที่มุมด้านบนของ Sky Area OCR ดังภาพที่ 32
หรือขยายขนาดและย่อด้วยการพิมพ์จำนวนเปอร์เซ็นลงในช่องทางขวาของตัวปรับ Scale ดังภาพที่ 33
- Rotate
การปรับหมุนองศาหน้ากระดาษสามารถทำได้โดยคลิกที่ไอคอน Rotate ด้านบน ซึ่งปรับได้ทั้งหมด 3 แบบ คือ 90°, 180°, และ 270° ดังภาพที่ 34
- Fit page
ปรับขนาดกระดาษให้พอดี คลิกไอคอนที่ Fit Page ซึ่งอยู่ตรงกลางระหว่าง Rotate และ Fit Width ดังภาพที่ 35
- Fit Width
ขยายหน้ากระดาษให้พอดีกับหน้าแสดงผลตัวอย่าง โดยคลิกไอคอนที่ Fit Width ที่ด้านซ้ายบนขอหัวมุม Preview ดังภาพที่ 36
-
Anchor Text
ปักหมุดข้อความที่ต้องการ โดยอันดับแรกให้คลิกที่ข้อความที่ต้องการ จากนั้นคลิกทีไอคอน Anchor ที่มุมด้านล่างซ้าย จะปรากฏหมุดสีแดงข้างหน้าข้อความ ดังภาพที่ 37
หากต้องการนำออกให้คลิกที่ Text แล้วคลิกปุ่ม Anchor อีกครั้ง ดังภาพที่ 38
- Area Docuemnt
กำหนดขอบเขตการ OCR ข้อความ เพื่อความเพิ่มแม่นยำในการ OCR ข้อมูลในเอกสารอ้างอิง (Template Document) เพื่อรองรับการแปลงข้อความในเอกสารที่มีข้อมูลที่แตกต่างกัน โดยการคลิกที่ปุ่ม Area ที่มุมล่างซ้าย ซึ่งจะแสดงลูกศรให้ปรับขอบเขตได้ตามต้องการ ดังภาพที่ 39
หากต้องการยกเลิกการ Area ให้คลิกที่ไอคอนอีกครั้งเพื่อนำออกได้ทันที
- Changing Page
หากเอกสารมีจำนวนหน้ามากกว่า 1 ขึ้นไป สามารถเปลี่ยนหน้ากระดาษอย่างรวดเร็วได้โดยการเปลี่ยนจำนวนหน้า ที่มุมด้านบนของกระดาษ ดังภาพที่ 40
หรือคลิกที่ลูกศรซ้าย-ขวาเพื่อเปลี่ยนหน้าถัดไปหรือย้อนกลับ ดังภาพที่ 41
Enable and Disable Templates
การเปิด-ปิดการใช้งาน Template สามารถแบ่งออกได้เป็น 2 วิธีดังต่อไปนี้
วิธีที่ 1 คลิกที่ปุ่ม Edit ที่หัวข้อ Actions จากนั้นระบบจะเข้าสู่หน้ากำหนดค่าและดูตัวอย่างเอกสารต้นแบบ ดังภาพข้างต้น
- จากนั้นคลิกที่ Check Box ชื่อ Enabled Template เพื่อเปิดใช้งาน Template ด้านล่างของหัวข้อ Template Setting ดังภาพที่ 42
- หากต้องการปิดให้คลิกที่ Check box อีกครั้ง เพื่อนำเครื่องหมายถูกออก ดังภาพที่ ข้างต้น
วิธีที่ 2 สามารถเปิด-ปิดการใช้งานได้ทในหน้าแรกที่หัวข้อ Status ซึ่งจะแสดงสถานะปิด-เปิดการใช้งานของ Template ต่างๆ
- เปิดการใช้งานด้วยการคลิก Disabled เพื่อเปิดใช้งาน Template เป็น Enabled ดังภาพที่ 43
- หากต้องการปิดการใช้งานให้คลิก Enabled จะปิดการใช้งาน Template เป็น Disabled ทันที ดังภาพที่ 44
Deleting Templates
การลบ Template สามารถคลิกลบที่หน้าหลักของ OCR Pro ได้ทันที โดยคลิกที่ปุ่ม Delete สีแดงที่หัวข้อ Actions จะปรากฏหน้าต่างเพื่อยืนยันการลบ ให้ทำการคลิกปุ่ม Delete เพื่อลบทันที หากไม่ต้องการลบให้คลิกปุ่มยกเลิก (Cancel) ดังภาพที่ 45
Adjust Showing Rows
ผู้ดูแลระบบสามารถปรับจำนวนการแสดงผลของ Template เพื่อแสดงผลในหน้าเดียว ซึ่งง่ายต่อการจัดการหากมี Template มากขึ้น โดยการคลิกที่ช่อง Rows per page ด้านล่าง จากนั้นเลือกจำนวนการแสดงผลไปที่ 25 ซึ่งรองรับการแสดง Template ได้มากตามจำนวน Template ที่เพิ่มมากขึ้น ดังภาพที่ 46
Sky OCR Pro Accesses Control
ผู้ดูแลระบบ (Admin) มีสิทธิ์เข้าถึงการจัดการฟังก์ชัน OCR Pro เพื่อสร้าง แก้ไข และจัดการได้เพียงผู้เดียว รวมถึงการกำหนด Role ให้แก่ User เพื่อเข้าถึงการใช้งาน OCR Pro ด้วยการ Manage Permissions ภายในโฟลเดอร์ สำหรับการอัพโหลดและการเปิดดูเอกสารสำหรับผู้ใช้ (User) และกลุ่มผู้ใช้ (Group)