What is Alfresco Document Data Capture Pro? (Sky OCR Pro with PDF Extractor)

Alfresco Document Data Capture Pro หรือ Sky OCR Pro เป็นฟังก์ชันพิเศษที่พัฒนาโดยผู้เชี่ยวชาญด้านระบบการจัดการเอกสารจากบริษัท Skytizens มีความสามารถในการตรวจจับข้อความตัวอักษรที่อยู่ในไฟล์รูปภาพ แล้วนำมาแปลงค่าให้กลายเป็นข้อความตัวอักษรด้วยระบบดิจิทัลที่สามารนำไปสืบค้นได้ มาพร้อมกับเวอร์ชัน Professional ที่เพิ่มประสิทธิภาพในการจัดการเนื้อหาได้อย่างแม่นยำและฟังกชั่นการใช้งานขั้นสูง (สามารถศึกษาความหมายเพิ่มเติมของ OCR ได้ที่ Alfresco Wiki)

โดยเวอร์ชัน Professional มาพร้อมกับเทมเพลตอัจฉริยะ (Smart template) ที่สามารถคัดแยกและจัดการข้อความตัวอักษรของเอกสารรูปแบบต่างๆ ที่อัพโหลดลงในระบบได้อัตโนมัติ พร้อมกับจัดเรียง (Sort) เอกสารและตั้งชื่อไฟล์ใหม่ทั้งหมดโดยปราศจากการจัดการเพิ่มเติม เพื่อจัดเก็บข้อมูล Metadata ไว้ภายในระบบสำหรับการสืบค้นข้อมูลที่สะดวกและง่ายดาย ซึ่งเป็นฟังก์ชันที่รองรับการใช้งานพิเศษเพื่ออำนวยความสะดวกในการทำงานให้ระดับหน่วยงาน องค์กร และบริษัทได้อย่างมหาศาล

รองรับการทำงานที่มากกว่าเวอร์ชัน Lite โดยไม่ต้องพึ่งฟังก์ชันเสริมเพิ่มเติม ขยายประสิทธิภาพในการแปลงข้อความตัวอักษรให้แม่นยำมากขึ้น วิเคราะห์และจำแนกเอกสารที่เกี่ยวข้องโดยอัตโนมัติ สามารถกำหนดคำสั่งพิเศษด้วยภาษา Java เพื่อการใช้งานที่เต็มประสิทธิภาพ จัดเรียงข้อมูลอย่างเป็นระเบียบโดยอัตโนมัติ และอื่นๆ โดยปกติแล้วจะมีการใช้งานที่สัมพันธ์กับฟังก์ชัน Model Manager และ Custom Search

Why is Alfresco Document Data Capture Pro so important?

การนำข้อมูลที่อยู่ภายในเอกสารไปใช้ในการทำงานแบบ Paperless มีความสำคัญอย่างมากในการป้อนข้อมูลโดยอัตโนมัติ เพื่อช่วยให้การทำงานเอกสารได้อย่างรวดเร็วฉับไว สะดวกต่อการสืบค้น และนำข้อมูลไปใช้ต่อได้อย่างปลอดภัย โดย Sky OCR Pro เป็นการระบุตำแหน่งข้อความภายในไฟล์ภาพเพื่อแปลงข้อความลงในระบบดิจิทัล ที่ได้เพิ่มประสิทธิภาพในการระบุตำแหน่งตัวอักษร ยกระดับความสามารถในการจำแนกประเภทของเอกสารด้วย Template และประสิทธิภาพอื่นๆ เช่น

  • เพิ่มประสิทธิภาพการระบุข้อความ – แสดงข้อความที่กำหนดไว้ได้อย่างถูกต้อง แม่นยำ ครบถ้วนมากยิ่งขึ้น
  • ทำงานได้อย่างชาญฉลาด – คัดแยกเอกสารที่เกี่ยวข้องโดยอัตโนมัติ
  • เพิ่มประสิทธิภาพของฟังก์ชัน – แก้ไขข้อผิดพลาดของระบบให้ทำงานได้อย่างเต็มประสิทธิภาพ
  • ปลอดภัยยิ่งขึ้น – จัดเก็บเอกสารไปที่เซิฟเวอร์ขององค์กรโดยตรง
  • สร้างได้ไม่จำกัด – สามารถสร้างเทมเพลตเพื่อรองรับการ OCR ได้ไม่จำกัดจำนวน

The Difference between OCR Pro and OCR lite

ฟังก์ชันการทำงานของ OCR Pro ยังคงคล้ายคลึงกับเวอร์ชั่น Lite แต่จะมุ่งเน้นไปที่การเพิ่มประสิทธิภาพและเพิ่มฟังก์ชันการใช้งานเพิ่มเติม โดย OCR Pro ได้เพิ่มศักยภาพในการแสกนตัวข้อความอักษรของเอกสารด้วยการสร้าง Template ได้จำนวนมาหาศาลเพื่อรองรับการอ้างอิงเอกสารในรูปแบบไฟล์ PDF ที่มีชุดข้อมูลที่แตกต่างกัน โดยจะมีการเพิ่มประสิทธิภาพและความสามารถในส่วนของการคัดแยกข้อมูลเอกสารได้หลากหลายเพื่อการใช้งานอย่างครอบคลุม เช่น รองรับการบันทึกคำสั่งการด้วยภาษา Java จัดเรียง และคัดแยก เป็นต้น ซึ่งจะใช้งานควบคู่กับฟังก์ชันเสริมอย่าง Alfresco ABBYY OCR Cloud เพื่อดึงศักยภาพสูงสุดในการจัดการข้อความภายในภาพ

Zonal OCR Pro is related to Model Manager and Advanced Custom Search

การใช้งาน OCR Pro จะเกี่ยวข้องกับฟังก์ชันการสร้างเอกสารชนิดพิเศษอย่าง Model Manager ในการนำ Document type มาใช้ใน Template ของ OCR Pro สำหรับทำการอัพโหลดเอกสารในการแปลง Document type และเพิ่มข้อมูล Property หลังจากนั้นก็จะสามารถนำข้อมูลใน Property มาค้นหาในฟังก์ชันการสืบค้นแบบขั้นสูงอย่าง Advanced Custom Search ซึ่ง OCR Pro จะเป็นเหมือนตัวกลางในกระบวนการแปลง Document type ให้สามารถสืบค้นเอกสารใน Custom Search ได้อย่างง่ายดายมากยิ่งขึ้น ดังภาพที่ 1 (สามารถศึกษาวิธีใช้งาน Model Manger และ Custom Search ได้ที่ Alfresco Wiki)

Sky OCR Pro Configuration

วิธีใช้งาน Zonal Data Capture Pro อันดับแรกเข้าไปที่ตัวเลือก Skytizens Features บนแถบ Tools จากนั้นจะเข้าสู่หน้าฟีเจอร์ ให้เลือก Sky OCR Pro ที่หมวดหมู่ Tools เพื่อเข้าไปที่หน้าการจัดการหลักของ Sky OCR Pro จะพบกับส่วนประกอบพื้นฐานของ Template ต่างๆ ได้แก่ Name (ชื่อเทมเพลต), Document (เอกสารที่อัพโหลด), Document Type (ประเภทเอกสารที่อ้างอิง), Created By (ผู้สร้าง), Status (สถานะ), และ Actions (คำสั่ง) ดังภาพที่ 2

ภาพที่ 2 แสดงหน้าแรกและส่วนประกอบต่างๆของ Document Data Capture Pro

คำอธิบายของส่วนประกอบพื้นฐาน

  • Name (ชื่อเทมเพลต) – แสดงชื่อเทมเพลตของเอกสารที่เกี่ยวข้อง
  • Document (เอกสารที่อัพโหลด) – แสดงจำนวนของเอกสารที่อัพโหลดในเทมเพลต
  • Document Type (ประเภทเอกสารที่อ้างอิง) – แสดงประเภทของเอกสารที่ใช้อ้างอิงเนื้อหาข้อความตัวอักษร
  • Created By (ผู้สร้าง) – แสดงชื่อของผู้ที่สร้างเทมเพลต
  • Status (สถานะ) – แสดงสถานะการใช้งาน ได้แก่ เปิดการใช้งาน (Enable), ปิดการใช้งาน (Disable)
  • Actions (คำสั่ง) – แสดงปุ่มคำสั่งของเทมเพลต ได้แก่ Edit (ปุ่มแก้ไข), Delete (ปุ่มลบเทมเพลต)
  • Create (สร้าง) – ปุ่มสร้างเทมเพลตใหม่

หมายเหตุ: ฟังก์ชันพิเศษนี้อนุญาตเฉพาะผู้ดูแลระบบ (Admin) มีสิทธิ์ในการกำหนดค่าของ Document Data Capture Pro เท่านั้น ซึ่งผู้ใช้อื่นไม่สามารถตั้งค่าในส่วนนี้ได้ และถ้าหากไม่มีการสร้าง Template ใดๆ จะไม่มีข้อมูลดังภาพที่ 2 ข้างต้น ปรากกฏอยู่

Creating New Templates

การสร้างเทมเพลต ขั้นตอนแรกให้คลิกปุ่ม Create เพื่อสร้างใหม่ จากนั้นระบบจะแสดงหน้าต่างเพื่อกรอกชื่อ Template (จำเป็นต้องระบุ) เมื่อตั้งเสร็จให้คลิกที่ปุ่ม Save เพื่อบันทึกการสร้าง เทมเพลตจะปรากฏบนหน้าแรกทันที ซึ่งสถานะจะปิดการใช้งานอยู่ โดยสามารถกำหนดสถานะเทมเพลตได้ภายหลัง ดังภาพที่ 3

ภาพที่ 3 แสดงวิธีการสร้าง Template

ในกรณีที่มี Document type เดียวกันแต่ข้อมูลมีความแตกต่างกัน ให้ทำการสร้าง Template ให้มีจำนวนเท่ากันกับข้อมูลที่เปลี่ยนแปลงในเอกสาร

Uploading and Editing Document Templates

ขั้นตอนแรกแอดมินจำเป็นต้องอัพโหลดไฟล์ PDF ต้นฉบับอย่างน้อย 1 ฉบับขึ้นไป จึงจะสามารถทำการแก้ไขและกำหนดสิ่งต่างๆ ได้ โดยการอัพโหลดมีวิธีการดังต่อไปนี้

  1. คลิกที่ปุ่ม Edit ที่หัวข้อ Actions จากนั้นระบบจะเข้าสู่หน้ากำหนดค่า ซึ่งจำเป็นต้องอัพโหลดเอกสารจึงจะสามารถตั้งค่าเพิ่มเติมได้ ดังภาพที่ 4
ภาพที่ 4 วิธีการแก้ไข Template

โดยมีองค์ประกอบหลักต่างๆ ดังนี้

  • Template Documents (เอกสารต้นแบบ) – สามารถเลือก และอัพโหลดไฟล์เอกสารต้นแบบเพื่อนำไปอ้างอิง ประกอบด้วย Select document (เลือกเอกสารที่อ้างอิง), Add document (เพิ่มเอกสารต้นแบบ)
  • Destination Document (เอกสารปลายทาง) – กำหนดชื่อของเอกสารด้วยภาษา Java เพื่อใช้ในงานจัดเรียงและแสดงชื่อ ประกอบไปด้วย Document Name (ชื่อเอกสาร)
  • Template Settings (ตั้งค่าเทมเพลต) – กำหนดชื่อและเปิดใช้งานเทมเพลต ประกอบไปด้วย
    • Template Name (ชื่อเอกสาร) – สามารถเปลี่ยนหรือแก้ไขชื่อเทมเพลต
    • Enabled Template (เปิดใช้งานเทมเพลต) – เปิด-ปิดใช้งานด้วยการคลิกที่ Checkbox
  • Save (บันทึก) – บันทึกการตั้งค่า
  1. จากนั้นให้คลิกที่ Add Document เพื่อเพิ่มไฟล์ PDF ต้นฉบับ ที่หัวข้อ Template Documents จะปรากฏหน้าต่างอัพโหลดไฟล์ ให้คลิกที่ Select files to upload เพื่อเลือกเอกสารที่ต้องการ หลังจากการอัพโหลดเสร็จสิ้นแล้ว จะมีแถบหัวข้อใหม่เพิ่มขึ้นมาคือ Document Fields เพื่อการจัดการ Property ต่างๆ และปุ่มการทำงานเพิ่มเติมที่หัวข้อ Template Documents ดังภาพที่ 5
ภาพที่ 5 แสเงวิธีการอัพโหลดเอกสาร Template

มีองค์ประกอบและคำอธิบายต่างๆ ดังนี้

  • Document Fields (ช่องใส่ข้อมูลเอกสาร) – เป็นพื้นที่สำหรับใส่ข้อมูลต่างๆ ตาม Document type จาก Model Manager ได้ โดยสามารถเลือก Type ได้โดยจากพิมพ์ Key Word ภายในช่อง ซึ่งค่าเริ่มต้นจะอยู่ที่ cm:content (Content) ประกอบไปด้วย
    • Document type (ประเภทเอกสาร) – กำหนด Type ของเอกสารที่อยู่ในระบบหรือที่สร้าง Model Manager โดยการพิมพ์ชื่อของ Type ที่ต้องการ
    • Text (ข้อความ) – กำหนดข้อความอักษรที่อยู่ภายในรูปของเอกสารด้วยการคลิกที่ข้อความที่ไฮไลท์สีเหลืองอยู่ ซึ่งจะเปลี่ยนเป็นสีแดงเมื่อคลิกเลือก
    • Regular Expression (นิพจน์ปกติ) – กำหนดนิพจน์ปกติเพื่อให้ค่าตรงกับ Text ที่เลือกไว้
    • Value (ค่าตัวแปร) – กำหนดค่าของเทมเพลตเพื่อแสดงข้อมูลต่างๆ เช่น ชื่อเอกสาร ข้อมูล วันที่
    • Test Result (ทดสอบผลลัพธ์) – แสดงผลลัพธ์ที่ตั้งค่าไว้ในแต่ละ Property ทำงานร่วมกับปุ่ม Test
    • Assign (สั่งงาน) – ปุ่มสั่งงานให้ข้อความที่เลือกปรากฏลงบน Text
    • Test (ทดสอบ) – ปุ่มทดสอบผลลัพธ์
    • Info (ข้อมูล) – ปุ่มสำหรับดูข้อมูลของ
    • Clear (ล้าง) – ล้างทุกข้อความ
    • Help (ช่วยเหลือ) – แสดงคำสั่ง Java เพื่อระบุลงในแถบ Document Fields และ Destination Document
  • Template Documents (เอกสารต้นแบบ) – หลังจากอัพโหลดเอกสารจะปรากฏปุ่มเพิ่มเติมสำหรับแก้ไข ลบ อัพเดท เปิดใช้งานการแหล่งอ้างอิง ประกอบด้วย
    • Upload New Version  (อัพโหลดเวอร์ชั่นใหม่) – อัพโหลดเอกสารเวอร์ชั่นใหม่แทนที่ตัวปัจจุบัน
    • Delete Document (ลบเอกสารอ้างอิง) – ลบเอกสารที่เลือกไว้จาก Select Document
    • Enabled Source (เปิดใช้งานการอ้างอิง) – Checkbox เพื่อกำหนดการเปิด-ปิดการใช้งานแหล่งอ้างอิงเอกสาร

Editing Document Fields

การกำหนดค่าเอกสารต้นแบบเพื่อใช้อ้างอิงข้อมูลที่เกี่ยวข้อง มีวิธีการดังนี้

  1. คลิกที่ปุ่ม Edit ที่หัวข้อ Actions จากนั้นระบบจะเข้าสู่หน้ากำหนดค่าและดูตัวอย่างเอกสารต้นแบบ ดังภาพข้างต้น
  2. คลิกที่ช่อง Document Type ของหัวข้อ Document Fields ทำการลบ Type เริ่มต้น “cm_content” จากนั้นกรอกชื่อ Type ของเอกสารลงไปในช่อง ระบบจะปรากฏ Type ที่มีอยู่ตามชื่อที่ใส่ สามารถเลือก Type พิเศษของ Model Manager หรือ Type ทั่วไปในระบบ Alfresco ได้ เพื่อกำหนด Property ดังภาพที่ 6
ภาพที่ 6 วิธีการเปลี่ยน Document type
  1. เมื่อเปลี่ยน Type เสร็จสิ้น ให้คลิกเลือกข้อความที่มีไฮไลท์สีเหลืองในการจัดการตัวอย่างเอกสารที่แสดงอยู่ด้านซ้าย เมื่อคลิกที่ข้อความจะเปลี่ยนเป็นสีแดง จากนั้นให้คลิกที่ปุ่ม Assign เพื่อใส่ข้อความลงใน Text Box ดังภาพที่ 7
ภาพที่ 7 วิธีการแปลงข้อความลงใน Property
  • ผู้ดูแลระบบสามารถตรวจสอบตำแหน่งและข้อมูลของข้อความที่ Assign โดยคลิกที่ปุ่ม Info จากนั้นระบบจะแสดงช่องข้อมูลในสีเหลืองด้านล่างของปุ่ม ดังภาพที่ 8
ภาพที่ 8 วิธีการเปิดดูข้อมูลที่แปลงล่าสุด

Replace Text 

หากต้องการแทนที่ข้อความปัจจุบันสามารถทำได้โดยการคลิกที่ปุ่ม Info เพื่อดูข้อความที่ Assign ล่าสุด ให้คลิกที่ข้อความปัจจุบันเพื่อนำออก จากนั้นทำการ Assign ข้อความใหม่เพื่อแทนที่ Text เดิม ดังภาพที่ 9

ภาพที่ 9 วิธีการเปลี่ยนข้อความใน Text

หมายเหตุ: ช่อง Text จะไม่สามารถพิมพ์ข้อความตัวอักษรใดๆ ลงไปได้ เพื่อป้องกันการแก้ไขและดัดแปลงข้อมูล 

Adding Variables

  1. ทำการกำหนดนิพจน์ปกติ (Regular Expression) ให้ตรงกับข้อความที่เลือก เช่น (.*) เป็นต้น จากนั้นกำหนดคำสั่ง Java ในช่อง Value ที่ต้องการแสดงใน Property เช่น {group1.toUpperCase()} ดังภาพที่ 10
ภาพที่ 10 เริ่มต้นการกำหนด Variables
  • หากต้องการความชวยเหลือให้คลิกที่ปุ่ม Help จะปรากฏคำสั่งต่างๆ ดังภาพที่ 11
ภาพที่ 11 แสดงข้อมูลของปุ่ม Help

ตัวแปรต่างๆ มีคำสั่งในการทำงานที่แตกต่างกัน โดยมีตารางอธิบายค่าต่างๆ ดังต่อไปนี้

Available Variables
{prefix_property} ใส่คำนำหน้า (Prefix) และชื่อ Property ของเอกสาร เช่น {cm_name}
{groupN} ระบุกลุ่มของตัวแปรเพื่อแสดงข้อมูลใน Property จากช่อง Text ที่กำหนดไว้ เช่น {group1}
{day} วันที่
{month} เดือนแบบตัวเลข
{byy} พุทธศักราชแบบย่อ เช่น 63
{byyyy} พุทธศักราชแบบสมบูรณ์ เช่น 2563
{gyy} คริสต์ศักราชแบบย่อ เช่น 20
{gyyyy} คริสต์ศักราชแบบสมบูรณ์ เช่น 2020
Available Functions
convertDate(format1,format2) จัดรูปแบบและจำแนกวันที่ของตัวแปร String(ใช้คำสั่ง java ในรูปแบบ SimpleDateFormat) เช่น convertDate(‘MM’,’MMMM’)
toUpperCase() แปลงค่าตัวแปร String ให้เป็นตัวอักษรตัวพิมพ์ใหญ่ เช่น Oct > OCT
toLowerCase() แปลงค่าตัวแปร String ให้เป็นตัวอักษรตัวพิมพ์เล็ก เช่น Oct > oct
replace(string,replacement) แทนที่ตัวแปรด้วยการระบุค่า เช่น “123”.replace(“2″,”4”) > “143”
replaceAll(regexp,replacement) แทนที่ตัวแปรทั้งหมดด้วยการระบุค่า เช่น “1–3”.replace(“+”,”4″) > “143”
isNull(default) กลับคืนค่าเริ่มต้นหากตัวแปรมีค่าเป็น Null เช่น isNull(“Undefined”)
split(regexp) แบ่งค่าเป็น List of Values เช่น split(“_”)
get(index) นำส่วนประกอบของค่า List of Values เช่น get(0)
join(str) เชื่อมส่วนประกอบของค่า List of values โดยการใช้ตัวแปร String เป็นตัวกำหนดขอบเขต เช่น join(‘,’)
getDataList(site,name,prop) แบบฟอร์มของ List of values ที่มีข้อมูล Field และ Datalist เช่น getDataList(‘site’,’datalist’,’dl_name’)
getDataList(site,name,prop,prop2) แบบฟอร์ม List of values ที่มีข้อมูล Datalist และ Field ที่ค่านั้นเท่ากับ prop2 field เช่น getDataList(‘site’,’datalist’,’dl_name’,’dl_code’)
getMasterData(names,parent,locale) แบบฟอร์ม List of values ที่มีข้อมูล Master Data และ Field เช่น getMasterData(‘datalist’,’value’,’th_TH’)
  • จากนั้นคลิกปุ่ม Test เพื่อทดสอบการทำงานของคำสั่ง ผลลัพธ์จะแสดงที่ช่อง Test Result เพื่อทดสอบการใช้งานของคำสั่ง ซึ่งข้อมูลจะไม่ปรากฏหากคำสั่งนั้นๆ ไม่แสดงผลลัพธ์บน Test Result ดังภาพที่ 12
ภาพที่ 12 ตรวจสอบข้อมูลเพื่อความถูกต้อง
  1. ต่อมาให้คลิก Enabled Source ที่หัวข้อ Template Documents เพื่อเปิดใช้งานการอ้างอิงเอกสาร จากนั้นคลิก Enabled Template ที่หัวข้อ Template Settings เพื่อเปิดสถานะการใช้งานของเทมเพลต จากนั้นคลิก Save เพื่อบันทึกการตั้งค่า ดังภาพที่ 13
ภาพที่ 13 การเปิดใช้งานเอกสารที่ต้องการอ้างอิงและเปิดใช้งาน Template

Clear All Texts and Variables

  • หากต้องการลบข้อมูลให้คลิกที่ปุ่ม Clear เพื่อล้างข้อมูลทั้งหมดของแต่ละ Property ดังภาพที่ 14
ภาพที่ 14 วิธีการล้างข้อมูลอย่างง่าย

Configuring Destination of Document Templates

การกำหนดค่าสำหรับเปลี่ยนชื่อเอกสารที่อัพโหลดไปยังโฟลเดอร์ปลายทางโดยอัตโนมัติ เพื่อง่ายต่อการสืบค้นและจัดระเบียบเอกสาร โดยมีวิธีการดังต่อไปนี้

  1. คลิกที่ปุ่ม Edit ที่หัวข้อ Actions จากนั้นระบบจะเข้าสู่หน้ากำหนดค่าและดูตัวอย่างเอกสารต้นแบบ ดังภาพข้างต้น
  2. ให้ไปที่ช่องว่างของ Document Name เพื่อกำหนดตัวแปรต่างๆ ด้วยการกรอกคำสั่ง Java ในหัวข้อ Destination Document เช่น {cm_name}-{day}-{month}-{gyyyy} เพื่อแสดงชื่อไฟล์เอกสาร วัน เดือน ปี เป็นต้น ดังภาพที่ 15
ภาพที่ 15 เริ่มต้นการกำหนดให้เอกสารเปลี่ยนชื่อโดยอัตโนมัติ
  • หากต้องการความช่วยเหลือให้คลิกที่เครื่องหมาย (?) ตกใจท้ายช่อง จะปรากฏตัวแปรต่างๆ ที่สามารถกำหนดได้ตาม Document type ที่ผู้ดูแลระบบเลือก ซึ่งจะแตกต่างกันออกไปตาม Type จากนั้นคลิก Save ดังภาพที่ 16
ภาพที่ 16 แสดงตัวแปร Variables ที่สามารถใส่ได้

โดยมีตัวแปรเบื้องต้นและคำอธิบายดังต่อไปนี้

Available Variables
{day} วันที่
{month} เดือนแบบตัวเลข
{byy} พุทธศักราชแบบย่อ เช่น 63
{byyyy} พุทธศักราชแบบสมบูรณ์ เช่น 2563
{gyy} คริสต์ศักราชแบบย่อ เช่น 20
{gyyyy} คริสต์ศักราชแบบสมบูรณ์ เช่น 2020
{cm_name} ชื่อเอกสาร
{cm_title} ชื่อหัวข้อเอกสาร
{cm_description} คำอธิบายของเอกสาร
  1. เมื่อทำการอัพโหลดไฟล์ไปยังโฟลเดอร์ INPUT ระบบจะทำการเปลี่ยนชื่อเอกสารโดยอัตโนมัติ จากนั้นไปที่โฟลเดอร์ที่เก็บเอกสารเพื่อดูผลลัพธ์ของ Document Name ดังภาพที่ 17
ภาพที่ 17 แสดงผลลัพธ์ของการเปลี่ยนชื่อเอกสารโดยอัตโนมัติ

Creating Folder Rules for PDF Extraction

การใช้งานการคัดแยกเอกสาร จัดเรียง และตั้งชื่อโฟลเดอร์โดยอัตโนมัติด้วยการกำหนด Rule สำหรับ Folder Input เพื่อสร้างคำสั่งในการคัดแยกอย่างมีประสิทธิภาพ โดยมีวิธีการดังต่อไปนี้ (สามารถศึกษาวิธีการกำหนดค่า Rule ได้ที่ Alfresco Wiki)

  1. สร้าง Folder Input เพื่อเป็นต้นทางในการอัพโหลดไฟล์เพื่อนำไปประมวลผล เช่น 01_INPUT เป็นต้น จากนั้นทำการ Manage Rules ด้วยการเพิ่มฟังก์ชัน Sky PDF Extraction ให้ทำการเลือกโฟลเดอร์ปลายทางสำหรับจัดเก็บเอกสารและโฟลเดอร์ Error เพื่อจัดเก็บเอกสารที่เกิดข้อผิดพลาด ดังภาพที่ 18
ภาพที่ 18 วิธีการกำหนด Rule ให้กับโฟลเดอร์ INPUT
  • Destination folder – ระบุโฟลเดอร์ปลายทางสำหรับจัดเก็บเอกสาร ประกอบไปด้วย
    • Destination folder (โฟลเดอร์ปลายทาง) ทำการจัดเก็บไปยังโฟลเดอร์ที่กำหนดไว้
    • Error folder (โฟลเดอร์ไฟล์ Error) โฟลเดอร์ปลายทางสำหรับจัดเก็บไฟล์ที่มีความผิดพลาด 
  • Relative path – สร้างโฟลเดอร์ย่อยเพิ่มเติมโดยอัตโนมัติ
  • Rename the file name if already exists – เปลี่ยนชื่อไฟล์ที่ซ้ำกัน
  1. ให้ทำการเลือกโฟลเดอร์ปลายทางหลังการประมวลผลและจัดเก็บไฟล์ภายในไซต์ต่างๆ หากต้องการสร้างโฟลเดอร์ย่อยเพิ่มเติมให้กำหนดที่ Relative path เพื่อใส่ชื่อโฟลเดอร์ เช่น A/B/C/1/2/3, 01/02/03, หรือ Tax/2020 เป็นต้น โดยอักขระ “ / ” จะทำหน้าที่แบ่งจำนวนโฟลเดอร์ และสามารถเปลี่ยนชื่อไฟล์ที่ซ้ำกันได้ในกรณีที่การอัพโหลดไฟล์และประมวลผลมีข้อมูลที่ตรงกัน จากนั้นคลิก Create ดังภาพที่ 19

หมายเหตุ:  PDF Extraction จำเป็นต้องทำงานเป็นพื้นหลัง (Run in Background) เท่านั้น

Uploading Files

ทำการอัพโหลดไฟล์ไปที่โฟลเดอร์ Input เพื่อใช้งานการ OCR ระบบจะประมวลผลเอกสารที่คล้ายคลึงกันมากที่สุด จากนนั้นจะคัดแยก และตั้งชื่อไฟล์ตามที่ผู้ดูแลระบบได้กำหนดไว้ใน Template ได้ดังภาพที่ 20

  • หากเปิดดูไฟล์เอกสารจะพบว่าข้อมูลทั้งหมดได้ถูกนำมาวางไว้ที่ Property เรียบร้อยแล้ว ดังภาพที่ 21
ภาพที่ 21 แสดงผลลัพธ์หลังจากการอัพโหลดสำเร็จ

Uploading Fails

หากพบเอกสารที่มีข้อมูลที่ผิดพลาดหรือไม่ตรงกับ Data type ระบบจะทำการย้ายเอกสารไปยังโฟลเดอร์ Error โดยอัตโนมัติ ดังภาพที่ 22 (สามารถศึกษาความหมายของ Data type เพิ่มเติมได้ที่ Alfresco Wiki)

ภาพที่ 22 แสดงโฟลเดอร์จัดเก็บเอกสารข้อมูลที่ผิดพลาด

เมื่อคลิก Edit SkyArea OCR properties จะพบกับข้อมูลที่ Error โดยจะแสดงเป็นไอคอนสีส้ม หากค่าของ Data type นั้นไม่ถูกต้อง ดังภาพที่ 23

ภาพที่ 23 แสดงตำแหน่งข้อมูลที่ผิดพลาด

โดยมีคำอธิบายดังต่อไปนี้

  • สีเขียว 🟢  ข้อมูลของ Data type ถูกต้องสมบูรณ์
  • สีเหลือง 🟡 ค่าใดค่าหนึ่งของ Data Type ไม่ถูกต้อง
  • สีแดง 🔴  ไม่มีข้อมูลใน Property

Changing Template Name

ผู้ดูแลระบบสามารถเปลี่ยนแปลงชื่อของ Template ต่างๆ ได้ ตามต้องการ โดยมีวิธีการดังต่อไปนี้

  1. คลิกที่ปุ่ม Edit ที่หัวข้อ Actions จากนั้นระบบจะเข้าสู่หน้ากำหนดค่าและดูตัวอย่างเอกสารต้นแบบ ดังภาพข้างต้น
  2. เมื่อเข้ามาที่หน้าแก้ไขให้คลิกที่ช่อง Template Name ของหัวข้อ Template Settings เพื่อทำการแก้ไขชื่อ Template จากนั้นคลิก Save ดังภาพที่ 24
ภาพที่ 24 เริ่มต้นการแก้ไขและเปลี่ยนชื่อเทมเพลต
  • เมื่อกลับที่หน้าหลักจะพบว่าชื่อของ Template ได้เปลี่ยนเป็นที่เรียบร้อยแล้ว ดังภาพที่ 25
ภาพที่ 25 แสดงผลลัพธ์หลังจากเปลี่ยนชื่อเสร็จสิ้น

Selecting Documents Template

ผู้ดูแลระบบสามารถเลือกเอกสารต้นแบบเพื่อนำมาแก้ไขได้หลากหลาย โดยการคลิกที่ช่องว่างของ Select Document ที่หัวข้อ Template Document จากนั้นจะมีเอกสารที่อัพโหลดไวให้เลือกตามต้องการ ดังภาพที่ 26

ภาพที่ 26 วิธีการเลือกเอกสารสำหรับการอ้างอิง
  • Update New Version

นอกจากนี้ยังสามารถอัพเดทเอกสารได้ หากต้องการปรับเปลี่ยนต้นฉบับ โดยคลิกที่ปุ่ม Update New Version ด้านล่างของหัวข้อ Template Document จะปรากฏหน้าต่างสำหรับเลือกไฟล์เอกสารเพื่ออัพโหลด ดังภาพที่ 27

ภาพที่ 27 วิธีการอัพโหลดเอกสารเวอร์ชั่นล่าสุด

เมื่ออัพโหลดเสร็จสิ้น ระบบจะเปลี่ยนเอกสารเวอร์ชั่นใหม่ทันที ดังภาพที่ 28

ภาพที่ 28 แสดงผลลัพธืของเอกสารเวอร์ชั่นล่าสุด
  • Enable and Disable Source

  1. การเปิดการใช้งานการอ้างอิงเอกสาร ให้ทำการคลิกที่กล่องทำเครื่องหมายถูก Enabled Source ด้านล่างของหัวข้อ Template Document เพื่อเปิด-ปิดการใช้งานได้ทันที ดังภาพที่ 29
ภาพที่ 29 แสดงวิธีการเปิดการใช้งานการอ้างอิงเอกสาร
  1. หากต้องการปิดใช้งานการอ้างอิงให้คลิกที่กล่องทำเครื่องหมายอีกครั้งเพื่อนำออก ดังภาพที่ 30
ภาพที่ 30 แสดงวิธีปิดการอ้างอิง
  • Delete Document Source

การลบ Template Document เมื่อไม่ต้องการใช้อ้างอิง สามารถทำได้โดยการคลิกที่ปุ่ม Delete Document ด้านล่างของหัวข้อ Template Document จะปรากฏหน้าต่างเพื่อยืนยันการลบเอกสาร ให้ทำการคลิกปุ่ม Delete เพื่อลบทันที ดังภาพที่ 31

ภาพที่ 31 ลบเอกสารที่ไม่ต้องการอ้างอิง

Managing Document Previewer

ผู้ดูแลระดับสามารถปรับมุมมองการแสดงผลตัวอย่างของเอกสาร เช่น ย่อ (Zoom out), ขยาย (Zoom in)  จัดพื้นที่ (Area), และตรึงข้อความ (Anchor) บนหน้า Preview ได้อย่างอิสระ โดยมีวิธีการดังต่อไปนี้

  • Zoom in and Zoom out 

คลิกที่ไอคอนปรับ Scale เพื่อปรับขนาดจากซ้ายไปเพื่อขยายขนาด หรือขวาไปซ้ายเพื่อย่อขนาด ที่มุมด้านบนของ Sky Area OCR ดังภาพที่ 32

ภาพที่ 32 แสดงวิธีการย่อ ขยายรูปภาพ

หรือขยายขนาดและย่อด้วยการพิมพ์จำนวนเปอร์เซ็นลงในช่องทางขวาของตัวปรับ Scale ดังภาพที่ 33

ภาพที่ 33 แสดงวิธีการย่อและขยายขนาดรูปภาพด้วยการกำหนดเอง

 

  • Rotate

การปรับหมุนองศาหน้ากระดาษสามารถทำได้โดยคลิกที่ไอคอน Rotate ด้านบน ซึ่งปรับได้ทั้งหมด 3 แบบ คือ 90°, 180°, และ 270° ดังภาพที่ 34

ภาพที่ 34 แสดงวิธีการปรับหมุนองศาของกระดาษ
  • Fit page

ปรับขนาดกระดาษให้พอดี คลิกไอคอนที่ Fit Page ซึ่งอยู่ตรงกลางระหว่าง Rotate และ Fit Width ดังภาพที่ 35

ภาพที่ 35 แสดงวิธีการปรับหน้าการดาษให้พอดีกับการ Preview
  • Fit Width

ขยายหน้ากระดาษให้พอดีกับหน้าแสดงผลตัวอย่าง โดยคลิกไอคอนที่ Fit Width ที่ด้านซ้ายบนขอหัวมุม Preview ดังภาพที่ 36

ภาพที่ 36 แสดงวิธีการขยายหน้ากระดาษให้เท่าขนาดจริง
  • Anchor Text

ปักหมุดข้อความที่ต้องการ โดยอันดับแรกให้คลิกที่ข้อความที่ต้องการ จากนั้นคลิกทีไอคอน Anchor ที่มุมด้านล่างซ้าย จะปรากฏหมุดสีแดงข้างหน้าข้อความ ดังภาพที่ 37

ภาพที่ 37 แสดงวิธีการปักหมุดข้อความ

หากต้องการนำออกให้คลิกที่ Text แล้วคลิกปุ่ม Anchor อีกครั้ง ดังภาพที่ 38

ภาพที่ 38 แสดงวิธีการยกเลิกการปักหมุด
  • Area Docuemnt

กำหนดขอบเขตการ OCR ข้อความ เพื่อความเพิ่มแม่นยำในการ OCR ข้อมูลในเอกสารอ้างอิง (Template Document) เพื่อรองรับการแปลงข้อความในเอกสารที่มีข้อมูลที่แตกต่างกัน โดยการคลิกที่ปุ่ม Area ที่มุมล่างซ้าย ซึ่งจะแสดงลูกศรให้ปรับขอบเขตได้ตามต้องการ ดังภาพที่ 39

ภาพที่ 39 แสดงวิธีการกำหนดขอบเขตการใช้งานข้อความ

หากต้องการยกเลิกการ Area ให้คลิกที่ไอคอนอีกครั้งเพื่อนำออกได้ทันที

  • Changing Page

หากเอกสารมีจำนวนหน้ามากกว่า 1 ขึ้นไป สามารถเปลี่ยนหน้ากระดาษอย่างรวดเร็วได้โดยการเปลี่ยนจำนวนหน้า ที่มุมด้านบนของกระดาษ ดังภาพที่ 40

ภาพที่ 40 แสดงวิธีการเปลี่ยนหน้าด้วยการใส่ตัวเลข

หรือคลิกที่ลูกศรซ้าย-ขวาเพื่อเปลี่ยนหน้าถัดไปหรือย้อนกลับ ดังภาพที่ 41

ภาพที่ 41 แสดงวิธีการเปลี่ยนหน้าด้วยการคลิกลูกศร

Enable and Disable Templates

การเปิด-ปิดการใช้งาน Template สามารถแบ่งออกได้เป็น 2 วิธีดังต่อไปนี้

วิธีที่ 1 คลิกที่ปุ่ม Edit ที่หัวข้อ Actions จากนั้นระบบจะเข้าสู่หน้ากำหนดค่าและดูตัวอย่างเอกสารต้นแบบ ดังภาพข้างต้น

  • จากนั้นคลิกที่ Check Box ชื่อ Enabled Template เพื่อเปิดใช้งาน Template ด้านล่างของหัวข้อ Template Setting ดังภาพที่ 42
ภาพที่ 42 แสดงวิธีการเปิด-ปิดการใช้งาน Template
  • หากต้องการปิดให้คลิกที่ Check box อีกครั้ง เพื่อนำเครื่องหมายถูกออก ดังภาพที่ ข้างต้น

วิธีที่ 2 สามารถเปิด-ปิดการใช้งานได้ทในหน้าแรกที่หัวข้อ Status ซึ่งจะแสดงสถานะปิด-เปิดการใช้งานของ Template ต่างๆ

  • เปิดการใช้งานด้วยการคลิก Disabled เพื่อเปิดใช้งาน Template เป็น Enabled ดังภาพที่ 43
ภาพที่ 43 แสดงวิธีการเปิดสถานะการใช้งาน Template
  • หากต้องการปิดการใช้งานให้คลิก Enabled จะปิดการใช้งาน Template เป็น Disabled ทันที ดังภาพที่ 44
ภาพที่ 44 แสดงวิธีการปิดสถานะการใช้งาน Template

 

Deleting Templates

การลบ Template สามารถคลิกลบที่หน้าหลักของ OCR Pro ได้ทันที โดยคลิกที่ปุ่ม Delete สีแดงที่หัวข้อ Actions จะปรากฏหน้าต่างเพื่อยืนยันการลบ ให้ทำการคลิกปุ่ม Delete เพื่อลบทันที หากไม่ต้องการลบให้คลิกปุ่มยกเลิก (Cancel) ดังภาพที่ 45

ภาพที่ 45 แสดงวิธีการลบ Template

Adjust Showing Rows

ผู้ดูแลระบบสามารถปรับจำนวนการแสดงผลของ Template เพื่อแสดงผลในหน้าเดียว ซึ่งง่ายต่อการจัดการหากมี Template มากขึ้น โดยการคลิกที่ช่อง Rows per page ด้านล่าง จากนั้นเลือกจำนวนการแสดงผลไปที่ 25 ซึ่งรองรับการแสดง Template ได้มากตามจำนวน Template ที่เพิ่มมากขึ้น ดังภาพที่ 46

ภาพที่ 46 แสดงวิธีการเพิ่มการแสดงจำนวน Template

Sky OCR Pro Accesses Control

ผู้ดูแลระบบ (Admin) มีสิทธิ์เข้าถึงการจัดการฟังก์ชัน OCR Pro เพื่อสร้าง แก้ไข และจัดการได้เพียงผู้เดียว รวมถึงการกำหนด Role ให้แก่ User เพื่อเข้าถึงการใช้งาน OCR Pro ด้วยการ Manage Permissions ภายในโฟลเดอร์ สำหรับการอัพโหลดและการเปิดดูเอกสารสำหรับผู้ใช้ (User) และกลุ่มผู้ใช้ (Group)