OCRmyPDF
เพิ่มชั้นข้อความที่สามารถค้นหาได้ลงในไฟล์ PDF ที่ได้จากการสแกน
ระบบแปลงเอกสารเพื่อการเข้าถึง
แปลงเอกสารภาษาไทยและเอกสารหลายภาษาให้อยู่ในรูปแบบที่สามารถเข้าถึงได้ สำหรับผู้พิการทางการมองเห็น รองรับการใช้งานทั้งแบบรายบุคคล การประมวลผลแบบกลุ่มในระดับองค์กร และการเชื่อมต่อผ่าน API ในอนาคต
รองรับรูปแบบผลลัพธ์ ได้แก่ HTML ที่เข้าถึงได้, DOCX, TXT, EPUB, เสียง MP3, DAISY, เบรลล์ BRF และ PDF/UA
ไฟล์นำเข้า: PDF, DOCX, TXT, JPG, PNG, TIFF, ZIP
เสียง: MP3 และโครงสร้างแบบ DAISY
เบรลล์: รองรับไฟล์ BRF
การประมวลผลแบบกลุ่ม: อัปโหลดหรือผ่านโฟลเดอร์อัตโนมัติ
ระบบสาธิตนี้ได้รับการออกแบบโดยอาศัยเทคโนโลยีโอเพ่นซอร์สที่ผ่านการพิสูจน์แล้วในระดับสากล โดยองค์ประกอบต่าง ๆ ด้านล่างนี้เป็นพื้นฐานทางเทคนิคขั้นต่ำที่จำเป็น สำหรับการประมวลผลเอกสารภาษาไทย การจัดการการแปลงเอกสารแบบกลุ่ม และการสร้างผลลัพธ์ในรูปแบบที่สามารถเข้าถึงได้
เพิ่มชั้นข้อความที่สามารถค้นหาได้ลงในไฟล์ PDF ที่ได้จากการสแกน
ดำเนินการรู้จำอักขระ (OCR) รองรับทั้งภาษาไทยและภาษาอังกฤษ
เครื่องมือ OCR ทางเลือก เพื่อเพิ่มความแม่นยำในการอ่านภาษาไทยและโครงสร้างเอกสารที่ซับซ้อน
แปลงหน้าของไฟล์ PDF ให้เป็นภาพ เพื่อใช้ในกระบวนการ OCR และการเตรียมข้อมูล
ปรับปรุงและเพิ่มคุณภาพของภาพสแกนก่อนเข้าสู่กระบวนการ OCR
ภาษาหลักสำหรับการประมวลผลเอกสาร ระบบอัตโนมัติ และการเชื่อมต่อ AI
ให้บริการ REST API สำหรับการเชื่อมต่อกับระบบภายนอกและหน่วยงานต่าง ๆ
จัดการงานประมวลผลเบื้องหลัง และรองรับการประมวลผลแบบกลุ่มขนาดใหญ่
ทำหน้าที่เป็นตัวกลางสำหรับคิวงานและการจัดการการประมวลผลซ้ำ
ตรวจสอบโฟลเดอร์นำเข้าและสั่งเริ่มกระบวนการประมวลผลอัตโนมัติ
แปลงเนื้อหาเป็นรูปแบบ HTML, DOCX, EPUB และข้อความ
รองรับการแปลง eBook และการจัดการไฟล์ EPUB
สร้างเสียงอ่านแบบออฟไลน์จากข้อความ โดยรองรับโมเดลเสียงภาษาไทย
ระบบสังเคราะห์เสียงขนาดเล็ก ใช้เป็นตัวสำรองในการสร้างเสียง
แปลงข้อความเป็นรูปแบบเบรลล์ดิจิทัล เช่น BRF
รองรับการสร้างหนังสือเสียงในรูปแบบ DAISY ที่มีโครงสร้างนำทาง
ตรวจสอบความถูกต้องของไฟล์ PDF ตามมาตรฐานการเข้าถึง
ตรวจสอบความถูกต้องด้านการเข้าถึงของไฟล์ EPUB
จัดเก็บข้อมูลเมตา สถานะงาน คำขอผู้ใช้งาน บันทึกการตรวจสอบ และผลลัพธ์
ระบบปฏิบัติการเซิร์ฟเวอร์ที่มีความเสถียรและปลอดภัยสำหรับการติดตั้งระบบ
สำหรับระยะเริ่มต้นของการสาธิตและการเปิดใช้งาน ระบบควรถูกติดตั้งบนเซิร์ฟเวอร์เฉพาะ ที่มีความสามารถเพียงพอในการรองรับงาน OCR การสร้างเสียง และการประมวลผลแบบกลุ่ม เพื่อให้ระบบสามารถทำงานได้อย่างมีประสิทธิภาพและเสถียร