Baidu เปิดตัว PP-OCRv6 รองรับ 50 ภาษา โดยจำนวนพารามิเตอร์ระดับ 10 ล้านเทียบเท่า VLM ขนาดระดับพันล้าน
ทีม PaddlePaddle ของ Baidu เพิ่งเปิดตัว PP-OCRv6 ระบบ OCR ใหม่ที่มี 3 เวอร์ชัน ได้แก่ Tiny (1.5 ล้านพารามิเตอร์), Small (7.7 ล้าน) และ Medium (34.5 ล้าน) โดยโมเดล Medium ให้ผลการตรวจจับแม่นยำดีขึ้น 4.6% และความแม่นยำด้านการรู้จำดีขึ้น 5.1% เมื่อเทียบกับ PP-OCRv5 พร้อมทั้งรวมภาษาอย่างจีน อังกฤษ ญี่ปุ่น และ 46 ภาษาในกลุ่มอักษรละตินให้เป็นโมเดลเอกภาพเดียว ระบบนี้ใช้เทคนิค structural reparameterization เพื่อลดภาระการคำนวณ ขณะเดียวกันก็เพิ่มความแม่นยำ ภายใต้การปรับแต่งด้วย OpenVINO เวอร์ชัน Medium ทำ