Lan Nhi (TT Dịch vụ dữ liệu và Trí tuệ nhân tạo Viettel) đã đăng lúc 11:01 - 29.10.2024
Tại hội nghị, nhóm nghiên cứu đến từ Viettel AI đã công bố giải pháp tự động trích xuất cấu trúc bảng biểu trong thời gian thực, giúp đẩy tốc độ trích xuất thông tin nhanh hơn 4 lần so với các giải pháp hiện có trên thị trường trong nước và quốc tế.
Tự động trích xuất dữ liệu là việc sử dụng công nghệ, như trí tuệ nhân tạo (AI) và nhận diện ký tự quang học (OCR) để tự động lấy thông tin từ các nguồn như văn bản, hình ảnh, hoặc tài liệu scan và chuyển đổi chúng thành định dạng dễ xử lý, ví dụ như file Excel.
Đây là nghiệp vụ được thực hiện nhiều trong ứng dụng văn phòng số, hỗ trợ đắc lực cho quá trình số hóa giấy tờ vật lý tại các tổ chức. Mặc dù chữ viết đã được xử lý khá hiệu quả, việc nhận diện và trích xuất chính xác thông tin từ các bảng biểu trong tài liệu đến nay vẫn là một bài toán khó. Tự động hóa quá trình này giúp giảm bớt công việc nhập liệu thủ công, tăng độ chính xác và tốc độ xử lý văn bản.
Theo đại diện nhóm nghiên cứu, giải pháp trích xuất dữ liệu từ bảng biểu của Viettel AI có tốc độ xử lý nhanh gấp 4 lần so với công nghệ hiện nay, lên tới 40 FPS (khung hình/giây) trong một số trường hợp.
Đặc biệt, mặc dù đẩy mạnh tốc độ, độ chính xác vẫn được đảm bảo tương đương các giải pháp hiện có, với độ khác biệt chỉ khoảng 2% trên các tập dữ liệu chuẩn. Thay vì trích xuất thông tin bằng hai giai đoạn như thông thường, nhóm nghiên cứu đã giảm quá trình xuống còn một giai đoạn, giúp xử lý những loại bảng nhiều hàng, cột nhanh chóng hơn.
Giải pháp này còn tiếp cận theo hướng giảm độ phức tạp của quy trình xử lý, giúp tiết kiệm bộ nhớ và huấn luyện mô hình AI dễ dàng hơn, hướng đến những cải thiện ưu việt hơn nữa trong tương lai.
Hiện tại, công nghệ này đã được tích hợp vào Viettel IDP - giải pháp xử lý hồ sơ thông minh do Viettel AI nghiên cứu và phát triển. Viettel IDP có khả năng tự động bóc tách thông tin dạng ảnh với tốc độ dưới 2 giây/trang tài liệu, nhanh hơn 60 - 80 lần so với nhập liệu thủ công, độ chính xác lên tới 90%, giúp người dùng tiết kiệm 80% thời gian phê duyệt hồ sơ.
Công nghệ được công bố tại Hội nghị ECAI 2024 là bước đầu trong quá trình tăng tốc độ xử lý của Viettel IDP, hướng đến mục tiêu xử lý thông tin không chỉ dưới 2 giây mà là tức thì. Sự góp mặt tại ECAI 2024 không chỉ mở ra cho Viettel AI cơ hội hợp tác, trao đổi với các chuyên gia hàng đầu thế giới mà còn góp phần khẳng định năng lực và vị thế của mình trên bản đồ AI quốc tế.