Tự động nhận diện bảng biểu trên giấy tờ siêu nhanh cùng AI

17:00 25/10/2024

Tại hội nghị ECAI 2024, Viettel AI công bố giải pháp nhận diện, trích xuất thông tin từ bảng biểu trong thời gian thực với tốc độ nhanh gấp 4 lần so với các giải pháp hiện có trên thế giới.

Góp mặt tại ECAI - Hội nghị Châu Âu về Trí tuệ nhân tạo 2024 tổ chức tại Tây Ban Nha, nhóm nghiên cứu đến từ Trung tâm Dịch vụ dữ liệu và Trí tuệ nhân tạo Viettel (Viettel AI) đã công bố giải pháp tự động trích xuất cấu trúc bảng biểu trong thời gian thực, giúp đẩy tốc độ trích xuất thông tin nhanh hơn 4 lần so với các giải pháp hiện có trên thị trường trong nước và quốc tế.

Tự động trích xuất dữ liệu là việc sử dụng công nghệ, như trí tuệ nhân tạo (AI) và nhận diện ký tự quang học (OCR) để tự động lấy thông tin từ các nguồn như văn bản, hình ảnh, hoặc tài liệu scan và chuyển đổi chúng thành định dạng dễ xử lý, ví dụ như file Excel. Đây là nghiệp vụ được thực hiện nhiều trong ứng dụng văn phòng số, hỗ trợ đắc lực cho quá trình số hóa giấy tờ vật lý tại các tổ chức. Mặc dù chữ viết đã được xử lý khá hiệu quả, việc nhận diện và trích xuất chính xác thông tin từ các bảng biểu trong tài liệu đến nay vẫn là một bài toán khó. Tự động hóa quá trình này giúp giảm bớt công việc nhập liệu thủ công, tăng độ chính xác và tốc độ xử lý văn bản.

Theo đại diện nhóm nghiên cứu, giải pháp trích xuất dữ liệu từ bảng biểu của Viettel AI có tốc độ xử lý nhanh gấp 4 lần so với công nghệ hiện nay, lên tới 40 FPS (khung hình/giây) trong một số trường hợp. Đặc biệt, mặc dù đẩy mạnh tốc độ, độ chính xác vẫn được đảm bảo tương đương các giải pháp hiện có, với độ khác biệt chỉ khoảng 2% trên các tập dữ liệu chuẩn.

Thay vì trích xuất thông tin bằng hai giai đoạn như thông thường, nhóm nghiên cứu đã giảm quá trình xuống còn một giai đoạn, giúp xử lý những loại bảng nhiều hàng, cột nhanh chóng hơn. Giải pháp này còn tiếp cận theo hướng giảm độ phức tạp của quy trình xử lý, giúp tiết kiệm bộ nhớ và huấn luyện mô hình AI dễ dàng hơn, hướng đến những cải thiện ưu việt hơn nữa trong tương lai.

Đại diện nhóm nghiên cứu cũng cho biết, hiện công nghệ này đã được tích hợp vào Viettel IDP – giải pháp xử lý hồ sơ thông minh do Viettel AI nghiên cứu và phát triển. Viettel IDP có khả năng tự động bóc tách thông tin dạng ảnh với tốc độ dưới 2 giây/trang tài liệu, nhanh hơn 60-80 lần so với nhập liệu thủ công, độ chính xác lên tới 90%, giúp người dùng tiết kiệm 80% thời gian phê duyệt hồ sơ. Công nghệ được công bố tại Hội nghị ECAI 2024 là bước đầu trong quá trình tăng tốc độ xử lý của Viettel IDP, hướng đến mục tiêu xử lý thông tin không chỉ dưới 2 giây mà là tức thì.

ECAI là một trong những hội nghị thường kỳ có uy tín hàng đầu thế giới về AI, thu hút sự tham dự của hàng trăm chuyên gia, nhà nghiên cứu và nhà khoa học xuất sắc đến từ nhiều quốc gia trên thế giới. Đây là nơi quy tụ những nghiên cứu và công nghệ mới nhất, là bệ phóng cho những ý tưởng và giải pháp mang tính đột phá trong lĩnh vực AI. ECAI 2024 được Hiệp hội Trí tuệ Nhân tạo Châu Âu và Hiệp hội Trí tuệ Nhân tạo Tây Ban Nha phối hợp tổ chức.

Viettel AI là đơn vị trực thuộc Tập đoàn Công nghiệp – Viễn thông Quân đội (Viettel), tiên phong làm chủ và phát triển các sản phẩm, dịch vụ thuộc lĩnh vực AI, Big Data, Robotics và Digital Twin. Hiện nay, hệ sinh thái Viettel AI bao gồm nhiều dòng sản phẩm có chất lượng dẫn đầu tại Việt Nam, được nhiều tổ chức, doanh nghiệp lớn trong nước và quốc tế tin tưởng sử dụng.

An An

Cục Xây dựng phong trào bảo vệ an ninh Tổ quốc (ANTQ) chủ động tham mưu giúp Bộ hướng dẫn các địa phương củng cố, nâng cao chất lượng, hiệu quả phong trào toàn dân bảo vệ ANTQ; tiếp tục làm tốt công tác dân vận, tạo sự đồng thuận để CBCS và nhân dân thống nhất thực hiện tốt các chủ trương đường lối chính sách của Đảng, pháp luật của Nhà nước và của ngành Công an. 

Ngày 22/12, tại TP Hồ Chí Minh, Bệnh viện 30-4 (Bộ Công an) đã tổ chức Hội nghị tổng kết công tác năm 2025 và triển khai chương trình công tác, phát động phong trào thi đua “Vì an ninh Tổ quốc” năm 2026. Trung tướng Đặng Hồng Đức, Thứ trưởng Bộ Công an đến dự và phát biểu chỉ đạo tại Hội nghị.

Một công trình trường học khang trang, quy mô 3 tầng với 12 phòng học, tổng mức đầu tư xấp xỉ 8 tỷ đồng đã hoàn thiện cơ bản từ năm 2022 nhưng đến nay vẫn chưa được bàn giao đưa vào sử dụng. Trớ trêu hơn, trong khi trường mới “cửa đóng then cài” thì học sinh Trường THCS Hợp Tiến, tỉnh Thanh Hoá lại phải học nhờ ngay chính trong công trình chưa nghiệm thu, bàn giao.

Trong suy nghĩ của nhiều phụ huynh, phim hoạt hình đồng nghĩa với sự trong sáng, an toàn và phù hợp cho trẻ nhỏ. Thế nhưng, thời gian gần đây, không ít bộ phim hoạt hình gắn mác “dành cho trẻ em” lại lồng ghép các yếu tố bạo lực, chém giết, máu me, thậm chí là nội dung nhạy cảm, lệch chuẩn đạo đức, âm thầm tác động tiêu cực đến nhận thức và tâm lý trẻ.

Vụ án tiền bồi dưỡng phục vụ A80 tại Trường Cao đẳng Du lịch Hà Nội không gây tranh cãi vì vài trăm nghìn đồng, mà vì cách chi trả và ứng xử thiếu minh bạch đã làm lộ rõ những lỗ hổng quen thuộc trong quản trị giáo dục công. Từ chênh lệch mức chi giữa các trường, giấy tờ ký nhận không ghi số tiền, đến buổi đối thoại đổi giờ vào phút chót, câu chuyện A80 trở thành một bài kiểm tra gay gắt về trách nhiệm giải trình và niềm tin của sinh viên đối với hệ thống.

Chính quyền Mỹ vừa ra tuyên bố phong tỏa các tàu chở dầu trong diện bị trừng phạt khi rời khỏi hoặc tiến vào Venezuela nhằm siết chặt nguồn thu dầu - trụ cột kinh tế Caracas.

Tháng 12, miên man trong ký ức về một thời hoa lửa, nhớ bao nhiêu đồng chí, đồng đội đã anh dũng ngã xuống, người cựu cán bộ Quân báo Quân khu Sài Gòn - Gia Định (SG-GĐ) bộc bạch với phóng viên Chuyên đề ANTG rằng, có những chuyện tới khi nào nhắm mắt thì thôi chứ không thể nào quên. Và tuy có những chuyện chỉ nghe lại từ đồng chí, đồng đội, nhưng giờ nhớ lại, ông bỗng thấy cay cay nơi khóe mắt…

Xét về số lượng huy chương vàng ở các bộ môn được tính trên bảng tổng sắp, Đoàn Thể thao Việt Nam chưa hoàn thành chỉ tiêu như kỳ vọng ban đầu. Dẫu sao, việc vẫn xếp thứ 3 toàn đoàn và gặt hái thành công ở các bộ môn Olympic vẫn đáng được biểu dương, ghi nhận.

©2004. Bản quyền thuộc về Báo Công An Nhân Dân.
®Không sao chép dưới mọi hình thức khi chưa có sự đồng ý bằng văn bản của Báo Công An Nhân Dân.
English | 中文