Đôi mắt con người - thách thức của công nghệ AI

12:52 30/10/2022

Đạt được sự đa dạng trong tầm nhìn của con người là một trong những thách thức lớn đối với nghiên cứu trí tuệ nhân tạo (AI). Trong phần lớn các trường hợp, chúng ta giỏi hơn máy móc trong việc hiểu thế giới xung quanh. Nhưng máy móc đang bắt kịp - chậm mà chắc.

Michael Felsberg, giáo sư Đại học Linkping và là một trong những nhà nghiên cứu hàng đầu của Thụy Điển về thị giác máy tính và trí tuệ nhân tạo(AI), cho biết: “Trong vòng một ngày, con người chúng ta có thể đi từ lái ô tô đến lặn tự do, vừa đọc báo vừa điều hướng trong một khu rừng rậm - tất cả đều không cần nỗ lực nhiều. Đối với robot, làm những điều tương tự hiện tại là điều không thể”. Con người chúng ta có thể làm được tất cả những điều này, và hơn thế nữa, phần lớn là nhờ vào đôi mắt. Đó là giác quan quan trọng nhất để nhận thức những gì xảy ra xung quanh chúng ta.

Xe tự hành và máy bay không người lái là một số lĩnh vực ứng dụng hiện tại cho nghiên cứu của Michael Felsberg và nhóm của ông thực hiện

Nghiên cứu của Michael Felsberg chủ yếu tập trung vào hệ thống thị giác nhân tạo, với mục đích là giúp máy tính có thể nhìn tốt như con người. “Các hệ thống sinh học hoạt động đơn giản. Con người có kỹ năng đáng kể trong nhận thức và phân tích nói chung, những kỹ năng mà chúng ta muốn mô phỏng trong máy tính. Ngày nay, chúng ta có thể xây dựng các hệ thống kỹ thuật thực hiện tốt một nhiệm vụ cụ thể, chẳng hạn như ôtô tự lái. Tầm nhìn máy tính nói chung đã phát triển thành một trong những thách thức nổi bật nhất trong nghiên cứu AI”.

Michael Felsberg và đồng nghiệp thử nghiệm nhiều giải pháp mà họ phát triển trong phòng thí nghiệm thị lực ở Campus Valla ở Linkoping. Ví dụ, giữa những bức tường kính khổng lồ, máy bay không người lái và ôtô tự lái nhỏ trang bị cảm biến và camera tiên tiến đang được lái thử. Nhưng bộ não thực tế trong tầm nhìn máy tính nằm sau ống kính.

Đã có nhiều nỗ lực mô phỏng bộ não con người - với nhiều kết quả khác nhau. Ngày nay, phương pháp học máy được gọi là học sâu thường được sử dụng. Nói một cách đơn giản, nó có nghĩa là máy tính học các mô hình của nó được tổ chức trong mạng nơ-ron từ một lượng lớn dữ liệu. Thuật toán được cung cấp với lượng dữ liệu khổng lồ, được phân tích ở nhiều cấp độ. Điều này nghe có vẻ phức tạp, và đúng là như vậy.

Michael Felsberg vẽ ra những điểm tương đồng với bộ não con người: “Khi quét não, bạn có thể thấy phần nào của não đang hoạt động trong một số kích thích khác nhau. Nhưng chúng ta vẫn chưa biết điều gì thực sự xảy ra và cách hình thành ý nghĩ trong não. Học sâu hoạt động theo cách tương tự. Chúng ta thấy nó hoạt động, nhưng không phải cách hoạt động chi tiết”. Nhưng tại sao máy tính lại khó nhìn thấy những gì chúng ta thấy? Câu trả lời nằm ở khả năng thích ứng nhanh chóng với mọi tình huống khác nhau và vòng lặp phản hồi giữa nhận thức về môi trường xung quanh cũng như khả năng nhận thức tích cực liên tục của chúng ta.

Nhìn ra ngoài qua ô cửa sổ là ví dụ hàng ngày về tình huống máy tính gặp khó khăn nhưng con người chúng ta lại xoay sở một cách dễ dàng. Chúng ta nhìn thấy ngay những gì đang diễn ra bên ngoài cửa sổ, mặc dù tầm nhìn hơi bị che khuất. Mặt khác, trước tiên máy tính sẽ tự động lấy nét vào bụi bẩn trên khung. Nhưng một khi đã tìm đúng trọng tâm - vào cảnh bên ngoài - thì nó vẫn sẽ không hiểu hết chuyện gì đang xảy ra, bởi vì một số tầm nhìn đã bị che bởi bụi bẩn.

Tuy nhiên, có những lĩnh vực mà máy tính nhìn thấy tốt hơn con người - đặc biệt khi nói đến những phép tính và đánh giá chính xác về khoảng cách, nhiệt độ và các mẫu. Trong những trường hợp này, thị giác máy tính có thể bổ sung cho tầm nhìn của chính chúng ta, thay vì tự rút ra kết luận và hành động theo chúng. Michael Felsberg bình luận: “Một hệ thống kỹ thuật hoạt động tốt miễn là mọi thứ đều như mong đợi. Nhưng đối mặt với điều gì đó không mong muốn, nó sẽ có vấn đề. Chúng ta phải nghiên cứu giúp cho hệ thống mạnh mẽ hơn”.

Nhưng việc phát triển phần mềm có thể vượt qua sự linh hoạt của thị giác con người cần có thời gian. Và theo Michael Felsberg, nghiên cứu đòi hỏi mất thời gian nếu muốn nó trở nên mạnh mẽ. Khoa học là một quá trình, và mỗi bài báo nghiên cứu mới lại thêm một phần nhỏ khác vào câu đố lớn. Những đột phá mang lại cho nghiên cứu bước tiến nhảy vọt là rất hiếm. Khi thị giác máy tính tổng quát tồn tại, Felsberg tin rằng sẽ có nhiều ứng dụng khác nhau - ví dụ như robot xã hội, phương tiện tự hành an toàn hơn và sản xuất hiệu quả hơn.

Nhưng AI lại vấp phải một vấn đề khác. Nhiều lĩnh vực sử dụng có nguy cơ xâm phạm quyền riêng tư cá nhân khi khối lượng lớn dữ liệu cá nhân được xử lý. Vì lý do này, Michael Felsberg và nhóm nghiên cứu của ông đang tập trung vào cách AI có thể cung cấp cái nhìn sâu sắc hơn về cách chúng ta ngăn chặn biến đổi khí hậu: “Biến đổi khí hậu là một trong những mối đe dọa lớn nhất của nhân loại. Sử dụng tầm nhìn máy tính tiên tiến, chúng ta sẽ có thể nhanh chóng phân tích những vùng đất rộng lớn và tầm quan trọng của chúng đối với khí hậu. Con người sẽ mất vài năm để vạch ra một cách thủ công có thể hoàn thành vài tuần với sự trợ giúp của AI”.

Trang Thuần (Tổng hợp)

Thanh tra TP Huế vừa có kết luận chỉ ra nhiều sai phạm trong quản lý, sử dụng nhà, đất công trên địa bàn. Đáng chú ý, có tới 245 cơ sở nhà, đất đã được phê duyệt phương án sắp xếp, xử lý từ trước, nhưng đến thời điểm thanh tra vẫn chưa thực hiện được theo kế hoạch. Sự chậm trễ kéo dài trong tổ chức thực hiện đã làm giảm hiệu quả quản lý tài sản công.

Hàng loạt tài xế chạy xe quá tốc độ bị tổ công tác của Đội CSGT số 11 (Phòng CSGT Công an TP Hà Nội) xử lý trong quá trình làm nhiệm vụ trên tuyến Hoà Lạc – Hoà Bình, đồng thời cảnh báo nguy hiểm đối với hành vi vi phạm này có thể dẫn tới tai nạn nghiêm trọng, thiệt hại về người và tài sản.

Kỳ tuyển sinh đầu cấp và thi vào lớp 10 tại TP Hồ Chí Minh năm học 2026 -2027 ghi nhận nhiều điểm mới về phương thức tuyển sinh, phân bổ chỉ tiêu và cách thức đăng ký. Trong bối cảnh số lượng học sinh tăng mạnh, áp lực thi cử vẫn hiện hữu, đòi hỏi những giải pháp căn cơ để giảm căng thẳng cho học sinh và phụ huynh.

Là công trình đặc trưng của văn hóa Chăm Pa có nhiều giá trị khoa học, lịch sử, kiến trúc, di tích tháp đôi Liễu Cốc (ở làng Liễu Cốc Thượng, phường Kim Trà, TP Huế) hơn 1.000 năm tuổi đã được các cơ quan chức năng tổ chức khai quật khảo cổ học 2 đợt. Tuy nhiên đến nay, di tích kiến trúc - nghệ thuật cấp quốc gia này đang trong tình trạng xuống cấp, chưa được tu bổ, bảo tồn để phát huy giá trị di tích.

Ngày 6/5, Công an tỉnh Bắc Ninh cho biết, Cơ quan CSĐT Công an tỉnh Bắc Ninh vừa ra Quyết định khởi tố vụ án, khởi tố bị can đối với 1 đối tượng về tội “Vu khống” dưới hình thức gửi 31 đơn thư đến nhiều cơ quan chức năng, gây ảnh hưởng xấu đến uy tín, danh dự của người khác.

Nhiều năm nay, cuộc sống của hàng chục hộ dân tại xã Tân Hội (Lâm Đồng) bị đảo lộn khi mỗi ngày phải “chịu trận” trong bầu không khí đặc quánh mùi hôi thối bốc ra từ trang trại chăn nuôi nằm giữa khu dân cư. Những cánh cửa luôn đóng kín, những bữa cơm vội vã và nỗi ám ảnh dai dẳng đã trở thành thực tại ngột ngạt, ảnh hưởng tới sức khỏe và sinh hoạt thường nhật của người dân nơi đây.

Ngày 6/5, sau chuyến lên nương rẫy đầu tiên kể từ khi trở về quê nhà, anh Hara Y Siêu (SN 1997, trú tại xã Sông Hinh, tỉnh Đắk Lắk) đã viết thư cảm ơn gửi đến Công an tỉnh Đắk Lắk và chính quyền địa phương. Lá thư bày tỏ lòng biết ơn sâu sắc trước sự hỗ trợ tận tình để gia đình anh được hồi hương, làm lại cuộc đời trên mảnh đất quê cha đất tổ.

Ngày 6/5, Bộ Khoa học và Công nghệ cho biết, Thủ tướng Chính phủ đã ban hành Quyết định số 21/2026/QĐ-TTg về Danh mục công nghệ chiến lược và Danh mục sản phẩm công nghệ chiến lược.

©2004. Bản quyền thuộc về Báo Công An Nhân Dân.
®Không sao chép dưới mọi hình thức khi chưa có sự đồng ý bằng văn bản của Báo Công An Nhân Dân.
English | 中文