Chatbot google: Đạt trình độ gần như con người

11:00 06/03/2020

Google cho biết chatbot mới nhất của họ đã đạt trình độ giống như con người nhất từ trước tới nay, với khả năng lưu trữ 341GB dữ liệu phương tiện truyền thông xã hội.

Các nhà nghiên cứu trí thông minh nhân tạo (AI) tại Google đã đào tạo một mạng lưới thần kinh khổng lồ bằng cách sử dụng 341GB thảo luận được lấy từ phương tiện truyền thông xã hội công cộng để tạo ra thứ mà họ tin là chatbot giống con người nhất từ trước đến nay.

Phần mềm được đặt tên là Meena, có một mô hình seq2seq của Tensorflow chứa các cuộc hội thoại được mã hóa dưới dạng các luồng vectơ được chuyển trở lại thành văn bản để tạo thành câu trả lời khi một người nói với nó. Bạn cung cấp cho nó một dấu nhắc như đầu vào, nó sẽ trả lời lại bằng một câu liên quan.

Thực tế là nó được đào tạo về các cuộc thảo luận và trao đổi của con người, có nghĩa nó thậm chí có thể kích hoạt những câu nghe có vẻ mơ hồ một cách tự nhiên. Mạng nơ-ron có rất nhiều thứ để rút ra: nó chứa 2,6 tỷ tham số, nhiều hơn 1,5 tỷ tham số trong mô hình GPT-2 lớn nhất của OpenAI.

Có vẻ mất khoảng một tháng để đào tạo đầy đủ Meena bằng cách sử dụng 2.048 lõi TPU v3 do Google thiết kế. Tuy nhiên, mọi người ở Google Brain cho rằng tất cả sức mạnh tính toán và thời gian đều đáng giá, tuy nhiên, vì có thể tổ chức một cuộc trò chuyện được coi là một thành phần cần thiết của trí tuệ nhân tạo thực tế.

Khả năng giao tiếp tự do trong ngôn ngữ tự nhiên là một trong những đặc điểm nổi bật của trí thông minh con người, và có khả năng là một yêu cầu đối với trí thông minh nhân tạo thực sự, các nhà khoa học đã viết trong một bài báo phát hành trên arXiv mô tả về Meena.

Meena về cơ bản được đào tạo để bắt chước cách con người nói chuyện với nhau, trò chuyện nhàn rỗi về phim ảnh, kế hoạch cuối tuần, du lịch, chơi nhạc cụ, triết học, toán học, thở dưới nước và mọi thứ thực tế trong cuộc sống.

Hàng trăm gigabyte các cuộc hội thoại công khai trên phương tiện truyền thông xã hội đã được thu thập vào các cây thông điệp, trong đó tin nhắn đầu tiên được coi là gốc và tất cả các câu trả lời tương ứng là các nút con hoặc lá. Sắp xếp dữ liệu theo cách này giúp dễ dàng chuyển đổi các cuộc thảo luận thành các chuỗi văn bản mà phần mềm có thể học hỏi. Nó phải tìm ra những gì liên kết trả lời các tin nhắn trước đó để khi nói chuyện với một người thực sự, nó có thể nhận ra bối cảnh và đưa ra các câu trả lời có liên quan, và tạo ấn tượng cho những gì được thảo luận.

Xây dựng một cỗ máy mạch lạc là khó khăn và hầu hết các chatbot tiết lộ giới hạn của chúng khi chúng nhanh chóng rơi vào tình trạng bập bẹ: câu trả lời mở đầu của chúng có thể giống như con người, nhưng những câu tiếp theo sẽ không có ý nghĩa hoặc hoàn toàn không chính xác. Do đó, con người tương tác với các hệ thống này phải làm như vậy một cách cứng nhắc, xây dựng các câu hỏi cẩn thận để tối đa hóa khả năng máy tính sẽ hiểu lời nhắc và trả lời một cách mạch lạc.

Meena không được thiết kế để trả lời các câu hỏi hoặc hoạt động như một trợ lý kỹ thuật số. Thay vào đó, nó được xây dựng để có những chiếc cằm đầy thuyết phục với những người xử lý như con người. Các nhân viên của Google đã kiểm tra chatbot của họ trên một nhóm công nhân, mặc dù bài báo không ghi rõ có bao nhiêu người được thử nghiệm. Mỗi công nhân được hướng dẫn để có những cuộc trò chuyện ngắn với Meena và chấm điểm bằng cách trả lời hợp lý và cụ thể.

Các biện pháp nhạy cảm, bao nhiêu chatbot có ý nghĩa và mức độ cụ thể làm thế nào nó hiểu được bối cảnh chung của cuộc trò chuyện. Ví dụ, đưa ra lời nhắc nhở "Tôi yêu quần vợt", một câu trả lời như rằng, đó là một câu hỏi hay, nhưng câu trả lời rất hay về tính đặc biệt so với một người như "tôi cũng vậy", "tôi có thể nhận được đủ điểm của Roger Federer!"… Điều thứ hai là một minh chứng rằng một chatbot có thể nắm bắt được rằng có một mối liên hệ giữa quần vợt và tay vợt tennis Roger Federer.

Các nhân viên của Google đã nghĩ ra điểm SSA, viết tắt của độ nhạy và độ đặc hiệu trung bình, để đánh giá hiệu suất của Meena. SSA tốt nhất của nó là 79%; con người trung bình được coi là có SSA cỡ 86%, hoặc chúng ta đã nói như vậy. Cảm giác như Google đã phát minh ra một hệ thống tính điểm và sau đó tuyên bố nó là hệ thống tốt nhất trong hệ thống này.

Meena đã chơi tốt hơn, bất ngờ, ngạc nhiên, hơn các chatbot khác: DialoGPT của Microsoft (48% SSA) và Xiaoice (31%), cộng với Cleverbot (56%) và Mitsuku (56%) - người chiến thắng 5 lần giải thưởng Leobner, một cuộc thi tương tự như Thử nghiệm Turing. Cần lưu ý rằng nhóm Google Meena không được so sánh với bất kỳ phiên bản giành giải thưởng nào của Mitsuku.

Một nhóm chatbot giống như con người, về độ nhạy và độ đặc hiệu, có thể ở trong tầm nhìn nếu chúng ta có thể đạt được sự lúng túng tốt hơn, nhóm nghiên cứu cho biết. Sự lúng túng mô tả chính xác làm thế nào nó có thể dự đoán những gì người khác sẽ nói tiếp theo trong một cuộc trò chuyện.

Meena vẫn bị các vấn đề chatbot phổ biến: nó lặp lại bản thân nó giống như một bản ghi bị phá vỡ, hoặc đôi khi nó trở nên vô nghĩa, hoặc chỉ là hết sức đáng sợ. Ở đây, có một cái nhìn cho chính mình. Tại một số thời điểm, một trò đùa kỳ lạ rơi vào sự điên rồ nhẹ.

Các ứng dụng thực tế của chatbot giống như con người vẫn còn nhiều nghi vấn. Dù sao đi nữa, điểm quan trọng của việc có những cuộc trò chuyện tự động vô tận, trống rỗng với một cỗ máy là gì? Bạn chỉ có thể đi chơi ở máy làm mát nước văn phòng hoặc bình cà phê cho điều đó. Tuy nhiên, Google tin rằng nó có thể, trong một số hình thức trong tương lai, giúp mọi người học các ngôn ngữ mới, thông qua hội thoại hoặc giúp các nhà phát triển tạo hộp thoại tạo phần mềm tốt hơn trong các trò chơi video.

Bên cạnh đó là một vấn đề nghiên cứu hấp dẫn, một tác nhân đàm thoại như vậy có thể dẫn đến nhiều ứng dụng thú vị, như nhân bản hóa hơn nữa các tương tác máy tính, cải thiện thực hành ngoại ngữ, tạo ra các nhân vật phim và trò chơi điện tử tương tác, có thể nói.

Google hiện đang giữ việc phát hành mã công khai trong khi nó đánh giá sự an toàn và sai số trong mô hình.

Bảo Ngọc

Tạm giam Chủ tịch Hội đồng Viện Khoa học quản lý giáo dục (IEMS)

Vụ án có quy mô đặc biệt lớn, hoạt động kéo dài, thủ đoạn tinh vi và có yếu tố nước ngoài. Dưới vỏ bọc tổ chức quốc tế, các đối tượng đã tổ chức hơn 120 kỳ thi, thu hút hơn 80.000 người tham gia, thu lời bất chính số tiền gần 200 tỷ đồng.

Núp bóng doanh nghiệp tổ chức đánh bạc quy mô "khủng" tại khu vực biên giới Lạng Sơn

Núp bóng doanh nghiệp hoạt động lĩnh vực vui chơi giải trí quốc tế, Zeng Hua (Tăng Hoa), HKTT tại Ma Cao, Trung Quốc, là Giám đốc kiêm Chủ tịch hội đồng quản trị Công ty TNHH Vui chơi giải trí và Du lịch Thái Dương đã cho lắp đặt các thiết bị, vật dụng và thuê các đối tượng gồm cả người nước ngoài và người Việt Nam điều hành hoạt động tổ chức đánh bạc và đánh bạc với quy mô "khủng".

Triệt phá đường dây sản xuất giấm giả từ acid công nghiệp tại TP Hồ Chí Minh

Chiều 6/5, Phòng Cảnh sát Kinh tế Công an TP Hồ Chí Minh cho biết đã triệt phá đường dây sản xuất, buôn bán giấm ACETIC giả; khởi tố, bắt tạm giam 4 bị can về tội “Sản xuất, buôn bán hàng giả là lương thực, thực phẩm, phụ gia thực phẩm”.

Người dân bất an vì 2 tòa tháp 13 tầng gây tranh cãi

Các hộ dân cho rằng, 2 tòa tháp 13 tầng nằm trong dự án Nhà tang lễ quận Thanh Xuân (phường Khương Đình, Hà Nội) nhằm lưu trữ tro cốt sẽ ảnh hưởng đến đời sống hàng ngày, do đó, họ đã gửi đơn kiến nghị đến nhiều nơi.

Khởi tố nguyên cán bộ xã chiếm đoạt tiền từ thiện hỗ trợ thiên tai của người dân

Ngày 6/5, Công an tỉnh Ninh Bình cho biết, đơn vị đã ra quyết định khởi tố vụ án, khởi tố bị can và ra lệnh bắt tạm giam đối với Nguyễn Văn Lợi, SN 1984, trú tại thôn 1 Hải Đường, xã Hải Anh, tỉnh Ninh Bình về hành vi “Lừa đảo chiếm đoạt tài sản” theo quy định tại Điều 174, Bộ luật Hình sự.

Dấu hiệu lãng phí khi hàng trăm cơ sở nhà, đất công ở Huế chưa thực hiện theo phương án sắp xếp

Thanh tra TP Huế vừa có kết luận chỉ ra nhiều sai phạm trong quản lý, sử dụng nhà, đất công trên địa bàn. Đáng chú ý, có tới 245 cơ sở nhà, đất đã được phê duyệt phương án sắp xếp, xử lý từ trước, nhưng đến thời điểm thanh tra vẫn chưa thực hiện được theo kế hoạch. Sự chậm trễ kéo dài trong tổ chức thực hiện đã làm giảm hiệu quả quản lý tài sản công.

Di tích quốc gia tháp đôi Liễu Cốc hơn 1.000 năm tuổi chậm được trùng tu, bảo tồn, vì sao ?

Là công trình đặc trưng của văn hóa Chăm Pa có nhiều giá trị khoa học, lịch sử, kiến trúc, di tích tháp đôi Liễu Cốc (ở làng Liễu Cốc Thượng, phường Kim Trà, TP Huế) hơn 1.000 năm tuổi đã được các cơ quan chức năng tổ chức khai quật khảo cổ học 2 đợt. Tuy nhiên đến nay, di tích kiến trúc - nghệ thuật cấp quốc gia này đang trong tình trạng xuống cấp, chưa được tu bổ, bảo tồn để phát huy giá trị di tích.

U17 Việt Nam và phép thử cho chiến lược phát triển bóng đá trẻ

U17 Việt Nam bước vào Vòng chung kết (VCK) U17 châu Á 2026 với tâm thế của một đội bóng trẻ giàu khát vọng, nhưng phía sau trận ra quân gặp U17 Yemen không chỉ là câu chuyện điểm số. Đây còn là phép thử quan trọng cho quá trình phát triển bóng đá trẻ Việt Nam, nơi mỗi giải đấu châu lục đều trở thành thước đo về chất lượng đào tạo, bản lĩnh thi đấu và khả năng cạnh tranh của thế hệ kế cận.

CSGT Hà Nội siết chặt kỷ cương, xây dựng người chiến sĩ Công an mẫu mực, vì nhân dân phục vụ

Sáng 6/5, Phòng CSGT Công an TP Hà Nội tổ chức sơ kết 1 năm thực hiện Kế hoạch nâng cao hiệu quả các biện pháp phòng ngừa cán bộ, chiến sĩ sai phạm. Tham dự hội nghị có Thiếu tướng Đỗ Thanh Bình, Cục trưởng Cục CSGT cùng đại diện Lãnh đạo Công an TP Hà Nội.

Chủ động ứng phó với mưa lớn, lốc, sét, mưa đá

Ban Chỉ đạo Phòng thủ dân sự Quốc gia vừa có văn bản gửi UBND các tỉnh, thành phố khu vực Bắc Bộ, Bắc Trung Bộ và ven biển từ Quảng Ninh đến Quảng Ngãi về việc chủ động ứng phó với mưa lớn, lốc, sét, mưa đá, lũ quét, sạt lở đất và gió mạnh trên biển.

Vì sao thí sinh tự do đăng ký dự thi tốt nghiệp THPT 2026 tăng kỷ lục?

Kỳ thi tốt nghiệp THPT năm 2026 ghi nhận số lượng thí sinh tự do đăng ký dự thi tăng cao chưa từng có, với gần 64.000 thí sinh. Thực tế này không chỉ phản ánh nhu cầu thi lại để tìm đường vào đại học của nhiều người học, mà còn đặt ra yêu cầu về công tác hướng nghiệp cho học sinh cần hiệu quả hơn.

Chuyển 9 trường hợp kinh doanh đa cấp có dấu hiệu vi phạm sang cơ quan Công an

Ủy ban Cạnh tranh quốc gia đã phối hợp chặt chẽ, hiệu quả với các cơ quan Công an các cấp trong công tác đấu tranh phòng, chống tội phạm liên quan đến hoạt động kinh doanh theo phương thức đa cấp.

CSGT kiểm soát chặt tuyến Hòa Lạc – Hòa Bình, ngăn ngừa vi phạm tốc độ

Hàng loạt tài xế chạy xe quá tốc độ bị tổ công tác của Đội CSGT số 11 (Phòng CSGT Công an TP Hà Nội) xử lý trong quá trình làm nhiệm vụ trên tuyến Hoà Lạc – Hoà Bình, đồng thời cảnh báo nguy hiểm đối với hành vi vi phạm này có thể dẫn tới tai nạn nghiêm trọng, thiệt hại về người và tài sản.

CLB Công an Hà Nội nhận cú hích tinh thần lớn trước đại chiến với Thép Xanh Nam Định

Ngày 6/5, CLB Công an Hà Nội (CAHN) tiếp tục đón nhận hàng loạt tin vui từ Ban tổ chức V.League 2025/2026 trước thềm cuộc đối đầu quan trọng với Thép Xanh Nam Định tại vòng 22.

Nhiều điểm mới trong tuyển sinh đầu cấp tại TP Hồ Chí Minh

Kỳ tuyển sinh đầu cấp và thi vào lớp 10 tại TP Hồ Chí Minh năm học 2026 -2027 ghi nhận nhiều điểm mới về phương thức tuyển sinh, phân bổ chỉ tiêu và cách thức đăng ký. Trong bối cảnh số lượng học sinh tăng mạnh, áp lực thi cử vẫn hiện hữu, đòi hỏi những giải pháp căn cơ để giảm căng thẳng cho học sinh và phụ huynh.

Chủ nợ gửi 31 đơn vu khống để gây sức ép đòi nợ

Ngày 6/5, Công an tỉnh Bắc Ninh cho biết, Cơ quan CSĐT Công an tỉnh Bắc Ninh vừa ra Quyết định khởi tố vụ án, khởi tố bị can đối với 1 đối tượng về tội “Vu khống” dưới hình thức gửi 31 đơn thư đến nhiều cơ quan chức năng, gây ảnh hưởng xấu đến uy tín, danh dự của người khác.