Chatbot google: Đạt trình độ gần như con người

11:00 06/03/2020

Google cho biết chatbot mới nhất của họ đã đạt trình độ giống như con người nhất từ trước tới nay, với khả năng lưu trữ 341GB dữ liệu phương tiện truyền thông xã hội.

Các nhà nghiên cứu trí thông minh nhân tạo (AI) tại Google đã đào tạo một mạng lưới thần kinh khổng lồ bằng cách sử dụng 341GB thảo luận được lấy từ phương tiện truyền thông xã hội công cộng để tạo ra thứ mà họ tin là chatbot giống con người nhất từ trước đến nay.

Phần mềm được đặt tên là Meena, có một mô hình seq2seq của Tensorflow chứa các cuộc hội thoại được mã hóa dưới dạng các luồng vectơ được chuyển trở lại thành văn bản để tạo thành câu trả lời khi một người nói với nó. Bạn cung cấp cho nó một dấu nhắc như đầu vào, nó sẽ trả lời lại bằng một câu liên quan.

Thực tế là nó được đào tạo về các cuộc thảo luận và trao đổi của con người, có nghĩa nó thậm chí có thể kích hoạt những câu nghe có vẻ mơ hồ một cách tự nhiên. Mạng nơ-ron có rất nhiều thứ để rút ra: nó chứa 2,6 tỷ tham số, nhiều hơn 1,5 tỷ tham số trong mô hình GPT-2 lớn nhất của OpenAI.

Có vẻ mất khoảng một tháng để đào tạo đầy đủ Meena bằng cách sử dụng 2.048 lõi TPU v3 do Google thiết kế. Tuy nhiên, mọi người ở Google Brain cho rằng tất cả sức mạnh tính toán và thời gian đều đáng giá, tuy nhiên, vì có thể tổ chức một cuộc trò chuyện được coi là một thành phần cần thiết của trí tuệ nhân tạo thực tế.

Khả năng giao tiếp tự do trong ngôn ngữ tự nhiên là một trong những đặc điểm nổi bật của trí thông minh con người, và có khả năng là một yêu cầu đối với trí thông minh nhân tạo thực sự, các nhà khoa học đã viết trong một bài báo phát hành trên arXiv mô tả về Meena.

Meena về cơ bản được đào tạo để bắt chước cách con người nói chuyện với nhau, trò chuyện nhàn rỗi về phim ảnh, kế hoạch cuối tuần, du lịch, chơi nhạc cụ, triết học, toán học, thở dưới nước và mọi thứ thực tế trong cuộc sống.

Hàng trăm gigabyte các cuộc hội thoại công khai trên phương tiện truyền thông xã hội đã được thu thập vào các cây thông điệp, trong đó tin nhắn đầu tiên được coi là gốc và tất cả các câu trả lời tương ứng là các nút con hoặc lá. Sắp xếp dữ liệu theo cách này giúp dễ dàng chuyển đổi các cuộc thảo luận thành các chuỗi văn bản mà phần mềm có thể học hỏi. Nó phải tìm ra những gì liên kết trả lời các tin nhắn trước đó để khi nói chuyện với một người thực sự, nó có thể nhận ra bối cảnh và đưa ra các câu trả lời có liên quan, và tạo ấn tượng cho những gì được thảo luận.

Xây dựng một cỗ máy mạch lạc là khó khăn và hầu hết các chatbot tiết lộ giới hạn của chúng khi chúng nhanh chóng rơi vào tình trạng bập bẹ: câu trả lời mở đầu của chúng có thể giống như con người, nhưng những câu tiếp theo sẽ không có ý nghĩa hoặc hoàn toàn không chính xác. Do đó, con người tương tác với các hệ thống này phải làm như vậy một cách cứng nhắc, xây dựng các câu hỏi cẩn thận để tối đa hóa khả năng máy tính sẽ hiểu lời nhắc và trả lời một cách mạch lạc.

Meena không được thiết kế để trả lời các câu hỏi hoặc hoạt động như một trợ lý kỹ thuật số. Thay vào đó, nó được xây dựng để có những chiếc cằm đầy thuyết phục với những người xử lý như con người. Các nhân viên của Google đã kiểm tra chatbot của họ trên một nhóm công nhân, mặc dù bài báo không ghi rõ có bao nhiêu người được thử nghiệm. Mỗi công nhân được hướng dẫn để có những cuộc trò chuyện ngắn với Meena và chấm điểm bằng cách trả lời hợp lý và cụ thể.

Các biện pháp nhạy cảm, bao nhiêu chatbot có ý nghĩa và mức độ cụ thể làm thế nào nó hiểu được bối cảnh chung của cuộc trò chuyện. Ví dụ, đưa ra lời nhắc nhở "Tôi yêu quần vợt", một câu trả lời như rằng, đó là một câu hỏi hay, nhưng câu trả lời rất hay về tính đặc biệt so với một người như "tôi cũng vậy", "tôi có thể nhận được đủ điểm của Roger Federer!"… Điều thứ hai là một minh chứng rằng một chatbot có thể nắm bắt được rằng có một mối liên hệ giữa quần vợt và tay vợt tennis Roger Federer.

Các nhân viên của Google đã nghĩ ra điểm SSA, viết tắt của độ nhạy và độ đặc hiệu trung bình, để đánh giá hiệu suất của Meena. SSA tốt nhất của nó là 79%; con người trung bình được coi là có SSA cỡ 86%, hoặc chúng ta đã nói như vậy. Cảm giác như Google đã phát minh ra một hệ thống tính điểm và sau đó tuyên bố nó là hệ thống tốt nhất trong hệ thống này.

Meena đã chơi tốt hơn, bất ngờ, ngạc nhiên, hơn các chatbot khác: DialoGPT của Microsoft (48% SSA) và Xiaoice (31%), cộng với Cleverbot (56%) và Mitsuku (56%) - người chiến thắng 5 lần giải thưởng Leobner, một cuộc thi tương tự như Thử nghiệm Turing. Cần lưu ý rằng nhóm Google Meena không được so sánh với bất kỳ phiên bản giành giải thưởng nào của Mitsuku.

Một nhóm chatbot giống như con người, về độ nhạy và độ đặc hiệu, có thể ở trong tầm nhìn nếu chúng ta có thể đạt được sự lúng túng tốt hơn, nhóm nghiên cứu cho biết. Sự lúng túng mô tả chính xác làm thế nào nó có thể dự đoán những gì người khác sẽ nói tiếp theo trong một cuộc trò chuyện.

Meena vẫn bị các vấn đề chatbot phổ biến: nó lặp lại bản thân nó giống như một bản ghi bị phá vỡ, hoặc đôi khi nó trở nên vô nghĩa, hoặc chỉ là hết sức đáng sợ. Ở đây, có một cái nhìn cho chính mình. Tại một số thời điểm, một trò đùa kỳ lạ rơi vào sự điên rồ nhẹ.

Các ứng dụng thực tế của chatbot giống như con người vẫn còn nhiều nghi vấn. Dù sao đi nữa, điểm quan trọng của việc có những cuộc trò chuyện tự động vô tận, trống rỗng với một cỗ máy là gì? Bạn chỉ có thể đi chơi ở máy làm mát nước văn phòng hoặc bình cà phê cho điều đó. Tuy nhiên, Google tin rằng nó có thể, trong một số hình thức trong tương lai, giúp mọi người học các ngôn ngữ mới, thông qua hội thoại hoặc giúp các nhà phát triển tạo hộp thoại tạo phần mềm tốt hơn trong các trò chơi video.

Bên cạnh đó là một vấn đề nghiên cứu hấp dẫn, một tác nhân đàm thoại như vậy có thể dẫn đến nhiều ứng dụng thú vị, như nhân bản hóa hơn nữa các tương tác máy tính, cải thiện thực hành ngoại ngữ, tạo ra các nhân vật phim và trò chơi điện tử tương tác, có thể nói.

Google hiện đang giữ việc phát hành mã công khai trong khi nó đánh giá sự an toàn và sai số trong mô hình.

Bảo Ngọc

Vì sao Đình làng Hữu Bằng 400 năm tuổi bị “biến dạng” thẩm mỹ?

Đình làng Hữu Bằng (xã Tây Phương, Hà Nội) gần 400 năm tuổi, chứa đựng nhiều giá trị văn hoá lịch sử, vậy nhưng sau trùng tu đình làng, người dân Hữu Bằng lại bức xúc, phải gửi đơn kiến nghị khắp nơi.

Phải truy xuất được nguồn gốc của miếng thịt là yêu cầu cấp bách

Vụ việc 300 tấn thịt lợn nhiễm dịch tả lợn châu Phi được tuồn ra thị trường, thậm chí vào các trường học đã gây bức xúc trong dư luận. Sự việc xảy ra cho thấy, đã có sự buông lỏng quản lý, “đứt gãy” trong cơ chế giám sát theo chuỗi, từ khâu kiểm dịch, kiểm soát giết mổ và giám sát lưu thông.

Những lát cắt thú vị từ sứ mệnh Artemis II của NASA

Hôm 2/4 (giờ địa phương), sứ mệnh Artemis II chính thức rời bệ phóng tại Trung tâm Vũ trụ Kennedy (Mỹ), đánh dấu lần đầu tiên sau hơn 50 năm con người quay trở lại quỹ đạo Mặt trăng. Với sự tham gia của đội ngũ phi hành gia đặc biệt và hệ thống công nghệ trị giá hàng chục tỷ USD, chuyến bay không chỉ kiểm tra giới hạn vận hành của tàu Orion mà còn mang theo những thông điệp ấn tượng, từ hợp tác quốc tế đến câu chuyện truyền cảm hứng của một cậu bé 8 tuổi.

Ăn phải thịt lợn nhiễm bệnh ảnh hưởng thế nào tới sức khỏe?

Theo chuyên gia, thịt lợn bệnh, lợn chết nếu ăn phải sẽ tiềm ẩn nguy cơ nhiễm vi khuẩn và độc tố gây ngộ độc, có thể biến chứng nguy hiểm dù đã nấu chín.

Mức bồi thường tăng cao, việc thu hồi đất cho các dự án vẫn ì ạch

Một trong những nguyên nhân khiến hàng loạt dự án đầu tư công trên địa bàn TP Hồ Chí Minh chậm tiến độ, đội vốn đầu tư thời gian qua đã được chỉ rõ là do chậm trễ trong việc bồi thường, giải tỏa, thu hồi đất. Dù mức bồi thường theo Luật Đất đai năm 2024 đã tăng lên khá cao, đến ngày 30/3 vừa qua các cơ quan, đơn vị có trách nhiệm vẫn chưa thể giải ngân hết số tiền chi bồi thường, thu hồi đất của năm 2025….

“Nở rộ” các ngành học mới: Chọn sao cho đúng?

Mùa tuyển sinh đại học năm 2026 chứng kiến sự xuất hiện của hàng loạt ngành học mới tại nhiều cơ sở giáo dục đại học, đặc biệt là các nhóm ngành liên quan đến công nghệ, trí tuệ nhân tạo và chuyển đổi số. Thực tế này khiến thí sinh rất băn khoăn khi chọn ngành, chọn trường.

Không để “cái bẫy làm đẹp” đe dọa sức khỏe người dân

Trước thực trạng mỹ phẩm giả, kém chất lượng đang len lỏi vào thị trường với nhiều thủ đoạn tinh vi, TP Hồ Chí Minh đã và đang mở cao điểm đấu tranh, quyết tâm “tuyên chiến” mạnh mẽ với loại tội phạm này. Không chỉ là vấn đề gian lận thương mại, mỹ phẩm giả còn trực tiếp đe dọa sức khỏe cộng đồng, đòi hỏi sự vào cuộc quyết liệt của cả hệ thống chính trị và người tiêu dùng.

Nam thanh niên thoát chết sau khi nhảy lầu từ tầng 7

Trong lúc nhảy lầu từ tầng 7 xuống đất, nam thanh niên va chạm dây cáp viễn thông, dây tải điện nên bật lên rồi mới rơi xuống trúng ô tô du lịch đang đậu trước khi chạm đất. Điều đáng nói là nam thanh niên này đã thoát chết sau ca cấp cứu tại bệnh viện.

Khởi tố tài xế Vũ Quang Chiến gây tai nạn liên hoàn 5 phương tiện chờ đèn đỏ tại Hà Nội

Ngày 4/4, Công an phường Yên Hòa, Hà Nội cho biết đã khởi tố đối với Vũ Quang Chiến (39 tuổi, trú Hà Nội) để điều tra tội Vi phạm quy định về tham gia giao thông đường bộ. Nam tài xế này đã gây ra vụ tai nạn liên hoàn xảy ra tối 25/3 tại ngã tư Trung Kính - Mạc Thái Tổ.

Cơn sốt “muội hồng”: Thú chơi tiềm ẩn những hệ lụy pháp lý

Thời gian gần đây, tại nhiều địa phương trên địa bàn tỉnh Thanh Hóa và một số tỉnh lân cận, “cơn sốt” săn lùng cây muội hồng bất ngờ bùng phát, thu hút sự quan tâm của không ít người chơi cây cảnh. Từ những hội nhóm trên mạng xã hội đến các cuộc trao đổi, mua bán ngoài đời thực, cây muội hồng được thổi giá lên cao hàng chục triệu, trở thành đối tượng săn tìm ráo riết. Tuy nhiên, phía sau thú chơi tưởng chừng vô hại này lại tiềm ẩn nhiều hệ lụy và những nguy cơ vi phạm pháp luật hiện hữu.

Tổ chức cứu nạn phi công Mỹ mất tích trong chiến sự được thực hiện ra sao?

Khi một tiêm kích bị bắn hạ hoặc gặp nạn trên chiến trường, việc tìm kiếm phi công không đơn thuần là cứu hộ mà là một chiến dịch quân sự phức hợp. Với Mỹ, đây là nhiệm vụ ưu tiên cao, được triển khai theo mô hình tìm kiếm – cứu nạn trong tác chiến (CSAR), kết hợp công nghệ hiện đại, lực lượng đặc nhiệm và phản ứng gần như tức thì.

Hơn 200 hộ dân sống thấp thỏm dưới chân núi Chư Yang Hanh

Hơn 200 hộ dân sống dọc chân núi Chư Yang Hanh, xã Yang Mao, tỉnh Đắk Lắk đang thấp thỏm khi mùa mưa ở Tây Nguyên đã cận kề. Người dân càng lo lắng hơn khi nơi đây đã từng xuất hiện sạt trượt núi trong cơn bão số 13 năm ngoái, trong đó có nhiều nhà bị vùi lấp, cuốn trôi hoàn toàn…

Đắk Lắk phát hiện 2 ổ dịch trong trường học, nhiều học sinh phải nghỉ học

Những ngày qua, trên địa bàn tỉnh Đắk Lắk đã xuất hiện 2 ổ dịch thuỷ đậu và quai bị tại trường học. Để đảm bảm dịch bệnh không lây lan rộng ra cộng đồng, nhiều học sinh buộc phải nghỉ học.

GDP quý I/2026 ước tăng 7,83%

Sáng 4/4, Cục Thống kê, Bộ Tài chính công bố tình hình kinh tế-xã hội quý I/2026. Kinh tế Việt Nam trong quý I khởi sắc, tăng 7,83% so với cùng kỳ năm trước.

Siết kiểm soát ô nhiễm không khí ở TP Hồ Chí Minh

Vấn đề ô nhiễm không khí đang trở thành thách thức lớn đối với TP Hồ Chí Minh khi mật độ giao thông cao, hoạt động công nghiệp ngày càng gia tăng... Trước yêu cầu cấp bách đó, UBND TP Hồ Chí Minh đã ban hành kế hoạch hành động về kiểm soát ô nhiễm và quản lý chất lượng môi trường không khí giai đoạn 2026-2030, tầm nhìn đến năm 2045.

Hà Nội chưa có chủ trương miễn phí xe buýt toàn dân

Ngày 4/4, Sở Xây dựng Hà Nội đã thông tin về chính sách vé vận tải hành khách công cộng trên địa bàn thành phố.