Baidu đánh bại Microsoft và Google trong việc dạy AI hiểu ngôn ngữ của con người

Trí tuệ nhân tạo AI là gì?

rí tuệ nhân tạo hay trí thông minh nhân tạo (Artificial intelligence  – viết tắt là AI) là một ngành thuộc lĩnh vực khoa học máy tính (Computer science). Là trí tuệ do con người lập trình tạo nên với mục tiêu giúp máy tính có thể tự động hóa các hành vi thông minh như con người.

Trí tuệ nhân tạo khác với việc lập trình logic trong các ngôn ngữ lập trình là ở việc ứng dụng các hệ thống học máy (machine learning) để mô phỏng trí tuệ của con người trong các xử lý mà con người làm tốt hơn máy tính.

Cụ thể, trí tuệ nhân tạo giúp máy tính có được những trí tuệ của con người như: biết suy nghĩ và lập luận để giải quyết vấn đề, biết giao tiếp do hiểu ngôn ngữ, tiếng nói, biết học và tự thích nghi,…

Tuy rằng trí thông minh nhân tạo có nghĩa rộng như là trí thông minh trong các tác phẩm khoa học viễn tưởng, nó là một trong những ngành trọng yếu của tin học. Trí thông minh nhân tạo liên quan đến cách cư xử, sự học hỏi và khả năng thích ứng thông minh của máy móc.

Có bao nhiêu loại AI?

Công nghệ AI được chia làm 4 loại chính:

Loại 1: Công nghệ AI phản ứng.

Công nghệ AI phản ứng có khả năng phân tích những động thái khả thi nhất của chính mình và của đối thủ, từ đó, đưa ra được giải pháp tối ưu nhất. 

Một ví dụ điển hình của công nghệ AI phản ứng là Deep Blue. Đây là một chương trình chơi cờ vua tự động, được tạo ra bởi IBM, với khả năng xác định các nước cờ đồng thời dự đoán những bước đi tiếp theo của đối thủ. Thông qua đó, Deep Blue đưa ra những nước đi thích hợp nhất. 

Loại 2: Công nghệ AI với bộ nhớ hạn chế

Đặc điểm của công nghệ AI với bộ nhớ hạn chế là khả năng sử dụng những kinh nghiệm trong quá khứ để đưa ra những quyết định trong tương lai. Công nghệ AI này thường kết hợp với cảm biến môi trường xung quanh nhằm mục đích dự đoán những trường hợp có thể xảy ra và đưa ra quyết định tốt nhất cho thiết bị.

Ví dụ như đối với xe không người lái, nhiều cảm biến được trang bị xung quanh xe và ở đầu xe để tính toán khoảng cách với các xe phía trước, công nghệ AI sẽ dự đoán khả năng xảy ra va chạm, từ đó điều chỉnh tốc độ xe phù hợp để giữ an toàn cho xe.

Loại 3: Lý thuyết trí tuệ nhân tạo

Công nghệ AI này có thể học hỏi cũng như tự suy nghĩ, sau đó áp dụng những gì học được để thực hiện một việc cụ thể. Hiện nay, công nghệ AI này vẫn chưa trở thành một phương án khả thi.

Loại 4: Tự nhận thức

Công nghệ AI này có khả năng tự nhận thức về bản thân, có ý thức và hành xử như con người. Thậm chí, chúng còn có thể bộc lộ cảm xúc cũng như hiểu được những cảm xúc của con người. Đây được xem là bước phát triển cao nhất của công nghệ AI và đến thời điểm hiện tại, công nghệ này vẫn chưa khả thi.

Baidu đánh bại Microsoft và Google trong việc dạy AI hiểu ngôn ngữ của con người

Cho đến thời điểm gần đây, mô hình MT-DNN-SMART của Microsoft vẫn là cái tên dẫn đầu bảng xếp hạng GLUE toàn cầu, xếp ngay sau là mô hình T3 của Google. Tuy nhiên bảng xếp hạng này vừa có sự xáo trộn lớn bởi trong cuộc thi xử lý ngôn ngữ tự nhiên mới diễn ra gần đây, mô hình ERNIE (Enhanced Representation through kNowledge IntEgration) của Baidu đã đánh bại cả MT-DNN-SMART và T3 với số điểm kỷ lục 90.1.

Ban đầu, mô hình của Baidu được phát triển để hiểu ngôn ngữ Trung Quốc, tuy nhiên các nhà nghiên cứu cũng đã sớm nhận thấy triển vọng hiểu tiếng Anh cực tốt của mô hình này. Cách thức đào tạo ERNIE được Baidu lấy cảm hứng khá nhiều từ một công cụ đào tạo mô hình xử lý ngôn ngữ “lâu đời” của Google có tên BERT. Theo đó, 15% từ trong mỗi chuỗi câu sẽ được ẩn đi ở mỗi lần đào đạo, nhiệm vụ của AI cố gắng dự đoán các từ bị ẩn càng sát nghĩa càng tốt dựa trên ngữ cảnh. Nhóm nghiên cứu Baidu đã minh họa kỹ thuật này trên chuyên trang Github của họ với các ví dụ được trích dẫn từ bộ tiểu thuyết Harry Potter. Kết quả là ERNIE đã có thể ngoại suy mối quan hệ giữa Harry Potter và J. K. Rowling bằng cách phân tích kiến thức ngầm về từ ngữ và thực thể, để kết luận rằng Harry Potter là bộ tiểu thuyết được viết bởi J. K. Rowling.

Ban đầu, mô hình của Baidu được phát triển để hiểu ngôn ngữ Trung Quốc, tuy nhiên các nhà nghiên cứu cũng đã sớm nhận thấy triển vọng hiểu tiếng Anh cực tốt của mô hình này. Cách thức đào tạo ERNIE được Baidu lấy cảm hứng khá nhiều từ một công cụ đào tạo mô hình xử lý ngôn ngữ “lâu đời” của Google có tên BERT. Theo đó, 15% từ trong mỗi chuỗi câu sẽ được ẩn đi ở mỗi lần đào đạo, nhiệm vụ của AI cố gắng dự đoán các từ bị ẩn càng sát nghĩa càng tốt dựa trên ngữ cảnh. Nhóm nghiên cứu Baidu đã minh họa kỹ thuật này trên chuyên trang Github của họ với các ví dụ được trích dẫn từ bộ tiểu thuyết Harry Potter. Kết quả là ERNIE đã có thể ngoại suy mối quan hệ giữa Harry Potter và J. K. Rowling bằng cách phân tích kiến thức ngầm về từ ngữ và thực thể, để kết luận rằng Harry Potter là bộ tiểu thuyết được viết bởi J. K. Rowling.

“Mặc dù việc hiểu ngôn ngữ vẫn là một thách thức khó khăn, nhưng kết quả của chúng tôi đối với dự án ERNIE đã chỉ ra rằng các mô hình xử lý ngôn ngữ được đào tạo liên tục và đa tác vụ là một hướng đi đầy hứa hẹn cho nghiên cứu NLP”, nhóm nghiên cứu Baidu nhận định.

Hiện Baidu đang đẩy mạnh ứng dụng mô hình ERNIE cho các nhiệm vụ thực tế. Ví dụ: Hiện tại, Baidu đang sử dụng mô hình ERNIE cho tính năng trả lời câu hỏi tự động trong công cụ tìm kiếm của mình, giúp cải thiện 16% mức độ hài lòng của người dùng đối với kết quả tìm kiếm.

Nguồn bài viết: Sưu tầm