Trang Chủ Tin tức & Phân tích Học máy là gì?

Học máy là gì?

2024

Mục lục:

Sự khác biệt giữa trí tuệ nhân tạo và học máy là gì?
Học tập có giám sát và không giám sát
Học tăng cường
Học kĩ càng
Giới hạn của học máy

Video: 26 tuá»i, tÃ´i tháº¥y mÃ¬nh 'cá» Äáº¥m Än xÃ´i' vá»i nghá» khÃ´ng há»£p (Tháng Chín 2024)

Vào tháng 12 năm 2017, DeepMind, phòng thí nghiệm nghiên cứu được Google mua lại vào năm 2014, đã giới thiệu AlphaZero, một chương trình trí tuệ nhân tạo có thể đánh bại các nhà vô địch thế giới tại một số trò chơi trên bàn cờ.

Thật thú vị, AlphaZero không nhận được hướng dẫn nào từ con người về cách chơi các trò chơi (do đó có tên). Thay vào đó, nó đã sử dụng học máy, một nhánh của AI phát triển hành vi của mình thông qua trải nghiệm thay vì các lệnh rõ ràng.

Trong vòng 24 giờ, AlphaZero đã đạt được thành tích siêu phàm trong cờ vua và đánh bại chương trình cờ vua vô địch thế giới trước đó. Không lâu sau, thuật toán học máy của AlphaZero cũng thành thạo Shogi (cờ vua Nhật Bản) và trò chơi cờ vây Trung Quốc, và nó đã đánh bại người tiền nhiệm của nó, AlphaGo, 100 đến 0.

Học máy đã trở nên phổ biến trong những năm gần đây và đang giúp máy tính giải quyết các vấn đề trước đây được cho là lĩnh vực độc quyền của trí tuệ con người. Và mặc dù nó vẫn còn cách xa tầm nhìn ban đầu của trí tuệ nhân tạo, học máy đã đưa chúng ta đến gần hơn với mục tiêu cuối cùng là tạo ra những cỗ máy tư duy.

Sự khác biệt giữa trí tuệ nhân tạo và học máy là gì?

Các cách tiếp cận truyền thống để phát triển trí thông minh nhân tạo liên quan đến việc mã hóa tỉ mỉ tất cả các quy tắc và kiến thức xác định hành vi của một tác nhân AI. Khi tạo AI dựa trên quy tắc, các nhà phát triển phải viết các hướng dẫn chỉ định cách AI sẽ hành xử để ứng phó với mọi tình huống có thể. Cách tiếp cận dựa trên quy tắc này, còn được gọi là AI lỗi thời (GOFAI) hay AI tượng trưng, cố gắng bắt chước các chức năng biểu diễn tri thức và lý luận của tâm trí con người.

Một ví dụ hoàn hảo về AI tượng trưng là Stockfish, một công cụ cờ vua mã nguồn mở hàng đầu trong hơn 10 năm ra đời. Hàng trăm lập trình viên và người chơi cờ đã đóng góp cho Stockfish và giúp phát triển logic của nó bằng cách mã hóa các quy tắc của nó, ví dụ, AI nên làm gì khi đối thủ chuyển hiệp sĩ của mình từ B1 sang C3.

Nhưng AI dựa trên quy tắc thường bị phá vỡ khi xử lý các tình huống trong đó các quy tắc quá phức tạp và tiềm ẩn. Ví dụ, nhận dạng giọng nói và các đối tượng trong hình ảnh là các hoạt động nâng cao không thể diễn tả bằng các quy tắc logic.

Trái ngược với AI tượng trưng, các mô hình AI học máy được phát triển không phải bằng cách viết các quy tắc mà bằng cách thu thập các ví dụ. Chẳng hạn, để tạo ra một cỗ máy học cờ dựa trên nền tảng máy học, nhà phát triển tạo ra một thuật toán cơ bản và sau đó "huấn luyện" nó với dữ liệu từ hàng ngàn trò chơi cờ đã chơi trước đó. Bằng cách phân tích dữ liệu, AI tìm thấy các mô hình phổ biến xác định chiến lược chiến thắng, nó có thể sử dụng để đánh bại các đối thủ thực sự.

Càng nhiều trò chơi đánh giá AI, nó càng trở nên tốt hơn trong việc dự đoán các động thái chiến thắng trong khi chơi. Đây là lý do tại sao máy học được định nghĩa là một chương trình có hiệu suất cải thiện theo kinh nghiệm.

Học máy có thể áp dụng cho nhiều nhiệm vụ trong thế giới thực, bao gồm phân loại hình ảnh, nhận dạng giọng nói, khuyến nghị nội dung, phát hiện gian lận và xử lý ngôn ngữ tự nhiên.

Học tập có giám sát và không giám sát

Tùy thuộc vào vấn đề họ muốn giải quyết, các nhà phát triển chuẩn bị dữ liệu liên quan để xây dựng mô hình học máy của họ. Chẳng hạn, nếu họ muốn sử dụng học máy để phát hiện các giao dịch ngân hàng gian lận, các nhà phát triển sẽ tổng hợp danh sách các giao dịch hiện có và gắn nhãn cho kết quả của họ (lừa đảo hoặc hợp lệ). Khi họ cung cấp dữ liệu cho thuật toán, nó phân tách các giao dịch gian lận và hợp lệ và tìm thấy các đặc điểm chung trong mỗi hai lớp. Quá trình đào tạo các mô hình với dữ liệu chú thích được gọi là "học có giám sát" và hiện là hình thức chủ yếu của học máy.

Nhiều kho lưu trữ dữ liệu trực tuyến cho các nhiệm vụ khác nhau đã tồn tại. Một số ví dụ phổ biến là ImageNet, một bộ dữ liệu nguồn mở với hơn 14 triệu hình ảnh được gắn nhãn và MNIST, một bộ dữ liệu gồm 60.000 chữ số viết tay được dán nhãn. Các nhà phát triển học máy cũng sử dụng các nền tảng như Mechanical Turk của Amazon, một trung tâm tuyển dụng trực tuyến, theo yêu cầu để thực hiện các tác vụ nhận thức như ghi nhãn hình ảnh và mẫu âm thanh. Và một lĩnh vực khởi nghiệp đang phát triển chuyên về chú thích dữ liệu.

Nhưng không phải tất cả các vấn đề yêu cầu dữ liệu được dán nhãn. Một số vấn đề về máy học có thể được giải quyết thông qua "học tập không giám sát", trong đó bạn cung cấp mô hình AI với dữ liệu thô và để nó tự tìm ra mô hình nào có liên quan.

Một sử dụng phổ biến của học tập không giám sát là phát hiện bất thường. Ví dụ, thuật toán học máy có thể đào tạo dữ liệu lưu lượng truy cập mạng thô của thiết bị kết nối internet, nói, một tủ lạnh thông minh. Sau khi đào tạo, AI thiết lập đường cơ sở cho thiết bị và có thể gắn cờ hành vi ngoại lệ. Nếu thiết bị bị nhiễm phần mềm độc hại và bắt đầu giao tiếp với các máy chủ độc hại, mô hình học máy sẽ có thể phát hiện ra nó, bởi vì lưu lượng truy cập mạng khác với hành vi thông thường được quan sát thấy trong quá trình đào tạo.

Học tăng cường

Đến bây giờ, bạn có thể biết rằng dữ liệu đào tạo chất lượng đóng một vai trò rất lớn trong hiệu quả của các mô hình học máy. Nhưng học tăng cường là một loại học máy chuyên dụng, trong đó AI phát triển hành vi của nó mà không sử dụng dữ liệu trước đó.

Các mô hình học tăng cường bắt đầu với một bảng đá sạch. Họ chỉ được hướng dẫn về các quy tắc cơ bản của môi trường và nhiệm vụ trong tay. Thông qua thử nghiệm và sai sót, họ học cách tối ưu hóa hành động cho mục tiêu của mình.

AlphaZero của DeepMind là một ví dụ thú vị về học tập củng cố. Trái ngược với các mô hình học máy khác, vốn phải xem cách con người chơi cờ và học từ chúng, AlphaZero bắt đầu chỉ biết di chuyển của quân cờ và điều kiện chiến thắng của trò chơi. Sau đó, nó đã chơi hàng triệu trận đấu với chính nó, bắt đầu bằng những hành động ngẫu nhiên và dần dần phát triển các mô hình hành vi.

Học tăng cường là một lĩnh vực nghiên cứu nóng. Đây là công nghệ chính được sử dụng để phát triển các mô hình AI có thể làm chủ các trò chơi phức tạp như Dota 2 và StarCraft 2 và cũng được sử dụng để giải quyết các vấn đề thực tế như quản lý tài nguyên trung tâm dữ liệu và tạo ra các bàn tay robot có thể xử lý các đối tượng với sự khéo léo giống như con người .

Học kĩ càng

Học sâu là một tập hợp con phổ biến khác của học máy. Nó sử dụng các mạng lưới thần kinh nhân tạo, các cấu trúc phần mềm được lấy cảm hứng từ cấu trúc sinh học của bộ não con người.

Mạng lưới thần kinh vượt trội trong việc xử lý dữ liệu phi cấu trúc như hình ảnh, video, âm thanh và các đoạn trích dài của văn bản như bài báo và tài liệu nghiên cứu. Trước khi học sâu, các chuyên gia về máy học phải nỗ lực rất nhiều trong việc trích xuất các tính năng từ hình ảnh và video và sẽ chạy các thuật toán của họ lên trên đó. Mạng lưới thần kinh tự động phát hiện các tính năng đó mà không đòi hỏi nhiều nỗ lực từ các kỹ sư của con người.

Học sâu là đằng sau nhiều công nghệ AI hiện đại như xe không người lái, hệ thống dịch thuật tiên tiến và công nghệ nhận dạng khuôn mặt trong iPhone X của bạn.

Giới hạn của học máy

Mọi người thường nhầm lẫn giữa học máy với trí tuệ nhân tạo ở cấp độ con người và bộ phận tiếp thị của một số công ty cố tình sử dụng các thuật ngữ thay thế cho nhau. Nhưng trong khi học máy đã có những bước tiến lớn trong việc giải quyết các vấn đề phức tạp, thì vẫn còn rất xa so với việc tạo ra những cỗ máy tư duy được hình dung bởi những người tiên phong của AI.

Ngoài việc học hỏi kinh nghiệm, trí thông minh thực sự đòi hỏi lý luận, suy nghĩ thông thường và tư duy trừu tượng trong các lĩnh vực mà trong đó các mô hình học máy thực hiện rất kém.

Ví dụ, trong khi học máy tốt với các nhiệm vụ nhận dạng mẫu phức tạp như dự đoán ung thư vú trước năm năm, nó phải vật lộn với các nhiệm vụ logic và lý luận đơn giản hơn như giải các bài toán cấp ba.

Học máy thiếu năng lực lý luận làm cho nó không tốt trong việc khái quát hóa kiến thức của nó. Chẳng hạn, một tác nhân học máy có thể chơi Super Mario 3 như một người chuyên nghiệp sẽ không thống trị một trò chơi nền tảng khác, chẳng hạn như Mega Man, hoặc thậm chí là một phiên bản khác của Super Mario. Nó sẽ cần phải được đào tạo từ đầu.

Không có sức mạnh để rút ra kiến thức khái niệm từ kinh nghiệm, các mô hình học máy đòi hỏi hàng tấn dữ liệu đào tạo để thực hiện. Thật không may, nhiều tên miền thiếu dữ liệu đào tạo đầy đủ hoặc không có tiền để có được nhiều hơn. Học sâu, hiện là hình thức phổ biến của máy học, cũng gặp phải một vấn đề có thể giải thích: Mạng lưới thần kinh hoạt động theo những cách phức tạp và thậm chí người sáng tạo của họ phải vật lộn để tuân theo các quy trình ra quyết định của họ. Điều này gây khó khăn cho việc sử dụng sức mạnh của các mạng thần kinh trong các cài đặt nơi có yêu cầu pháp lý để giải thích các quyết định AI.

May mắn thay, những nỗ lực đang được thực hiện để vượt qua giới hạn của máy học. Một ví dụ đáng chú ý là một sáng kiến rộng rãi của DARPA, bộ phận nghiên cứu của Bộ Quốc phòng, để tạo ra các mô hình AI có thể giải thích được.

Trí tuệ nhân tạo (AI) là gì? Trí tuệ nhân tạo (AI) là gì?
Hầu hết các đô la AI đi đến học máy Hầu hết các đô la AI đi đến học máy
Bạn muốn thấy AI được sử dụng như thế nào? Bạn muốn thấy AI được sử dụng như thế nào?

Các dự án khác nhằm giảm sự phụ thuộc quá mức của máy học vào dữ liệu chú thích và làm cho công nghệ có thể truy cập được vào các miền có dữ liệu đào tạo hạn chế. Các nhà nghiên cứu tại IBM và MIT gần đây đã xâm nhập vào lĩnh vực này bằng cách kết hợp AI biểu tượng với các mạng lưới thần kinh. Các mô hình lai AI yêu cầu ít dữ liệu hơn cho đào tạo và có thể cung cấp các giải thích từng bước về các quyết định của họ.

Liệu sự tiến hóa của học máy cuối cùng sẽ giúp chúng ta đạt được mục tiêu khó nắm bắt là tạo ra AI ở cấp độ con người hay không. Nhưng những gì chúng ta biết chắc chắn là nhờ những tiến bộ trong học máy, các thiết bị ngồi trên bàn và nghỉ ngơi trong túi của chúng ta ngày càng thông minh hơn.