Video: Yann LeCun: Deep Learning, ConvNets, and Self-Supervised Learning | Lex Fridman Podcast #36 (Tháng mười một 2024)
Tại hội thảo về AI và Tương lai của công việc hồi đầu tháng này, Yann LeCun, Giám đốc nghiên cứu AI tại Facebook và Giám đốc sáng lập của Trung tâm khoa học dữ liệu NYU, đã nói về "sức mạnh và giới hạn của việc học sâu". LeCun, người tiên phong trong mạng lưới thần kinh tích chập, là trung tâm của nhiều tiến bộ gần đây trong AI, đã rất nhiệt tình với tiến bộ mà lĩnh vực này đã đạt được trong những năm gần đây và thực tế về những hệ thống như vậy có thể và không thể làm được.
LeCun cho biết, đã có nhiều làn sóng AI, và lưu ý rằng trong khi làn sóng hiện tại tập trung vào việc học sâu, thì điều sẽ đến là "nhận thức", với các ví dụ lớn nhất là các ứng dụng như hình ảnh y tế và xe tự lái. Gần như tất cả các ứng dụng này sử dụng việc học có giám sát và hầu hết sử dụng các mạng thần kinh tích chập, được LeCun mô tả lần đầu tiên vào năm 1989 và lần đầu tiên được triển khai trong nhận dạng ký tự trong ATM vào năm 1995. LeCun cho biết bằng sáng chế trên các mạng như vậy đã hết hạn vào năm 2007.
Đó là các tập dữ liệu lớn với kích thước mẫu lớn cũng như sức mạnh tính toán tăng mạnh (được hỗ trợ bởi công việc của Geoffrey Hinton trong việc tìm ra cách sử dụng GPU để nhận dạng hình ảnh) dẫn đến thay đổi nhiều nhất trong những năm gần đây. Ngay cả đối với LeCun, những tiến bộ trong nhận dạng hình ảnh vẫn "không có gì đáng kinh ngạc". Mặc dù nhận thức "thực sự hoạt động", những gì vẫn còn thiếu là lý do.
LeCun đã nói về ba cách tiếp cận khác nhau và những hạn chế của từng phương pháp. Học tăng cường đòi hỏi một số lượng lớn các mẫu. Thật tuyệt vời cho các trò chơi, vì hệ thống có thể chạy hàng triệu thử nghiệm và ngày càng tốt hơn, nhưng thật khó để sử dụng trong thế giới thực, ví dụ như bạn không muốn lái xe ra khỏi một vách đá 50 triệu lần, và thời gian thực là một yếu tố trong thế giới thực.
Học tập có giám sát, đó là hầu hết những gì chúng ta thấy bây giờ, đòi hỏi một lượng phản hồi trung bình và đang hoạt động tốt. Tuy nhiên, học máy có giám sát có một số vấn đề. LeCun cho biết các hệ thống như vậy phản ánh sự thiên vị trong dữ liệu, mặc dù ông nói rằng ông lạc quan rằng vấn đề này có thể được khắc phục và tin rằng sẽ dễ dàng hơn để loại bỏ sự thiên vị khỏi máy so với mọi người. Nhưng thật khó để xác minh các hệ thống như vậy về độ tin cậy và khó giải thích các quyết định được đưa ra dựa trên kết quả đầu ra từ các hệ thống đó và LeCun đã nói về các ứng dụng cho vay như một ví dụ về điều này.
Học tập không giám sát hoặc dự đoán, hiện đang được nghiên cứu cho những thứ như dự đoán các khung hình trong tương lai trong video, đòi hỏi rất nhiều phản hồi. Học tập không giám sát bao gồm dự đoán quá khứ, hiện tại hoặc tương lai từ bất kỳ thông tin nào có sẵn, hay nói cách khác, khả năng điền vào chỗ trống, mà LeCun nói là hiệu quả mà chúng ta gọi là lẽ thường. Ông lưu ý rằng các em bé có thể làm điều này, nhưng việc khiến máy móc làm được điều đó rất khó khăn và nói về cách các nhà nghiên cứu đang làm việc trên các kỹ thuật như mạng lưới đối thủ thế hệ (GAN) để dự đoán trong điều kiện không chắc chắn. Chúng tôi còn lâu mới có một giải pháp hoàn chỉnh, ông nói.
LeCun đã nói về ba loại học tập giống như các bộ phận của bánh: học tăng cường là anh đào trên đỉnh, học có giám sát, và học dự đoán là phần chính của bánh.
LeCun dự đoán AI sẽ thay đổi cách mọi thứ được định giá, với hàng hóa được chế tạo bởi robot có chi phí thấp hơn và trải nghiệm xác thực của con người có giá cao hơn, và điều này có thể có nghĩa là "một tương lai tươi sáng cho các nhạc sĩ và nghệ nhân jazz".
Nhìn chung, LeCun cho biết AI là Công nghệ Mục đích Chung (GPT) như động cơ hơi nước, điện hoặc máy tính. Như vậy, nó sẽ ảnh hưởng đến nhiều lĩnh vực của nền kinh tế, nhưng phải mất 10 hoặc 20 năm trước khi chúng ta thấy ảnh hưởng đến năng suất. LeCun cho biết AI sẽ dẫn đến thay thế công việc, nhưng lưu ý rằng việc triển khai công nghệ bị hạn chế bởi cách các công nhân có thể đào tạo nhanh cho nó.
Đối với một "cuộc cách mạng AI thực sự", LeCun nói rằng điều này sẽ không xảy ra cho đến khi máy móc có được ý thức chung và việc xác định các nguyên tắc để xây dựng điều này có thể mất hai, năm, hai mươi hoặc nhiều năm nữa; ngoài ra, sau đó sẽ mất nhiều năm để phát triển công nghệ AI thực tế dựa trên những nguyên tắc đó. Rốt cuộc, ông lưu ý, phải mất hai mươi năm để lưới chập trở nên quan trọng. Và đó là tất cả dựa trên giả định rằng các nguyên tắc là đơn giản; nó trở nên phức tạp hơn nhiều nếu "trí thông minh là một loại bùn".