Trang Chủ Ý kiến Học hỏi từ những sai lầm của alexa

Học hỏi từ những sai lầm của alexa

2024

Mục lục:

Quá nhiều sự phụ thuộc của đám mây
Bối cảnh và ý định
Những gì chúng ta cần làm
Trong luc đo…

Video: Cuộc Vui Cô Đơn - Lê Bảo Bình (MV OFFICIAL) #CVCD (Tháng Chín 2024)

Một thiết bị Amazon Echo gần đây đã ghi lại cuộc trò chuyện riêng tư của người dùng và gửi nó đến một trong những người liên hệ của họ mà không có kiến thức và sự đồng ý của họ. Điều này (một lần nữa) làm tăng mối lo ngại về bảo mật và quyền riêng tư của loa thông minh. Tuy nhiên, sau đó trở nên rõ ràng, hành vi kỳ quặc của Alexa không phải là một phần của âm mưu gián điệp nham hiểm, mà nguyên nhân là do một loạt các thất bại liên kết được quy cho cách hoạt động của loa thông minh.

Theo một tài khoản được cung cấp bởi Amazon: "Echo tỉnh dậy do một từ trong cuộc hội thoại nền nghe giống như 'Alexa'. Sau đó, cuộc trò chuyện tiếp theo được nghe như một yêu cầu 'gửi tin nhắn'. Vào thời điểm đó, Alexa nói to 'Gửi cho ai?' Tại thời điểm đó, cuộc trò chuyện nền được hiểu là một tên trong danh sách liên lạc của khách hàng. Alexa sau đó hỏi to, ', phải không?' Alexa sau đó giải thích cuộc trò chuyện nền là 'đúng.' Không chắc là chuỗi sự kiện này xảy ra, chúng tôi đang đánh giá các lựa chọn để làm cho trường hợp này thậm chí ít xảy ra hơn. "

Kịch bản là một trường hợp cạnh, loại sự cố xảy ra rất hiếm. Nhưng nó cũng là một nghiên cứu thú vị trong giới hạn của công nghệ trí tuệ nhân tạo cung cấp năng lượng cho Echo và các thiết bị được gọi là "thông minh" khác.

Quá nhiều sự phụ thuộc của đám mây

Để hiểu lệnh thoại, các loa thông minh như Echo và Google Home dựa vào các thuật toán học sâu, đòi hỏi sức mạnh tính toán rộng lớn. Vì họ không có tài nguyên điện toán để thực hiện tác vụ cục bộ, họ phải gửi dữ liệu đến các máy chủ đám mây của nhà sản xuất, nơi thuật toán AI chuyển đổi dữ liệu giọng nói thành văn bản và xử lý các lệnh.

Nhưng loa thông minh không thể gửi mọi thứ họ nghe được đến máy chủ đám mây của họ, vì điều đó sẽ yêu cầu nhà sản xuất lưu trữ lượng dữ liệu quá mức trên máy chủ của họ, hầu hết trong số đó sẽ vô dụng. Việc vô tình ghi lại và lưu trữ các cuộc trò chuyện riêng tư diễn ra trong nhà của người dùng cũng sẽ gây ra thách thức về quyền riêng tư và có thể khiến các nhà sản xuất gặp rắc rối, đặc biệt là các quy định bảo mật dữ liệu mới đặt ra các hạn chế nghiêm trọng đối với cách các công ty công nghệ lưu trữ và sử dụng dữ liệu.

Đó là lý do tại sao loa thông minh được thiết kế để được kích hoạt sau khi người dùng thốt ra một từ thức tỉnh như "Alexa" hoặc "Hey Google". Chỉ sau khi nghe từ đánh thức, họ mới bắt đầu gửi đầu vào âm thanh của micrô của mình lên đám mây để phân tích và xử lý.

Mặc dù tính năng này cải thiện sự riêng tư, nhưng nó đưa ra những thách thức riêng của nó, như sự cố Alexa gần đây nhấn mạnh.

Joshua March, CEO của Conversocial, cho biết: "Nếu từ hay một thứ gì đó nghe có vẻ rất giống với nó thì được gửi nửa chừng trong một cuộc trò chuyện, Alexa sẽ không có bất kỳ bối cảnh nào trước đó". "Vào thời điểm đó, rất khó nghe bất kỳ lệnh nào liên quan đến các kỹ năng bạn đã thiết lập (như ứng dụng nhắn tin của họ). Phần lớn, quyền riêng tư được tăng cường đáng kể bằng cách hạn chế bối cảnh mà Alexa đang chú ý (như nó không ghi âm hoặc nghe bất kỳ cuộc hội thoại bình thường nào của bạn), mặc dù điều đó phản tác dụng trong trường hợp này. "

Những tiến bộ trong điện toán cạnh có thể giúp giảm bớt vấn đề này. Khi AI và học sâu tìm đến ngày càng nhiều thiết bị và ứng dụng, một số nhà sản xuất phần cứng đã tạo ra các bộ xử lý chuyên dụng để thực hiện các tác vụ AI mà không phụ thuộc quá nhiều vào tài nguyên đám mây. Bộ xử lý Edge AI có thể giúp các thiết bị như Echo hiểu rõ hơn và xử lý các cuộc hội thoại mà không xâm phạm quyền riêng tư của người dùng bằng cách gửi tất cả dữ liệu lên đám mây.

Bối cảnh và ý định

Bên cạnh việc nhận được các đoạn âm thanh khác nhau và phân mảnh, AI của Amazon đấu tranh với việc tìm hiểu các sắc thái của cuộc trò chuyện của con người.

"Mặc dù đã có những tiến bộ lớn trong việc học sâu trong vài năm qua, cho phép phần mềm hiểu lời nói và hình ảnh tốt hơn bao giờ hết, nhưng vẫn còn rất nhiều giới hạn, " March nói. "Mặc dù trợ lý giọng nói có thể nhận ra những lời bạn đang nói, nhưng họ không nhất thiết phải có bất kỳ loại hiểu biết thực sự nào về ý nghĩa hoặc ý định đằng sau nó. Thế giới là một nơi phức tạp, nhưng bất kỳ một hệ thống AI nào ngày nay chỉ có thể xử lý rất trường hợp sử dụng cụ thể, hẹp. "

Chẳng hạn, con người chúng ta có nhiều cách để xác định xem một câu có hướng về phía chúng ta hay không, chẳng hạn như giọng nói, hoặc theo các dấu hiệu trực quan mà nói, hướng mà người nói đang nhìn.

Ngược lại, Alexa cho rằng đó là người nhận bất kỳ câu nào có chứa từ "A". Đây là lý do tại sao người dùng thường vô tình kích hoạt nó.

Một phần của vấn đề là chúng tôi phóng đại khả năng của các ứng dụng AI hiện tại, thường đặt chúng ngang tầm hoặc cao hơn tâm trí con người và đặt quá nhiều niềm tin vào chúng. Đó là lý do tại sao chúng tôi ngạc nhiên khi họ thất bại một cách ngoạn mục.

"Một phần của vấn đề ở đây là thuật ngữ 'AI' đã được quảng bá rầm rộ đến mức người tiêu dùng đã đặt niềm tin không đáng có vào các sản phẩm có thuật ngữ này gắn liền với chúng, " Pascal Kaufmann, nhà khoa học thần kinh và người sáng lập Starmind nói. "Câu chuyện này minh họa rằng Alexa có nhiều khả năng và hiểu biết tương đối hạn chế về cách thức và thời điểm chúng nên được áp dụng một cách thích hợp."

Các thuật toán học sâu dễ bị thất bại khi chúng phải đối mặt với các cài đặt lệch khỏi dữ liệu và các tình huống mà chúng được đào tạo. "Một trong những tính năng xác định của AI ở cấp độ con người sẽ là năng lực tự cung cấp và sự hiểu biết thực sự về nội dung", Kaufmann nói. "Đây là một phần quan trọng trong việc thực sự coi AI 'thông minh' và quan trọng đối với sự phát triển của nó. Tạo ra các trợ lý kỹ thuật số tự nhận thức, mang đến cho họ sự hiểu biết đầy đủ về bản chất con người, sẽ đánh dấu sự chuyển đổi của họ từ một sự mới lạ thú vị thành một sự mới lạ thực sự công cụ hữu ích."

Nhưng việc tạo ra AI ở cấp độ con người, còn được gọi là AI nói chung, nói dễ hơn làm. Trong nhiều thập kỷ, chúng tôi đã nghĩ rằng nó chỉ quanh quẩn, chỉ trở nên mất tinh thần vì những tiến bộ công nghệ đã cho thấy tâm trí con người phức tạp như thế nào. Nhiều chuyên gia tin rằng theo đuổi AI nói chung là vô ích.

Trong khi đó, AI hẹp (như các công nghệ trí tuệ nhân tạo hiện tại được mô tả) vẫn mang đến nhiều cơ hội và có thể được sửa chữa để tránh lặp lại sai lầm. Để rõ ràng, học sâu và học máy vẫn còn non trẻ và các công ty như Amazon liên tục cập nhật thuật toán AI của họ để giải quyết các trường hợp cạnh mỗi khi chúng xảy ra.

Những gì chúng ta cần làm

"Đây là một lĩnh vực mới, trẻ mới nổi. Sự hiểu biết ngôn ngữ tự nhiên đặc biệt ở giai đoạn sơ khai, vì vậy có rất nhiều thứ chúng ta có thể làm ở đây", Eric Moller, CTO của Atomic X.

Moller tin rằng các thuật toán AI phân tích giọng nói có thể được điều chỉnh để hiểu rõ hơn về ngữ điệu và sự uốn cong. "Sử dụng từ 'Alexa' trong một câu rộng hơn nghe có vẻ khác với một lời cầu khẩn hoặc mệnh lệnh. Alexa không nên thức dậy vì bạn đã nói tên đó khi đi qua, " Moller nói. Với đủ đào tạo, AI sẽ có thể phân biệt được các âm cụ thể nào được hướng vào loa thông minh.

Các công ty công nghệ cũng có thể đào tạo AI của họ để có thể phân biệt khi nào nó nhận được tiếng ồn nền thay vì được nói trực tiếp. "Trò chuyện nền có một 'chữ ký' thính giác duy nhất mà con người rất giỏi trong việc tiếp thu và điều chỉnh có chọn lọc. Không có lý do gì chúng ta không thể đào tạo các mô hình AI để làm điều tương tự, " Moller nói.

Để phòng ngừa, các trợ lý AI nên đánh giá tác động của các quyết định mà họ đưa ra và liên quan đến quyết định của con người trong trường hợp họ muốn làm điều gì đó có khả năng nhạy cảm. Các nhà sản xuất nên nướng thêm các biện pháp bảo vệ vào công nghệ của họ để ngăn chặn thông tin nhạy cảm được gửi đi mà không có sự đồng ý rõ ràng và rõ ràng của người dùng.

Sagi Eliyahi, CEO của Tonkean, cho biết: "Mặc dù Amazon đã báo cáo rằng Alexa đã cố gắng xác nhận hành động mà họ diễn giải, một số hành động cần được quản lý cẩn thận hơn và tuân theo tiêu chuẩn xác nhận cao hơn về ý định của người dùng". "Con người có cùng các vấn đề nhận dạng giọng nói, đôi khi nghe nhầm các yêu cầu. Tuy nhiên, không giống như Alexa, một người có khả năng xác nhận hoàn toàn rằng họ hiểu một yêu cầu không rõ ràng và quan trọng hơn là đánh giá khả năng của một yêu cầu so với các yêu cầu trước đây."

Trong luc đo…

Trong khi các công ty công nghệ hoàn thiện các ứng dụng AI của họ để giảm thiểu sai lầm, người dùng sẽ phải đưa ra quyết định cuối cùng về mức độ họ muốn tiếp xúc với các lỗi tiềm ẩn mà các thiết bị hỗ trợ AI của họ có thể mắc phải.

Doug Rose, chuyên gia khoa học dữ liệu và là người viết một số cuốn sách về AI và phần mềm cho biết: "Những câu chuyện này cho thấy mâu thuẫn với lượng dữ liệu mà mọi người sẵn sàng chia sẻ chống lại lời hứa về các công nghệ AI mới". "Bạn có thể trêu chọc Siri vì chậm chạp. Nhưng cách tốt nhất để cô ấy đạt được trí thông minh cao hơn là xâm chiếm các cuộc trò chuyện riêng tư của chúng tôi. Vì vậy, một câu hỏi quan trọng trong thập kỷ tới là chúng ta sẽ cho phép các tác nhân AI này nhìn trộm hành vi của chúng ta đến mức nào ? "

"Gia đình nào sẽ đặt một trợ lý con người trong phòng khách và để người đó lắng nghe bất kỳ cuộc trò chuyện nào mọi lúc?" Kaufmann, nhà khoa học thần kinh từ Starmind nói. "Ít nhất chúng ta nên áp dụng các tiêu chuẩn tương tự cho các thiết bị được gọi là 'AI' (nếu không cao hơn) mà chúng ta cũng áp dụng cho con người thông minh khi nói đến quyền riêng tư, bí mật hoặc độ tin cậy."