Video: Apple HomePod Review: The Dumbest Smart Speaker? (Tháng mười một 2024)
Xem bài phát biểu từ Hội nghị nhà phát triển toàn cầu của Apple trong tuần này và từ hội nghị I / O của Google hai tuần trước, điều nổi bật nhất với tôi là nỗ lực mà cả hai công ty, cũng như Microsoft, đã tạo ra để tạo ra các hệ thống thông minh biết càng nhiều càng tốt về bạn.
Các hệ thống như vậy biết bạn là ai, bạn ở đâu và tất cả thông tin trên màn hình của bạn, nói chung với mục tiêu hoạt động như một "trợ lý cá nhân" dự đoán nhu cầu của bạn. Đây là một mục tiêu cực kỳ tham vọng mà một trong những công ty này dường như hiểu được có thể là bước tiến lớn tiếp theo trong điện toán.
Trong trường hợp của Apple và Google, các dịch vụ khác được công bố tại các ghi chú của họ có thể được chú ý nhiều hơn hoặc có thể có tác động ngắn hạn rõ ràng hơn. Google Photos đã nhận được rất nhiều sự chú ý; cả Apple Pay và Android Pay dường như đang trên đà trở nên phổ biến hơn rất nhiều, và những cải tiến trong Android Wear và WatchOS có thể sẽ báo trước một loạt các ứng dụng cho thiết bị đeo. Nhưng việc chuyển sang các hệ thống tổng thể thông minh hơn, toàn diện hơn có thể có tác động lâu dài lớn nhất.
Apple, Google và Microsoft đều đang đến đây từ các góc độ khác nhau. Nhưng dường như chúng đang hội tụ trên các hệ thống có giao diện người dùng di động có thể được điều khiển bằng cách gõ hoặc giọng nói, được hỗ trợ bởi một bộ các dịch vụ và quy trình dựa trên Internet có chứa một lượng dữ liệu khổng lồ về bạn và suy luận dựa trên dữ liệu đó và về những gì bạn đang làm.
Con đường đến sự hội tụ này đã được lát bằng một số lời giới thiệu trong vài năm qua. Nhiều người đã làm việc với các trợ lý cá nhân trong nhiều năm và Siri ban đầu được phát triển như một ứng dụng độc lập bởi một spin-off từ SRI International. Vào năm 2011, Apple đã giới thiệu Siri như một "trợ lý ảo" với iPhone 4s, chủ yếu đóng vai trò là mặt trận cho những thứ như tìm kiếm trên web, thời tiết địa phương và nhà hàng tìm kiếm. Vào năm 2012, Google đã giới thiệu Google Now như một phần của Android 4.1 Jelly Bean, cung cấp thông tin về một loạt "thẻ" trả lời các câu hỏi. Theo thời gian, điều này phát triển để cung cấp thêm thông tin và bao gồm nhiều tên miền hơn.
Lúc đầu, tôi nghĩ cả hai đều thú vị, nhưng điều khiển giọng nói có vẻ giống như một "mánh lừa đảo" hơn là một ứng dụng hữu ích.
Nhưng trong vài năm qua, cả hai đã được cải thiện với tốc độ nhanh chóng. Một phần có nhiều người dùng đã cho cả hai công ty nhiều dữ liệu hơn để làm việc. Điều này, kết hợp với các thuật toán thông minh hơn và rất nhiều công việc xử lý máy chủ, dẫn đến các hệ thống giờ đây chính xác hơn rất nhiều để hiểu những gì bạn đang hỏi so với khi chúng khởi chạy. Cả hai bây giờ có thể trả lời các câu hỏi trong nhiều lĩnh vực. Và Google Hiện hành có thể suy ra thông tin như nơi nhà và văn phòng của bạn dựa trên các vị trí điển hình của bạn.
Microsoft đã giới thiệu Cortana vào năm ngoái như là một phần của phiên bản Windows Phone 8.1, mô tả đây là "trợ lý kỹ thuật số" thực sự cá nhân đầu tiên vì họ hiểu nhiều hơn những gì bạn đã làm trong các ứng dụng khác ngoài tìm kiếm trên Web. Nó có thể thực hiện những việc như đặt lời nhắc và hiểu ai là người quan trọng với bạn và ai không, và trong khi không có nhiều người dùng, điều đó dường như cũng được cải thiện trong vài năm qua. Cortana giờ đây cũng sẽ là một phần của Windows 10 trên máy tính để bàn và máy tính xách tay.
Điều này đưa chúng ta đến các thông báo gần đây hơn, nơi cả ba nhà cung cấp dường như đang mượn các tính năng từ những người khác và thực sự cố gắng cải thiện dịch vụ của họ.
Google Hiện hành trên Tap
Tại Google I / O vài tuần trước, Phó chủ tịch cấp cao của Google Sundar Pichai đã nói về cách công ty tiếp tục tập trung vào tìm kiếm. Nhưng khi nói đến các tính năng trong phiên bản Android mới nhất, điều khiến tôi chú ý là bộ tính năng mới dành cho trợ lý cá nhân Google Hiện hành có tên "Now on Tap".
Pichai đã nói về đầu tư của Google vào việc học sâu và học máy, nói rằng điều đó đã giúp Google giảm tỷ lệ lỗi từ trong nhận dạng giọng nói từ 23% xuống còn 8% trong năm qua.
Ví dụ, Google Hiện đã có một số tính năng theo ngữ cảnh, ví dụ, nó biết bạn đang ở đâu, vì vậy nó có thể ước tính thời gian bạn sẽ về nhà và nó có thể hiển thị thông tin này trên các "thẻ" khác nhau mà nó sử dụng để hiển thị thông tin hoặc trong thông báo .
Nhưng Aparna Chennapragada, Giám đốc Google Now, cho biết "Chúng tôi đã tự hỏi mình làm thế nào chúng tôi có thể giúp bạn trả lời nhanh cho các câu hỏi nhanh mà không rời khỏi bối cảnh. Làm thế nào chúng tôi có thể giúp bạn hoàn thành công việc trong vài bước nhất có thể?" Kết quả, cô nói, là một dịch vụ mới để hỗ trợ bạn "trong lúc này" bất kể bạn đang làm gì trên điện thoại. Đây là Now On Tap và cô cho biết nó kết hợp Sơ đồ tri thức của Google về sự hiểu biết của hơn 1 tỷ thực thể (như đội bóng chày và trạm xăng) với bối cảnh và kết nối với các ứng dụng khác để cung cấp cho bạn thông tin một cách chủ động.
Trong cuộc biểu tình mà cô thể hiện, cô nhận được một tin nhắn trong một ứng dụng gợi ý một nhà hàng cho bữa tối và yêu cầu cô đi lấy đồ giặt khô. Nhấn và giữ phím home sẽ hiển thị thẻ Google Hiện hành và tính năng Now on Tap đã thu thập thông tin cơ bản về nhà hàng, bao gồm các liên kết đến bản đồ điều hướng, Yelp và OpenTable; nó cũng đặt một lời nhắc nhở về việc giặt khô. Nhấn vào liên kết OpenTable đã mở ứng dụng, nhưng ấn tượng hơn là mở nó trực tiếp đến trang của nhà hàng đó.
Ý tưởng là hệ điều hành hiện đã hiểu bối cảnh bạn đang ở đâu và bạn đã làm gì trên phần còn lại của thiết bị. Một ví dụ khác là nếu bạn đang nghe nhạc, bạn chỉ cần giữ phím home và đặt câu hỏi về bài hát. Google Hiện hành sẽ biết bài hát nào đang phát và sau đó có thể trả lời các câu hỏi về bài hát đó.
"Bạn có thể nhận được thông tin ngay lập tức, " Chennapragada nói. "Trong tất cả các ví dụ này, bài báo bạn đang đọc, âm nhạc bạn đang nghe, thông điệp bạn đang trả lời với khóa chính là hiểu ngữ cảnh của thời điểm này. Một khi đã có sự hiểu biết đó, nó có thể cung cấp cho bạn câu trả lời nhanh chóng. cho những câu hỏi nhanh, giúp bạn hoàn thành mọi việc mọi lúc mọi nơi trên điện thoại. "
Apple Stresses Intelligence
Tại bài phát biểu WWDC hôm thứ Hai, Apple đã thảo luận về một số thay đổi sắp tới trong iOS 9, nhưng dẫn đến khái niệm "trí thông minh".
Craig Federighi, phó chủ tịch cấp cao về kỹ thuật phần mềm của Apple, đã nói về việc biến Siri thành "trợ lý chủ động" có thể làm những việc như nhắc nhở bạn về một nhiệm vụ cụ thể hoặc một liên kết cụ thể trong trình duyệt vào một thời điểm cụ thể hoặc khi bạn đến một địa điểm cụ thể . Chẳng hạn, nếu bạn nhận được tin nhắn văn bản về một sự kiện sắp diễn ra, bạn có thể nói với Siri "nhắc tôi về điều này" và nó sẽ hiểu rằng bạn đang đề cập đến sự kiện đó và đặt lời nhắc. Nó có thể làm những việc như tự động thêm lời mời trong tin nhắn văn bản vào lịch của bạn.
Nó có thể nhớ các ứng dụng bạn có xu hướng sử dụng vào một thời điểm cụ thể trong ngày và hiển thị chúng cho bạn trong một biểu tượng đơn giản và bây giờ thêm "thẻ mô tả" cung cấp cho bạn thêm thông tin về kết quả tìm kiếm (có khái niệm tương tự vào các thẻ trong Google Hiện hành).
Và nó nói chung dường như đã được cải thiện. Federighi cho biết Apple đã chứng kiến tỷ lệ lỗi từ giảm 40% so với năm ngoái xuống còn 5%. Và nó thông minh hơn khi xử lý mọi thứ trong chính hệ thống, giờ đây có thể trả lời các truy vấn bằng ngôn ngữ tự nhiên như "cho tôi xem ảnh từ Utah vào tháng 8 năm ngoái".
Thú vị nhất, nó cung cấp một API cho tìm kiếm, để nó có thể tìm thấy nội dung trong các ứng dụng. Ví dụ, ông nói về việc có thể liên kết sâu vào ứng dụng Airbnb để tìm các dịch vụ cho thuê có sẵn trong một khu vực cụ thể; hoặc tìm kiếm thông tin về công thức nấu ăn trong một ứng dụng khác.
Trong một bản demo, anh ta đã cho thấy một màn hình tìm kiếm mới mà bạn có được bằng cách vuốt ngay từ màn hình chính và cách hệ thống đưa ra đề xuất về người mà bạn có thể muốn liên hệ, dựa trên các liên hệ thường xuyên nhất của bạn và về các sự kiện sắp tới. Ông đã chỉ ra làm thế nào nó có thể "liên kết sâu" vào các ứng dụng cụ thể để mang lại cho bạn nhiều thông tin hơn. Các tính năng tương tự đã có sẵn trong Siri.
Một điều Apple nhấn mạnh là quyền riêng tư, với Federighi nói rằng "Chúng tôi có thể mang lại sự thông minh trong suốt trải nghiệm trong iOS 9, nhưng chúng tôi làm điều đó theo cách không ảnh hưởng đến quyền riêng tư của bạn." Trong những gì chắc chắn nghe giống như một cuộc khai thác tại mô hình dựa trên quảng cáo của Google, ông nói rằng Apple không khai thác ảnh, email, ảnh hoặc thông tin trên đám mây của bạn. Ông cho biết tất cả thông tin được thực hiện trên thiết bị và nằm trên thiết bị dưới sự kiểm soát của bạn và khi hệ thống phải gửi thông tin lên đám mây để thực hiện tìm kiếm hoặc tìm kiếm lưu lượng truy cập, nó sẽ ẩn danh mà không có thông tin được chia sẻ với bên thứ ba. "Bạn đang kiểm soát, " ông nói.
Cortana Đi chéo nền tảng
Bạn có thể lập luận rằng Microsoft đã bắt đầu cung cấp nhiều tính năng trợ lý cá nhân với trợ lý Cortana cho Windows Phone. Đó là người đầu tiên trong số ba trợ lý điện thoại lớn cố gắng hành động như một trợ lý thực thụ, về mặt lập lịch nhắc nhở và tích hợp sâu hơn với một số ứng dụng điện thoại.
Cortana là một phần của Windows 10 trên máy tính để bàn và máy tính xách tay. Gần đây nhất, Microsoft đã thông báo rằng một phiên bản Cortana sẽ đến với điện thoại iOS và Android cùng với ứng dụng "Điện thoại đồng hành" kết nối PC của bạn với Cortana, để bạn có thể bắt đầu tác vụ trên một thiết bị và hoàn thành chúng trên một thiết bị khác.
Như Joe Belfiore của Microsoft đã mô tả, "Bạn có thể yêu cầu Cortana nhắc bạn lấy sữa vào lần tới khi bạn ở cửa hàng tạp hóa, và sau đó điện thoại của bạn sẽ thức dậy và kêu lên với lời nhắc. Bạn sẽ có thể theo dõi chuyến bay sử dụng Cortana trên cả điện thoại và PC của bạn và nhận các bản cập nhật trên thiết bị mà bạn đang sử dụng để bạn không bỏ lỡ bất cứ điều gì. "
Phần kết luận
Theo nhiều cách, chúng tôi nghe thấy cả ba công ty cùng nhau di chuyển, đặc biệt là trong các nỗ lực "chủ động". Google và Apple cho biết các công cụ của họ sẽ "chủ động hơn", sử dụng thuật ngữ này để mô tả cách họ muốn các trợ lý cá nhân của họ ít nhất xuất hiện như thể họ có thể dự đoán những gì bạn sẽ tìm kiếm.
Cả ba đều tập trung vào việc kết nối tốt hơn với các ứng dụng khác trên hệ thống của bạn, với Apple và Google thông báo tập trung vào "liên kết sâu". Cụ thể, họ muốn liên kết đến những thứ trong một ứng dụng, chẳng hạn như đi đến màn hình chính xác trong OpenTable để đặt bàn. Tại I / O, phó chủ tịch kỹ thuật của Android Dave Burke đã chỉ ra cách Android M bây giờ có cách tốt hơn để các liên kết đi từ các liên kết trong email hoặc trang web đến đúng nơi trong một ứng dụng, mà không cần màn hình "định hướng" hiện tại.
Kết quả của tất cả những điều này là làm mờ các ranh giới giữa hệ điều hành và các ứng dụng chạy trên nó, để cung cấp trải nghiệm liền mạch hơn và các hệ thống thực sự biết nhiều về bạn.
Tất cả điều đó nên khá hữu ích. Nhưng vì nhiều lý do, tất cả những điều này cũng có thể đáng sợ. Tất cả đều quá dễ dàng để tưởng tượng khả năng lạm dụng dữ liệu, cho dù chỉ là tiếp thị quá nhiệt tình hay vì xâm phạm quyền riêng tư thực sự. Tôi tò mò về cách mỗi công ty sẽ giải quyết vấn đề này. Tôi tự hỏi liệu một trong những lý do Google không gọi dịch vụ của mình là "trợ lý cá nhân" là bởi vì nó nghe có vẻ hơi lạc lõng từ một công ty có mô hình kinh doanh chính được định hướng xoay quanh việc thu thập dữ liệu về mọi người và sử dụng nó để nhắm mục tiêu tốt hơn.
Nó cũng dễ dàng phóng đại khả năng của các hệ thống này. Khái niệm về một cỗ máy biết mọi thứ, mọi thứ đều có thể đáng sợ, nhưng tôi không lo lắng về bất kỳ hệ thống nào trong số những hệ thống này phát triển "AI mạnh" theo nghĩa của Skynet của Kẻ hủy diệt hay 2001: HAL của Odyssey bất cứ lúc nào trong tương lai gần. Như một người tham gia đã nói tại một hội thảo gần đây mà tôi tham dự đã nói, "Hãy suy nghĩ Jarvis chứ không phải HAL". Nói về trí thông minh trong bộ đồ hữu ích được mặc trong các bộ phim Iron Man, trái ngược với cỗ máy giết người từ năm 2001. Trong vài năm tới, câu hỏi sẽ không phải là liệu các hệ thống này có quá thông minh hay không, nhưng liệu chúng có đủ thông minh để thực sự hữu ích hay chúng ta sẽ thấy mình chỉ sử dụng chúng như các giao diện tìm kiếm trên Web.
Tất nhiên, ma quỷ nằm trong các chi tiết và chúng tôi sẽ không thực sự biết bất kỳ hệ thống nào hoạt động tốt như thế nào cho đến khi các phiên bản mới xuất xưởng. Trong khi nhận dạng giọng nói đang được cải thiện, việc mở rộng điều này sang các miền mới gây ra nhiều thách thức hơn. Và tôi không rõ hệ thống sẽ làm tốt như thế nào khi cho phép bạn chọn các dịch vụ bạn muốn sử dụng thay vì mặc định cho các dịch vụ riêng của Apple hoặc của Google.
Nhưng khái niệm tổng thể là rõ ràng và tiện ích có thể là tuyệt vời. Nếu được triển khai chính xác, các dịch vụ như vậy sẽ giúp thiết bị của chúng tôi cảm thấy đơn giản hơn khi sử dụng, thông minh hơn và cá nhân hóa hơn. Họ sẽ có những thách thức và sẽ đưa ra một số lo ngại, nhưng tôi đoán là họ sẽ làm nhiều hơn để thay đổi cách chúng ta tương tác với các thiết bị của mình hơn bất cứ thứ gì kể từ màn hình cảm ứng.