Trang Chủ Suy nghĩ tiến tới Google đặt cược lớn vào giọng nói, nhận dạng ngữ cảnh

Google đặt cược lớn vào giọng nói, nhận dạng ngữ cảnh

2024

Video: QuÃ¡n massage lá»«a khÃ¡ch vÃ o Äá» cÆ°á»¡ng Äoáº¡t tiá»n (Tháng mười một 2024)

Trong khi nghe về kế hoạch của Google để đưa Android đi khắp mọi nơi vào ngày hôm qua, một điều thực sự nổi bật với tôi là công ty đang trông chờ vào việc nhận diện giọng nói và bối cảnh để đưa sản phẩm của mình đi xa hơn. Cả hai đều là chủ đề mà Google và những người khác đã thảo luận trước đây, nhưng tôi đã bị ấn tượng bởi số lượng sử dụng cụ thể mà Google lên kế hoạch cho các công nghệ này, cả hiện tại và trong tương lai gần. Nó cho thấy rằng công ty đã có những bước tiến lớn trong cả hai lĩnh vực.

Nhận dạng giọng nói đã xuất hiện từ nhiều năm nay và trên điện thoại thông minh, nó đã trở thành một phần không thể thiếu trong trải nghiệm của nhiều trợ lý cá nhân khác nhau, bắt đầu với Siri của Apple, sau đó là Google Now và gần đây nhất là với Cortana của Microsoft.

"Chúng tôi đang xây dựng công cụ nhận dạng giọng nói tiên tiến nhất trên thế giới", Sundar Pichai, VP cao cấp của Google cho Android, Chrome và Ứng dụng, trong bài phát biểu Google I / O của ông hôm qua. Và trong khi những người khác có thể không đồng ý, công ty đã thể hiện rất nhiều bản demo bằng giọng nói trong các trường hợp sử dụng mới.

Đối với Android Auto, công ty đã nói về giọng nói cho phép những thứ như điều hướng, giao tiếp và kiểm soát âm nhạc. Điều này chắc chắn có ý nghĩa trong một thế giới lái xe mất tập trung. Nhận dạng giọng nói trên ô tô không phải là mới - Microsoft và Ford đã giới thiệu hệ thống Ford Sync vào năm 2007 - nhưng việc triển khai của Google có vẻ khá tốt.

Ngoài ra, nhận dạng giọng nói cũng là một phần của thiết bị Android Wear, chẳng hạn như đồng hồ thông minh LG G Watch và Samsung Gear Live sắp ra mắt. Chẳng hạn, Google đã trình diễn phát nhạc hoặc đặt báo thức bằng lệnh thoại. Trên Android TV, Google đã trình diễn cách giọng nói có thể được sử dụng để tìm kiếm video hoặc nội dung liên quan. (Amazon cũng đang quảng cáo một tính năng tương tự trong Fire TV.)

Tuy nhiên, theo nhiều cách, thông điệp theo ngữ cảnh thậm chí còn thú vị hơn.

"Chúng tôi đang làm cho mọi thứ nhận thức theo ngữ cảnh", Pichai nói, nói rằng Google muốn hiểu khi bạn ở nhà, tại văn phòng hoặc đi du lịch, vì nhu cầu thông tin của bạn khác nhau ở mỗi địa điểm. Ở nhà, bạn có thể tập trung vào giải trí, trong khi tại văn phòng, bạn muốn có thông tin liên quan đến công việc. "Chúng tôi muốn mang lại thông tin đúng cho bạn vào đúng thời điểm", ông nói.

Chẳng hạn, David Singleton, giám đốc kỹ thuật Android (bên dưới), đã nói về cách người dùng điện thoại thông minh trung bình kiểm tra điện thoại của mình 125 lần một ngày và sẽ tốt hơn như thế nào nếu đồng hồ Android Wear có thể hiển thị những điều bạn quan tâm, tùy thuộc vào về bối cảnh. Cụ thể, một bản demo đề nghị nhắc nhở người dùng kiểm tra gói hàng khi về nhà; và sau đó hệ thống đã làm điều đó, hiểu khi anh ta đến. Nhìn chung, ông tập trung rất nhiều vào thông tin theo ngữ cảnh, ví dụ, hiển thị những thứ như tình trạng chuyến bay, thẻ lên máy bay và thời tiết cho một khách du lịch. Và ông nói với các nhà phát triển rằng SDK Android Wear mới sẽ cho phép họ xây dựng "các ứng dụng theo ngữ cảnh, dễ nhìn" cho các thiết bị như vậy.

Các ứng dụng mặc tốt nhất đáp ứng với bối cảnh của người dùng, Singleton nói. Chẳng hạn, anh ta đã cho xem bản demo của ứng dụng Eat 24 trên điện thoại ghi nhớ khi bạn đặt bánh pizza trước đó và đề nghị bạn lặp lại đơn hàng cùng lúc một tuần sau đó, với ứng dụng biết địa chỉ nhà của bạn.

Kết hợp các khái niệm về điều khiển giọng nói, ngữ cảnh và kết nối liền mạch giữa điện thoại và thiết bị đeo có thể tạo ra một số tình huống thú vị. Singleton cho biết Google đã thêm một số lệnh thoại vào Android Wear và sẽ bổ sung thêm trong những tháng tới. Chẳng hạn, anh đã trình diễn ứng dụng dịch vụ vận chuyển Lyft trên thiết bị Android Wear, với người dùng chỉ cần nói "gọi cho tôi một chiếc xe hơi" để đặt hàng đến vị trí chính xác của bạn.

Để cung cấp bối cảnh này, Google sẽ cần hiểu rõ hơn bạn đang ở đâu và bạn đang làm gì. Phần lớn thông tin này đã có trên điện thoại thông minh của chúng tôi. Điện thoại ngày nay biết bạn đang ở đâu nhờ GPS và tỷ lệ cược là nếu bạn sử dụng Google Hiện hành, Google đã biết vị trí của nhà và văn phòng của bạn, vì vậy nó có thể cung cấp cho bạn chỉ đường và thời tiết tốt nhất. (Điều này không phải lúc nào cũng hoạt động hoàn hảo ngày hôm nay, nhưng nó đang đi đúng hướng.)

Nhưng Google muốn biết nhiều hơn. Mặc dù nó không xuất hiện trong bài phát biểu hôm qua, nhưng Phòng thí nghiệm Nest của Google (nơi sản xuất máy điều nhiệt và máy dò khói thông minh) gần đây đã công bố một nền tảng dành cho nhà phát triển, sẽ tích hợp thêm thông tin với các sản phẩm khác. Chẳng hạn, Nest đã nói về việc một ban nhạc Jawbone UP24 có thể bảo bộ điều nhiệt của nó làm nóng hoặc làm mát căn phòng dựa trên khi bạn thức dậy; hoặc làm thế nào chiếc xe Mercedes của bạn có thể nói với bộ điều chỉnh nhiệt của bạn, bạn đang đi về nhà. Không khó để tưởng tượng việc tích hợp điều này với Google Hiện hành, có nghĩa là Google sẽ có thể theo dõi tốt hơn liệu bạn có ở nhà hay không và có ý tưởng tốt hơn về lịch trình của bạn. Nest cũng vừa mua lại Dropcam, vì vậy ý tưởng rằng Google thực sự sẽ có máy ảnh trong nhà của bạn không còn xa nữa.

Bây giờ, tất nhiên, tất cả điều này được thực hiện vì lý do cụ thể và để cung cấp cho bạn các dịch vụ cụ thể. Và bạn có quyền "từ chối" phần lớn việc thu thập thông tin, mặc dù ít người trong chúng ta thực sự sẽ làm vì chúng tôi thích các dịch vụ. Nhưng không quá khó để tưởng tượng rằng Google sẽ sử dụng thông tin này để cung cấp các dịch vụ nhận biết ngữ cảnh khác và cuối cùng sử dụng thông tin để cố gắng bán quảng cáo được nhắm mục tiêu nhiều hơn. Rốt cuộc, đó là cách mà công ty tạo ra phần lớn lợi nhuận của mình. Vì vậy, thật dễ dàng để thấy mối quan tâm về quyền riêng tư sẽ chỉ tăng lên khi các công ty cố gắng hiểu rõ hơn về bối cảnh của bạn.

Và Google sẽ không phải là người duy nhất cố gắng thu thập thông tin này. Microsoft từ lâu đã nói về việc muốn hiểu rõ hơn về bối cảnh; và cách mà Xbox One có thể luôn luôn nghe lệnh cũng gây tranh cãi. Tôi hy vọng chúng ta sẽ nghe nhiều hơn về điều này từ Apple.

Nhưng hiểu rõ hơn về bối cảnh và tiếng nói đã là mục tiêu của khoa học máy tính trong một thời gian dài, vì những lý do chính đáng, và thật thú vị khi thấy những công nghệ này phát triển. Mặc dù chúng ta cần phải lo lắng về các vấn đề riêng tư, những công nghệ này mang lại tiềm năng to lớn cho các ứng dụng cá nhân hơn, dễ sử dụng hơn.