Trang Chủ Suy nghĩ tiến tới Các công cụ nhận thức và đàm thoại chiếm vị trí trung tâm tại microsoft build

Các công cụ nhận thức và đàm thoại chiếm vị trí trung tâm tại microsoft build

Video: Google I/O 2019 Highlights (Tháng Chín 2024)

Video: Google I/O 2019 Highlights (Tháng Chín 2024)
Anonim

Điều làm tôi ngạc nhiên nhất tại hội nghị Microsoft Build tuần này là sự nhấn mạnh vào các dịch vụ nhận thức và đàm thoại, khi Microsoft đưa ra tầm nhìn về cách các dịch vụ đó sẽ biến đổi các ứng dụng trong tương lai và cố gắng thuyết phục các nhà phát triển tham gia vào tầm nhìn này . Phần lớn sẽ không rõ ràng đối với người dùng cuối cho đến sau này - các tính năng lớn nhất cho người dùng cuối bây giờ sẽ là những cải tiến cho trợ lý cá nhân Cortana và các tính năng mực mới trong "Phiên bản kỷ niệm" của Windows 10 ra mắt vào mùa hè này. Nhưng việc thúc đẩy để đảm bảo Microsoft theo kịp các đối thủ về học máy, tác nhân thông minh và ứng dụng nhắn tin đang nhắm đến các nhà phát triển hơn, vì công ty đã có các ứng dụng cơ bản nhưng cần một hệ sinh thái để làm cho chúng ấn tượng hơn.

Chủ đề mới lớn nhất được giới thiệu bởi CEO Satya Nadella là "các cuộc hội thoại như một nền tảng" dường như liên quan đến việc đưa các nền tảng đàm thoại - từ Cortana sang Skype sang các ứng dụng của bên thứ ba - và thêm trí thông minh cho chúng. Ý tưởng là để thêm sự hiểu biết, sở thích và đặc biệt là bối cảnh cho các ứng dụng như vậy.

Ông nói có ba diễn viên chính trong các cuộc trò chuyện như vậy: mọi người, trợ lý kỹ thuật số và bot. Về phía người này, anh ấy đã nói về các ứng dụng như Skype Translate, công ty cố gắng kích hoạt các cuộc hội thoại tốt hơn bằng nhiều ngôn ngữ. Một trợ lý kỹ thuật số, ông nói, sẽ biết về bạn trên nhiều thiết bị và có thể giúp đỡ các công việc hàng ngày, chẳng hạn như lên lịch các cuộc hẹn. Bots là những ứng dụng mới mà bạn có thể trò chuyện bằng ngôn ngữ tự nhiên, và anh ấy đã nói về một tầm nhìn mà bạn có thể gọi bot trong một cuộc trò chuyện.

Tất cả điều này đang dẫn đến một nền tảng mới, theo ông, nơi ngôn ngữ của con người trở thành giao diện người dùng, bot trở thành ứng dụng mới và trợ lý kỹ thuật số giống như "ứng dụng meta", như trình duyệt, hiện có một phần để gọi các ứng dụng khác, với tất cả các ứng dụng này bao gồm cả trí thông minh. Ông cho biết đây sẽ là một sự thay đổi lớn về nền tảng như GUI, Web hoặc cảm ứng trên thiết bị di động.

Nadella đã nói về tầm nhìn "không phải con người so với máy móc, mà là con người với máy móc", với những người cung cấp sự đồng cảm, cảm xúc và phán đoán và máy móc cung cấp sức mạnh tính toán. Nhưng ông nói rằng điều quan trọng là phải có "cách tiếp cận nguyên tắc" đối với học máy, và sử dụng nó để tăng cường khả năng và kinh nghiệm của con người, đáng tin cậy (về quyền riêng tư, bảo mật và tuân thủ), bao gồm và tôn trọng.

Về điểm cuối cùng, ông nói rằng điều quan trọng là các ứng dụng đó đại diện cho "thứ tốt nhất của nhân loại, không phải là thứ tồi tệ nhất" và chỉ ra Tay, Microsoft đã thất bại trong việc giới thiệu một bot trò chuyện vào tuần trước, phải gỡ xuống một ngày sau đó khi nó bắt đầu lặp lại những nhận xét công kích. Nadella thừa nhận rằng công ty đã hiểu sai, nói rằng "chúng tôi nhanh chóng nhận ra rằng nó không đúng với nhãn hiệu", nhưng nói rằng công ty sẽ tiếp tục ươm tạo những công nghệ như vậy, lưu ý rằng các bot của họ ở Trung Quốc và Nhật Bản không có vấn đề tương tự .

Trong số các chi tiết mới là Cortana đến với Outlook, vì vậy nó có thể hiểu rõ hơn về thư, danh bạ và lịch của bạn và thực hiện những việc như sắp xếp lại các cuộc hẹn - một ý tưởng tuyệt vời nếu không phải là hoàn toàn mới và có thể đề xuất những điều bạn có thể muốn làm tiếp theo dựa trên lịch, thư hoặc các cuộc hội thoại bạn đã có. Và một phiên bản mới của Skype hiện có thêm hỗ trợ cho Cortana và có thể hỗ trợ các bot trong các cuộc trò chuyện video của nó, để thực hiện những việc như phiên âm các cuộc gọi video ngắn và có thể truy cập được cho tất cả các loại dịch vụ. Microsoft gọi điều này bằng cách sử dụng Skype như một "bức tranh hội thoại." Đây dường như cũng không phải là một ý tưởng mới - những thứ như WeChat và Facebook Messenger đã có bot từ lâu - nhưng nó cho thấy Microsoft đang cố gắng biến điều này thành một nền tảng như thế nào. Nó cũng cho thấy làm thế nào điều này có thể hoạt động đa nền tảng, với trình diễn bắt đầu trên PC Windows và kết thúc bằng Skype trên điện thoại Android.

Nhưng hầu hết các tin tức thực sự dường như là trong các đề xuất mới dành cho các nhà phát triển, với cái được gọi là Cortana Intelligence Suite (trước đây là Cortana Analytics Suite, một ví dụ điển hình về các thuật ngữ đang nóng trong bất kỳ năm nào).

Đây thực sự là một thời gian chạy được xây dựng trên nền tảng Azure bao gồm khung bot, dịch vụ nhận thức và học máy.

Khung bot giúp tạo bot dễ dàng hơn hoặc kết nối một dịch vụ với các dịch vụ khác. Các nhà phát triển có thể tạo những thứ này trong node.js hoặc C # và một bản demo liên quan đến việc tạo một bot đặt hàng pizza từ Domino's. Điều tôi thấy thú vị nhất ở đây là nó có nghĩa là một khung mở, với các bot có thể hoạt động không chỉ trong Cortana và Skype, mà còn cả Slack, Telegram, SMS đơn giản và các dịch vụ khác. Tất nhiên, một số dịch vụ thay thế thú vị nhất không có trong danh sách đó - bao gồm Siri của Apple, Alexa của Amazon hoặc Messenger của Facebook hoặc WhatsApp.

Một bản demo khác cho thấy một số công cụ sắp tới sẽ giúp các nhà phát triển dễ dàng thêm hoặc thay đổi quy tắc cho bot và hiểu biết về ngôn ngữ tự nhiên của họ. Nó có thể gợi ý những từ khác mà mọi người có thể sử dụng có ý nghĩa tương tự, sử dụng hiểu ngôn ngữ tự nhiên dựa trên máy học để cải thiện vốn từ vựng theo thời gian hoặc chuyển yêu cầu cho trợ lý con người nếu bot không hiểu phải làm gì.

Cuối cùng, công ty đã giới thiệu một bộ dịch vụ nhận thức lớn hơn nhiều, chuyển lên 22 dịch vụ khác biệt từ 5 năm ngoái. Các dịch vụ này bao gồm một loạt các kịch bản, bao gồm nhận dạng đối tượng, lời nói, kiến ​​thức và tìm kiếm. Một ví dụ liên quan đến Bot chú thích có thêm chú thích cho ảnh, sử dụng kết hợp nhận dạng đối tượng cộng với ngôn ngữ tự nhiên. Một công cụ khác gọi là CRIS (Dịch vụ thông minh nhận dạng tùy chỉnh) dường như thực hiện công việc chuyển đổi lời nói thành văn bản tốt hơn nhiều so với các phương pháp thông thường. Cuối cùng, họ đã trình diễn bằng cách sử dụng các công cụ để phân tích trên các nguồn cấp dữ liệu Twitter, lấy mẫu ảnh hồ sơ để xác định tuổi và giới tính của người đăng.

Tất nhiên, Microsoft cũng đã công bố một loạt các công cụ khác nhằm vào các nhà phát triển, tạo ra một sự thúc đẩy cụ thể rằng Windows sẽ là nền tảng mà họ sử dụng để phát triển các ứng dụng bất kể nền tảng. Điều đáng ngạc nhiên nhất trong số các công cụ mới này, ít nhất là cho đến khi có tin đồn vào tuần trước là việc bổ sung trình bao BASH từ Linux, nhưng các công cụ khác bao gồm trình chuyển đổi ứng dụng máy tính để bàn để chuyển các ứng dụng máy tính để bàn Win32 truyền thống sang các ứng dụng Universal mới; một cú hích lớn cho các công cụ phát triển chéo Xamarin, cho thấy các nhà phát triển có thể tạo ra cốt lõi của một ứng dụng đa nền tảng và những thay đổi cụ thể cho từng môi trường, bao gồm cả Android và iOS cũng như Windows, trên nền tảng Windows.

Ngoài ra, Microsoft đã trình diễn "chế độ dev", một công cụ để biến Xbox One thành cỗ máy của nền tảng nhà phát triển, được phát hành ngày nay; và cho biết phiên bản đầu tiên của HoloLens cũng có sẵn cho các nhà phát triển bắt đầu từ hôm nay.

Nadella bắt đầu buổi sáng bằng cách nói về việc bây giờ chúng ta đang thấy nhiều cuộc thảo luận về vai trò của công nghệ trong xã hội của chúng ta, bởi vì công nghệ đã trở thành xu hướng và gắn liền với cuộc sống hàng ngày, các công ty và nền kinh tế của chúng ta. Ông nói rằng có những câu hỏi liệu công nghệ có thúc đẩy tăng trưởng kinh tế cho mọi người hay không, hay liệu tăng trưởng kinh tế có bị đình trệ mặc dù chi tiêu cho công nghệ; nếu nó cho phép việc làm hoặc thay thế chúng; và nếu nó được kích hoạt hoặc cản trở các giá trị lâu dài, chẳng hạn như quyền riêng tư.

"Tôi là một người lạc quan", ông nói, tin rằng công nghệ có thể thúc đẩy tăng trưởng kinh tế trên toàn thế giới, có thể trao quyền cho chúng ta trong cuộc sống hàng ngày và có thể hỗ trợ giá trị lâu dài của chúng ta. Để làm điều này, ông nói, chúng ta phải đảm bảo rằng chúng ta sử dụng công nghệ theo những cách cho phép điều này, đưa nó trở lại tuyên bố sứ mệnh hiện tại của Microsoft để "trao quyền cho mọi người và mọi tổ chức trên hành tinh để đạt được nhiều hơn nữa". Điều này, ông nói, phải bắt đầu với các nhà phát triển.

Ông đã kết thúc bài phát biểu bằng một video cho thấy Saqib Shaikh, một nhà phát triển mù tại Microsoft, đã có thể sử dụng các kỹ thuật nhận thức với kính thông minh Pivothead để có được thông tin về thế giới xung quanh. Các ví dụ bao gồm nghe mọi người chơi trong công viên và quẹt kính để nghe đó là một cô gái trẻ đang ném một chiếc dĩa nhựa. Đây chỉ là một dự án nghiên cứu, nhưng nó khá truyền cảm hứng và Nadella đã đưa nhà phát triển lên sân khấu.

Đối với tôi, tôi đã thấy bài phát biểu này là một động thái hướng tới việc thiết lập các nền tảng mới dựa trên học máy và trên bot, cũng như một sự công nhận là thành công như Windows, Microsoft đã không còn thống trị trong đám mây và về cơ bản đã thua trận để trở thành một nền tảng điện thoại di động quan trọng. (Thật vậy, chỉ có một bản demo của toàn bộ bài phát biểu được thực hiện trên Windows Phone và đó là bản demo Skype có thể được thực hiện trên Android một cách dễ dàng.) Không ngạc nhiên, sau đó, Microsoft đang hướng tới nền tảng tiếp theo - nơi, Tất nhiên, nó sẽ phải đối mặt với cả đối thủ truyền thống và đối thủ mới.

Các công cụ nhận thức và đàm thoại chiếm vị trí trung tâm tại microsoft build