Trang Chủ Ý kiến Làm thế nào ai, ml sẽ chuyển đổi lời nói thành văn bản, bản dịch ngôn ngữ | tim bajarin

Làm thế nào ai, ml sẽ chuyển đổi lời nói thành văn bản, bản dịch ngôn ngữ | tim bajarin

Video: Artificial intelligence & algorithms: pros & cons | DW Documentary (AI documentary) (Tháng Chín 2024)

Video: Artificial intelligence & algorithms: pros & cons | DW Documentary (AI documentary) (Tháng Chín 2024)
Anonim

Một trong những bản demo ấn tượng nhất tại Google I / O là Duplex, một trí thông minh nhân tạo đã thực hiện các cuộc gọi đến các địa điểm kinh doanh, trong trường hợp này là một tiệm làm tóc và một nhà hàng để đặt lịch hẹn. Con người ở đầu dây bên kia dường như không phải là người khôn ngoan hơn, và Duplex xử lý các thử thách một cách dễ dàng, như khi nhà hàng nói rằng họ không chấp nhận đặt chỗ cho các bữa tiệc nhỏ.

Thông báo AI đặc biệt này có rất nhiều sự bảo hiểm tại Google I / O, nhưng AI và máy học là phổ biến trong tất cả các sản phẩm và dịch vụ được trình bày tại hội nghị các nhà phát triển. Chỉ cần nhìn vào biểu đồ này, mà Google hiển thị tại một sự kiện phân tích tập trung vào AI một ngày trước khi I / O mở.

Có hai điều khác được thể hiện tại sự kiện đó mà tôi cho là những người thay đổi trò chơi tiềm năng.

Đầu tiên là cách AI được áp dụng vào dịch thuật giọng nói thành văn bản. Mục tiêu là để có được điều này chính xác đến 99 phần trăm bằng cách sử dụng AI và ML trong vài năm tới. Điều đó nói rằng, các bản demo mà họ đưa ra nhận xét vào các ứng dụng G-Suite khác nhau đã khá chính xác. Chúng tôi cũng đã xem bản demo sâu hơn về Smart Compose, trong đó một người viết một câu trong Gmail và Smart Compose viết câu tiếp theo cho bạn dựa trên ngữ cảnh của câu đầu tiên.

Nhiều sản phẩm nhận dạng giọng nói, như Dragon Dictate, đã có mặt trên thị trường trong nhiều năm. Nhưng các chương trình này dựa trên phần mềm bản địa hóa và tận dụng sức mạnh xử lý hiện tại tại mỗi thời điểm phát hành. Các chương trình này đã trở nên tốt hơn trong những năm qua, nhưng nếu bạn quảng cáo AI và ML, tỷ lệ chính xác sẽ bị ràng buộc để trở nên tốt hơn.

Google hiểu tầm quan trọng của lời nói thành văn bản vì nó liên quan đến cuộc sống hàng ngày của chúng ta. Giao diện giọng nói chính xác là rất quan trọng khi trả lời tin nhắn trong khi lái xe. Đó là một cách có ý nghĩa để trả lời email hoặc tin nhắn văn bản trên thiết bị đeo hoặc điện thoại thông minh. Cuối cùng, nó sẽ trở thành một đầu vào có giá trị khi sử dụng kính thực tế hỗn hợp, trong đó sử dụng giọng nói như một phần của quá trình điều hướng và giọng nói thành văn bản là cần thiết cho các loại ứng dụng AR khác nhau.

Thứ hai là cách AI và ML được sử dụng trong Google Dịch, đây sẽ là sự biến đổi thực sự khi các bản dịch diễn ra trong thời gian thực. Là một du khách quốc tế chỉ nói tiếng Anh, loại dịch thuật này sẽ là một ơn trời. Có một số thiết bị cầm tay cố gắng dịch những gì bạn nói sang ngôn ngữ địa phương, nhưng chúng hiện có nhiều hạn chế.

Google để mắt đến loại dịch thuật này, vì vậy thật an toàn khi nói rằng chúng ta có thể thấy một số đột phá thực sự trong việc dịch ngôn ngữ chính xác hơn trên điện thoại Android. Apple cũng có nghiên cứu về AI và ML đang diễn ra xung quanh các khía cạnh khác nhau của dịch thuật giọng nói và văn bản, do đó, cùng với các đối tác tiềm năng, có thể cung cấp giải pháp dịch ngôn ngữ di động trên iOS vào một ngày nào đó.

AI và ML sẽ có tác động mạnh mẽ đến dịch thuật giọng nói thành văn bản và hiệu ứng nổi bật nhất của nó có thể là một phần của giao diện người dùng trong AR và VR hoặc kính thực tế hỗn hợp. Cá nhân, các bản dịch ngôn ngữ làm tôi phấn khích nhất, vì nó sẽ làm cho thế giới của tôi đi lại dễ dàng hơn.

Làm thế nào ai, ml sẽ chuyển đổi lời nói thành văn bản, bản dịch ngôn ngữ | tim bajarin