Trang Chủ Ý kiến Chén thánh dịch giọng nói, bây giờ trên skype | John c. nỗ lực

Chén thánh dịch giọng nói, bây giờ trên skype | John c. nỗ lực

Video: Chat and Calls from Skype / What's New in Microsoft Teams (Tháng Chín 2024)

Video: Chat and Calls from Skype / What's New in Microsoft Teams (Tháng Chín 2024)
Anonim

Nếu bạn theo dõi cuộc cách mạng máy tính từ khi thành lập bộ vi xử lý, bạn sẽ biết rằng có một số lời hứa ban đầu vẫn chưa được thực hiện.

Một trong số đó là bài phát biểu được dịch nhanh, trong đó bạn nói một thứ gì đó bằng tiếng Anh và nó được lặp lại bằng một ngôn ngữ khác, như tiếng Tây Ban Nha, gần thời gian thực. Mặc dù vẫn đang trong quá trình hoàn thiện, Microsoft hiện đã tiến một bước gần hơn với Skype Translator, giai đoạn đầu tiên được phát hành trong tuần này.

Nếu điều này đến gần với hoạt động và không phải là một trò đùa, thì đó là sản phẩm của thập kỷ. Ngay bây giờ, Skype Translator hỗ trợ các bản dịch từ tiếng Tây Ban Nha sang tiếng Anh và tiếng Anh sang tiếng Tây Ban Nha, nhưng nhiều ngôn ngữ được đặt theo.

Vấn đề điển hình với những thứ này là mức độ khó khăn thái quá. Tôi vẫn chưa thấy một gói dịch tốt mà dịch thuật chuyển văn bản thành văn bản hoạt động tốt. Dịch lời nói có một mức độ khó hoàn toàn khác nhau, đặc biệt là trong thời gian thực.

Microsoft có một bộ phim cho thấy hai đứa trẻ nói tiếng Tây Ban Nha và tiếng Anh khiến nó trông giống như nó hoạt động tốt. Nhưng tôi đã thấy một hệ thống tương tự được IBM trình diễn gần 20 năm trước mà không bao giờ thấy ánh sáng ban ngày. Phiên bản của IBM được phát triển vào những năm 1990, khi có một sự hưng trí nhận dạng giọng nói do Lernout & Hauspie dẫn đầu, một công ty đã phá vỡ vụ án trước khi phá vỡ một vụ bê bối gian lận vào năm 2001. Tuy nhiên, trước đó, nó đã mua mọi công nghệ lời nói công ty có thể, bao gồm Dragon Systems, Berkeley Speech Technologies, Fonix, Dictaphone và các công ty khác. Microsoft đã có 8% cổ phần trong L & H và kết thúc với một số công nghệ như một món quà chia tay phá sản.

Bây giờ Skype Translator đột nhiên xuất hiện. Sự trùng hợp? Dù thế nào đi nữa, toàn bộ công nghệ này đã mất quá nhiều thời gian để đi đến điểm này.

Nhìn vào các bản dịch máy tính từ văn bản thành văn bản khổ sở được thực hiện bởi Google và những người khác. Văn bản không và không thể tránh những lỗi rõ ràng nhất. Không ai trong số này tiếp cận sự phức tạp của dịch giọng nói, đòi hỏi xử lý tín hiệu nặng.

Tôi là một nhà sưu tập rượu vang và thường xuyên truy cập các trang web nhà máy rượu của Pháp. Tiếng Pháp của tôi chỉ ổn, vì vậy tôi thường bật bản dịch để đọc nhanh trang web. Chúng tôi ở đây vào năm 2014 và không ai trong số các dịch giả có thể hiểu rằng bản dịch của Château Margaux là Château Margaux, không phải Castle Margaux. Làm thế nào là khó khăn để kiềm chế và không dịch một từ thường được sử dụng trong một tên thích hợp, chẳng hạn như château, thường đề cập đến một nhà máy rượu cụ thể, vào lâu đài từ? Rõ ràng là không thể. Tất cả đều làm điều đó.

Làm thế nào là khó khăn để viết một số ngoại lệ vào mã nói với người dịch rằng nó là trên một trang web về rượu vang Bordeaux? Trong khi trên trang web đó, từ château không có nghĩa là lâu đài. Thường thì người dịch cũng sẽ cố gắng giải mã phần còn lại của tên château, với kết quả vô lý. Điều tốt nhất bạn thường có thể làm với dịch văn bản là hiểu rõ những gì trang web nói.

Hãy tự hỏi: nếu văn bản quá khó, Microsoft sẽ quản lý lời nói như thế nào?

Nó bên cạnh không thể ngay cả trong cùng một ngôn ngữ. Sử dụng dịch vụ điện thoại Google Voice. Nó có chức năng nhận tin nhắn từ văn bản thành văn bản. Tôi chưa bao giờ nhận được một tin nhắn thoại để thậm chí gần với những gì người thực sự nói. Không chỉ một lần.

Tôi sẽ thừa nhận rằng trong một căn phòng yên tĩnh khi bạn nói chuyện rõ ràng và rõ ràng, nhận dạng giọng nói rất tốt. Tôi sử dụng nó cho tin nhắn văn bản trên điện thoại Android của tôi. Nhưng trong một cuộc trò chuyện thực sự, không ai nói như thế. Tôi ngưỡng mộ Microsoft vì đã đưa ra điều này. Nhưng nó sẽ không hoạt động như quảng cáo.

Điều đó nói rằng, nó ít nhất là một cái gì đó để chơi với. Nó thậm chí có thể kích hoạt một thế hệ nghiên cứu mới. Vì vậy, tôi sẽ không phàn nàn quá nhiều.

Mọi người đều muốn điều này. Hãy quay lại làm việc với nó.

Chén thánh dịch giọng nói, bây giờ trên skype | John c. nỗ lực