Hệ thống dịch máy là các ứng dụng hoặc dịch vụ trực tuyến sử dụng công nghệ học máy để dịch một lượng lớn văn bản từ và đến bất kỳ ngôn ngữ nào được hỗ trợ của họ. Dịch vụ chuyển văn bản “nguồn” từ một ngôn ngữ sang ngôn ngữ “mục tiêu” khác nhau.
Đang xem: Translator là gì, translator và editor
Mặc dù các khái niệm đằng sau công nghệ dịch máy và các giao diện để sử dụng nó là tương đối đơn giản, khoa học và công nghệ đằng sau nó là vô cùng phức tạp và mang lại cùng một số công nghệ hàng đầu, đặc biệt, Deep Learning ( trí tuệ nhân tạo), dữ liệu lớn, ngôn ngữ học, điện toán đám mây, và các API web.
Kể từ đầu những năm 2010, một công nghệ trí tuệ nhân tạo mới, mạng lưới thần kinh sâu (còn gọi là Deep Learning), đã cho phép công nghệ nhận dạng giọng nói để đạt được một mức độ chất lượng cho phép nhóm Translator của gocnhintangphat.com kết hợp nhận dạng giọng nói với công nghệ dịch văn bản cốt lõi để khởi động một công nghệ dịch tiếng nói mới.
Trong lịch sử, kỹ thuật học máy chính được sử dụng trong ngành công nghiệp là dịch máy thống kê (SMT). SMT sử dụng phân tích thống kê tiên tiến để ước tính các bản dịch tốt nhất có thể cho một từ cho ngữ cảnh của một vài từ. SMT đã được sử dụng từ giữa những năm 2000 bởi tất cả các nhà cung cấp dịch vụ bản dịch lớn, bao gồm cả gocnhintangphat.com.
Sự ra đời của máy thần kinh dịch (NMT) gây ra một sự thay đổi triệt để trong công nghệ dịch thuật, kết quả là bản dịch chất lượng cao hơn nhiều. Công nghệ dịch thuật này bắt đầu triển khai cho người dùng và nhà phát triển trong phần sau của 2016.
Cả hai công nghệ dịch SMT và NMT đều có hai yếu tố chung:
Cả hai đều đòi hỏi một lượng lớn nội dung dịch trước con người (lên đến hàng triệu câu dịch) để đào tạo các hệ thống.Không hoạt động như từ điển song ngữ, Dịch các từ dựa trên một danh sách các bản dịch tiềm năng, nhưng có tính dựa trên bối cảnh của từ được sử dụng trong một câu.
Translator là gì?
Dịch vụ Translator và Speech, một phần của Dịch vụ nhận thức bộ sưu tập các API, là dịch vụ dịch máy từ gocnhintangphat.com.
Translator đã được sử dụng bởi các nhóm gocnhintangphat.com từ 2007 và có sẵn như là một API cho khách hàng từ 2011. Translator được sử dụng rộng rãi trong gocnhintangphat.com. Nó được kết hợp giữa nội địa hóa sản phẩm, hỗ trợ và các nhóm liên lạc trực tuyến (ví dụ: Blog của Windows). Dịch vụ tương tự này cũng có thể truy cập, không mất thêm chi phí, từ trong các sản phẩm gocnhintangphat.com quen thuộc như Bing, Cortana, gocnhintangphat.com cạnh, Office, Sharepoint, Skype, và Yammer.
Translator có thể được sử dụng trong các ứng dụng web hoặc khách hàng trên bất kỳ nền tảng phần cứng và với bất kỳ hệ điều hành để thực hiện dịch ngôn ngữ và các hoạt động khác liên quan đến ngôn ngữ như phát hiện ngôn ngữ, văn bản để nói, hoặc từ điển.
Tận dụng công nghệ REST tiêu chuẩn công nghiệp, nhà phát triển gửi văn bản nguồn (hoặc âm thanh để dịch giọng nói) đến dịch vụ với một thông số cho biết ngôn ngữ đích và dịch vụ gửi lại văn bản đã dịch cho ứng dụng khách hoặc web để dùng.
Dịch vụ Translator là một dịch vụ Azure được lưu trữ trong Trung tâm dữ liệu của gocnhintangphat.com và các lợi ích từ bảo mật, khả năng mở rộng, độ tin cậy và không ngừng khả dụng mà các dịch vụ đám mây khác của gocnhintangphat.com cũng nhận được.
Công nghệ dịch giọng nói dịch thuật được ra mắt vào cuối năm 2014 bắt đầu với Skype Translator và có sẵn dưới dạng API mở cho khách hàng kể từ đầu năm 2016. Nó được tích hợp vào tính năng trực tiếp của gocnhintangphat.com Translator, Skype, phát sóng cuộc họp Skype và các ứng dụng gocnhintangphat.com Translator cho Android và iOS.
Bản dịch giọng nói hiện đã có thông qua gocnhintangphat.com Speech, một bộ dịch vụ có thể tùy chỉnh hoàn toàn để nhận dạng giọng nói, bản dịch giọng nói và tổng hợp giọng nói (chuyển văn bản thành giọng nói).
Việc Translator thực hiện dịch máy thống kê (SMT) được xây dựng trên hơn một thập kỷ nghiên cứu ngôn ngữ tự nhiên tại gocnhintangphat.com. Thay vì viết tay-crafted quy tắc để dịch giữa các ngôn ngữ, Hệ thống dịch thuật hiện đại phương pháp tiếp cận dịch như là một vấn đề của việc học tập các văn bản giữa các ngôn ngữ từ bản dịch hiện tại của con người và tận dụng những tiến bộ gần đây trong thống kê ứng và học máy.
Cái gọi là “song ngữ corpora” hành động như là một hiện đại Rosetta Stone trong tỷ lệ lớn, cung cấp từ, cụm từ, và các bản dịch thành ngữ trong bối cảnh cho nhiều cặp ngôn ngữ và tên miền. Thống kê kỹ thuật mô hình hóa và thuật toán hiệu quả giúp máy tính địa chỉ vấn đề của decipherment (phát hiện các tương ứng giữa nguồn và ngôn ngữ mục tiêu trong các dữ liệu đào tạo) và giải mã (tìm bản dịch tốt nhất của một câu đầu vào mới). Translator kết hợp sức mạnh của các phương pháp thống kê với thông tin ngôn ngữ để sản xuất các mô hình mà khái quát tốt hơn và dẫn đến các bản dịch dễ hiểu hơn.
Bởi vì cách tiếp cận này, mà không dựa vào từ điển hoặc các quy tắc ngữ pháp, nó cung cấp các bản dịch tốt nhất của các cụm từ mà nó có thể sử dụng bối cảnh xung quanh một từ nhất định so với cố gắng để thực hiện các bản dịch từ duy nhất. Đối với bản dịch từ duy nhất, từ điển song ngữ đã được phát triển và có thể truy cập thông qua www.Bing.com/Translator.
Cải tiến liên tục để dịch là quan trọng. Tuy nhiên, cải tiến hiệu suất đã giảm với công nghệ SMT từ giữa năm 2010s. Bằng việc tận dụng quy mô và sức mạnh của gocnhintangphat.com AI siêu máy tính, đặc biệt là gocnhintangphat.com nhận thức Toolkit, Translator bây giờ cung cấp mạng nơ-ron (LSTM) dựa trên bản dịch cho phép một thập kỷ mới của bản dịch cải thiện chất lượng.
Các mô hình mạng nơ-ron có sẵn cho tất cả ngôn ngữ nói thông qua dịch vụ giọng nói trên Azure và API văn bản bằng cách sử dụng ID danh mục ” generalnn “.
Xem thêm: Vuejs: Vuex Là Gì ? Vuex, Có Thể Bạn Chưa Biết
Dịch mạng thần kinh về cơ bản khác nhau về cách chúng được thực hiện so với những cái SMT truyền thống.
Các hoạt hình sau đây mô tả các bước khác nhau thần kinh mạng bản dịch đi qua để dịch một câu. Bởi vì cách tiếp cận này, bản dịch sẽ đưa vào bối cảnh câu đầy đủ, so với chỉ một vài từ trượt cửa sổ mà công nghệ SMT sử dụng và sẽ sản xuất chất lỏng hơn và con người-dịch tìm kiếm bản dịch.
Dựa trên đào tạo mạng nơ-ron, mỗi từ được mã hóa dọc theo một vector 500 kích thước (a) đại diện cho các đặc điểm độc đáo của nó trong một cặp ngôn ngữ cụ thể (ví dụ: tiếng Anh và Trung Quốc). Dựa trên các cặp ngôn ngữ được sử dụng để đào tạo, mạng nơ-ron sẽ tự xác định những gì các kích thước nên được. Họ có thể mã hóa các khái niệm đơn giản như giới (nữ tính, nam tính, trung lập), mức độ lịch sự (tiếng lóng, giản dị, viết, chính thức, vv), loại từ (động từ, danh từ, vv), nhưng cũng có bất kỳ đặc điểm khác không rõ ràng như bắt nguồn từ dữ liệu đào tạo.
Các bước dịch mạng nơ-ron đi qua là như sau:
Mỗi từ, hoặc đặc biệt là vector 500-kích thước đại diện cho nó, đi qua một lớp đầu tiên của “tế bào thần kinh” sẽ mã hóa nó trong một 1000-vector kích thước (b) đại diện cho các từ trong bối cảnh của các từ khác trong câu.Sau khi tất cả các từ đã được mã hóa một lần vào các vector 1000-kích thước, quá trình này được lặp lại một số thời gian, mỗi lớp cho phép tốt hơn tinh chỉnh này 1000-kích thước đại diện của từ trong bối cảnh của câu đầy đủ (trái với SMT công nghệ mà chỉ có thể đi vào xem xét một 3 đến 5 từ cửa sổ)Ma trận đầu ra cuối cùng sau đó được sử dụng bởi các lớp chú ý (tức là một thuật toán phần mềm) sẽ sử dụng cả hai này cuối cùng đầu ra ma trận và đầu ra của các từ đã dịch trước đó để xác định từ nào, từ các câu nguồn, cần được dịch tiếp theo. Nó cũng sẽ sử dụng các tính toán này để có khả năng thả các từ không cần thiết trong ngôn ngữ mục tiêu.Các bộ giải mã (Translation) Layer, Dịch từ được lựa chọn (hoặc cụ thể hơn là 1000-vector kích thước đại diện cho từ này trong bối cảnh của câu đầy đủ) trong tương đương với ngôn ngữ mục tiêu thích hợp nhất của nó. Đầu ra của lớp cuối cùng này (c) sau đó được đưa trở lại vào layer chú ý để tính toán từ tiếp theo từ câu nguồn cần được dịch.
Trong ví dụ mô tả trong hình ảnh động, mô hình theo ngữ cảnh nhận thức 1000 kích thước của “trong“sẽ mã hóa rằng danh từ (House) là một từ nữ tính ở Pháp (La Maison). Điều này sẽ cho phép bản dịch thích hợp cho “trong“được”La“và không”Le“(số ít, Nam) hoặc”Les“(số nhiều) một khi nó đạt đến các bộ giải mã (dịch) lớp.
Thuật toán chú ý cũng sẽ tính toán, dựa trên từ (s) đã dịch trước đó (trong trường hợp này là “trong“), rằng từ tiếp theo cần dịch nên là đối tượng (“House“) và không phải là một tính từ (“Blue“). Trong có thể đạt được điều này bởi vì hệ thống biết rằng tiếng Anh và Pháp đảo ngược trật tự của những từ này trong câu. Nó cũng sẽ tính toán rằng nếu tính từ được “Lớn“thay vì một màu, rằng nó không nên đảo ngược chúng (“ngôi nhà lớn“= >”La Grande Maison“).
Nhờ cách tiếp cận này, đầu ra cuối cùng là, trong hầu hết các trường hợp, thông thạo hơn và gần gũi hơn với bản dịch của con người hơn là bản dịch dựa trên SMT có thể đã từng được.
Translator cũng có khả năng dịch bài phát biểu. Công nghệ này được tiếp xúc trong tính năng trực tiếp Translator (http://Translate.it), các ứng dụng Translator, Skype Translator và cũng ban đầu được thực hiện chỉ có thông qua các tính năng dịch Skype và trong các ứng dụng gocnhintangphat.com Translator trên iOS và Android, chức năng này bây giờ đã có cho các nhà phát triển với phiên bản mới nhất của mở API dựa trên phần còn lại có sẵn trên cổng thông tin Azure.
Mặc dù nó có vẻ giống như một quá trình chuyển tiếp thẳng tại một cái nhìn đầu tiên để xây dựng một công nghệ dịch thuật từ các viên gạch công nghệ hiện có, nó đòi hỏi công việc nhiều hơn chỉ đơn giản là cắm một hiện “truyền thống” con người-to-máy nhận dạng giọng nói động cơ để dịch văn bản hiện có một.
Để đúng dịch các “nguồn” bài phát biểu từ một ngôn ngữ đến một ngôn ngữ “mục tiêu” khác nhau, Hệ thống đi qua một quá trình bốn bước.
Nhận dạng giọng nói, để chuyển đổi âm thanh thành văn bảnTrueText: một công nghệ của gocnhintangphat.com bình thường hóa văn bản để làm cho nó thích hợp hơn cho dịch thuậtDịch thông qua các công cụ dịch văn bản được mô tả ở trên, nhưng trên các mô hình dịch đặc biệt được phát triển cho cuộc nói chuyện thực sự sốngChuyển văn bản thành giọng nói, khi cần thiết, để tạo ra âm thanh dịch.
Nhận dạng giọng nói tự động (ASR)Nhận dạng giọng nói tự động (ASR) được thực hiện bằng cách sử dụng hệ thống mạng nơ-ron (NN) đào tạo về phân tích hàng nghìn giờ phát biểu âm thanh đến. Mô hình này được đào tạo về sự tương tác giữa con người với con người chứ không phải là lệnh con người-to-Machine, sản xuất nhận dạng giọng nói được tối ưu hóa cho các cuộc trò chuyện bình thường. Để đạt được điều này, nhiều dữ liệu hơn là cần thiết cũng như một DNN lớn hơn so với truyền thống của con người-to-máy ASRs.
Tìm hiểu thêm về Bài phát biểu của gocnhintangphat.com cho các dịch vụ văn bản.
Văn bản TrueTextKhi con người trò chuyện với những người khác, chúng tôi không nói một cách hoàn hảo, rõ ràng hoặc gọn gàng như chúng ta thường nghĩ rằng chúng ta làm. Với công nghệ TrueText, văn bản chữ được chuyển thành phản ánh chặt chẽ hơn ý định người dùng bằng cách loại bỏ sự disfluout nói (từ phụ), chẳng hạn như “UM” s, “ah”, “và” s, “như” s, stutters, và repetitions. Văn bản này cũng được thực hiện dễ đọc hơn và có thể dịch được bằng cách thêm câu, dấu câu thích hợp và viết hoa. Để đạt được những kết quả này, chúng tôi đã sử dụng những thập kỷ làm việc về công nghệ ngôn ngữ, chúng tôi phát triển từ Translator để tạo TrueText. Sơ đồ sau đây mô tả, thông qua một ví dụ thực, sự chuyển đổi khác nhau TrueText hoạt động để bình thường hóa văn bản chữ này.
DịchVăn bản sau đó được dịch vào bất kỳ 90 ngôn ngữ và phương ngữ hỗ trợ bởi Translator.
Các bản dịch sử dụng API dịch tiếng nói (như một nhà phát triển) hoặc trong ứng dụng dịch hoặc dịch vụ giọng nói, được hỗ trợ với các bản dịch dựa trên mạng nơ-ron mới nhất cho tất cả các ngôn ngữ Ở đây danh sách đầy đủ). Những mô hình này cũng được xây dựng bằng cách mở rộng các mô hình dịch thuật văn bản hiện tại, chủ yếu là viết, với nhiều văn bản nói-corpora để xây dựng một mô hình tốt hơn cho các loại trò chuyện nói của bản dịch. Các mô hình này cũng có sẵn thông qua danh mục tiêu chuẩn “bài phát biểu” của API dịch văn bản truyền thống.
Đối với bất kỳ ngôn ngữ nào không được hỗ trợ bởi dịch thuật thần kinh, bản dịch SMT truyền thống được thực hiện.
Xem thêm: Dấu Hiệu Nhận Biết Bệnh Tự Kỉ Là Gì, Các Dấu Hiệu Bệnh Tự Kỷ Ở Người Lớn
Văn bản sang giọng nóiNếu ngôn ngữ đích là một trong 18 văn bản thành giọng nói được hỗ trợ Ngôn ngữ, và trường hợp sử dụng yêu cầu đầu ra âm thanh, văn bản sau đó được chuyển đổi thành đầu ra giọng nói bằng cách sử dụng tổng hợp giọng nói. Giai đoạn này được bỏ qua trong tình huống dịch giọng nói sang văn bản.